Jean Véronis - Technologies du langage
|
Technologies du Langage |
Législatives: Carte de France de la (non)-parité
Je me suis amusé à analyser la liste des 6611 candidats aux législatives diffusée par le ministère de l'Intérieur. On a largement dit dans la presse que 2646 de ces candidats sont des candidates, soit 40,0%. En comptabilisant les civilités, M. ou Mme, j'ai réalisé une carte de la parité par département (cliquer pour agrandir) :Douze départements sont particulièrement vertueux et atteignent ou dépassent la parité, la palme revenant à l'Ariège, avec 60,0% de femmes candidates :A l'inverse, on trouve quelques cancres... L'Outremer ne brille pas par son féminisme. A Wallis-e
Lire l'article
|
Législatives: Philippe et Catherine, les prénoms des candidats
J'ai publié hier la carte de la non-parité dans les candidatures pour les législatives. Voici aujourd'hui une étude des prénoms des candidats. Les grands gagnants sont Philippe et Catherine :Ces prénoms nous disent des choses. En croisant avec les données de l'INSEE, on voit que Philippe et Catherine ont eu leur pic de popularité en 1963. On peut faire de même avec les prénoms les plus fréquents, Michel, Alain, Isabelle, Anne et les autres, et on a à peu près la même image : le candidat-député français tourne autour de la cinquantaine... Quant à l'origine culturelle des pré
Lire l'article
|
Appli: France 2012 - Législatives
Vous avez peut-être téléchargé l'application France 2012 pour iPad et smartphones, que nous avons réalisée pour Radio France et l'AFP avec mes amis Benoît Raphaël, le graphiste Julien Tauvel et l'équipe Revsquare à New York (Benoît l'avait décrite ici). Attention, Véronis inside® ;-) Ce sont mes algorithmes qui sont à l'oeuvre pour tout le "backoffice", c'est-à-dire la détection des termes et entités nommées (personnes, lieux, partis et autres), le "clustering" (groupage des news sur le même sujet) et la catégorisation, l'analyse du buzz sur les réseau
Lire l'article
|
Présidentielle: La présence des candidats sur le Web entre les deux tours
Juste avant le premier tour, j'avais montré (ici), grâce à ma plate forme qui analyse en temps réel plusieurs milliers de sources (médias et blogs), que les volumes de citations sur le Web reflétaient d'assez près les mouvements d'opinion. Il faut bien sûr prendre tout cela avec prudence, car nous manquons d'études et de recul, mais on y voyait en particulier juste avant le premier tour, les trois tendances que les instituts de sondage n'avaient pas très bien estimées : le tassement de Jean-Luc Mélenchon, la percée de Marine Le Pen et une remontée assez franche de François Holla
Lire l'article
|
Débat: Moi, François Hollande
Tous les commentateurs ont relevé la tirade finale de François Hollande lors du débat qui l'opposait à Nicolas Sarkozy : Moi, président de la République... Répétée 15 fois. Une belle anaphore, figure chère à la plume de Nicolas Sarkozy, Henri Guaino, dont elle a été en quelque sorte la marque de fabrique en 2007 (voir étude ici et ici). Au-delà de cet écho, dont on ne saura jamais s'il était un clin d'oeil ironique, l'affirmation du moi chez le candidat socialiste, présenté souvent comme consensuel et rassembleur, voire « mou », a pu surprendre.Je me suis livré à une ana
Lire l'article
|
Google: Fichier juif ?
Avant-hier, TF1 a perturbé ma sieste dominicale en m'envoyant une équipe pour recueillir quelques mots pour le JT de 20h sur l'affaire du « fichier juif » de Google... Une séquence de fin de JT n'est pas un format qui se prête beaucoup à l'élaboration, et je me suis dit que je pourrais essayer de rassembler ici mes réfléxions sur le sujet. Je pense que tout le monde a désormais entendu parler de l'affaire. Plusieurs associations, SOS Racisme, le MRAP, l'UEJF et l'AIPJ, ont assigné Google en référé demain 2 mai pour « trouble manifestement illicite », estima
Lire l'article
|
Présidentielle: Le Web a fait mieux que les sondeurs
Je constatais vendredi le tassement de Mélenchon dans les volumes de news, la percée de François Hollande et celle de Marine Le Pen, et je concluais par une double question : "Alors, vague rose ? vague bleu marine ? Nous verrons bien dimanche". Nous avons vu. Le Web a fait mieux que les sondeurs, qui n'avaient pas vu venir le remplacement de Mélenchon par Le Pen, et qui donnaient Hollande et Sarkozy plutôt au coude à coude. Ce serait intéressant d'avoir les chiffres bruts des sondeurs, car, comme l'on sait, ils se livrent à des redressements (indispensables étant donné les tailles tr
Lire l'article
|
Présidentielle: La présence des candidats sur le Web
A la veille de la trêve pré-électorale, je crois que c'est le moment de publier quelques données extraites de ma plateforme d'observation qui analyse quotidiennement plusieurs milliers de sources d'actualité sur le Web. Je ne sais d'ailleurs pas si demain cela ne pourrait pas être considéré comme un sondage (et je n'ai pas 75000 euros de côté pour le cas où !)... Voici donc le volume de citations des principaux candidats depuis fin septembre que j'ai pu relever sur les principaux médias et blogs francophones, cumulé par semaine :On voit qu'à part les pics not
Lire l'article
|
Vincennes: La panne de tweets était bien réelle
J'ai reçu un certain nombre de mails et de commentaires après mon billet d'hier, et Vincent Feltesse, le directeur de la campagne numérique de François Hollande vient de me le confirmer : il y a bien eu panne de tweets à Vincennes pendant le meeting du candidat PS ? mes outils n'avaient pas rêvé. Mais cette panne n'était pas due à la fatigue des équipes (qui semblent plutôt gonflées à bloc si j'en juge par les réactions...), mais à des difficultés techniques : absence de couverture réseau, pas de 3G et même les téléphones ne passaient pas. De nombreux témoignages le conf
Lire l'article
|
Campagne: Hollande en panne de tweets ?
Beaucoup d'yeux étaient braqués sur la place de la Concorde et le Château de Vincennes aujourd'hui... Les miens étaient rivés sur Twitter, et maintenant que la poussière retombe, que les obscurs et sans-grades démontent les échafaudages et ramassent les poubelles, je vous livre une observation qui m'a intrigué. On a dit que la campagne se jouait aussi beaucoup sur Internet cette fois-ci, et les équipes ont mis en place des cellules dédiées au twittage et retwittage intensif. Mais aujourd'hui, celle du PS était peut-être un peu fatiguée (la campagne a été longue, primaires
Lire l'article
|
Orange: Présidentielle et requêtes des internautes
Les moteurs de recherche constituent un observatoire sociologique tout à fait fascinant, j'ai déjà eu l'occasion d'en parler sur ce blog, pour le meilleur et pour le pire. Sagesse (ou folie) des foules : la masse des requêtes permet par exemple de déclencher des alertes épidémiologiques de façon aussi réactive que les autorités sanitaires (voir par exemple "Google Grippe"). J'ai eu l'opportunité de me pencher sur les logs de requêtes du Moteur d'Orange (que je remercie au passage pour m?avoir autorisé à publier cette étude). Certes, le volume est moins important que
Lire l'article
|
Sarkozy: Je revient
A l'occasion de la mise à jour de l'Observatoire des discours que nous avons réalisé avec Linfluence pour Le Monde, je vous invite à lire sur le blog Politicosphere la petite analyse du je dans les discours de Nicolas Sarkozy depuis 2004 :Ne vous frottez pas les yeux, vous avez bien lu et ce n'est pas une faute d'accord. L'italique est importante : je veux vous parler de l'usage du pronom je chez Nicolas Sarkozy. Depuis la campagne 2007, on a beaucoup glosé sur son usage intensif de ce pronom. Le discours de la Porte de Versailles, le 14 janvier 2007 était de ce point de vue un cas
Lire l'article
|
Sarkozy: Ce soir y a-t-il de la lumière ?
J'ai été surpris par la formule « Aidez-moi » dans la bouche de Nicolas Sarkozy à Villepinte cet après-midi. Il est vrai qu'il l'avait déjà utilisée à Marseille le 19 février, mais elle est assez paradoxale de la part du candidat-président, puisque lui-même ou son parti ont depuis 10 ans tous les pouvoirs, y compris les deux chambres jusqu'au basculement récent du Sénat. Pourquoi et par qui devraient-ils être aidés ? La formule avait été utilisée en 2006 et 2007 par Ségolène Royal, mais celle-ci avait effectivement besoin d'aide : elle était opposante
Lire l'article
|
Outil: Observatoire des discours 2012
Vous avez été nombreux à me demander si je préparais quelque outil pour la campagne actuelle, comme je l'avais fait en 2007. Eh bien oui : je me suis associé à Linkfluence pour produire un Observatoire des discours, hébergé par LeMonde.fr. Plus exactement, ce sont trois observatoires que nous avons réalisés :l?observatoire des discours 2012, pour le suivi de la campagne en cours et des idées des candidats ;l?observatoire des discours 2007, qui permet comparer les thématiques de la campagne actuelle avec celles de la campagne précédentel?observatoire des discours de Nic
Lire l'article
|
Sarkozy: Jamais prononcé "TVA sociale" ?
Le chef de l'Etat nous expliquait hier que le mot TVA sociale « n'avait aucun sens ». « Jamais vous ne m'avez entendu le prononcer », ajoutait-il.Pas de chance, les mots laissent désormais des traces. Nicolas Sarkozy en parlait dès juin 2006 dans son discours d'Agen, qu'il a repris à peu près dans les mêmes termes en Indre-et-Loire, en juillet de la même année.C'est devenu un vrai thème de campagne avec la conférence de presse du 2 avril 2007 ("Je veux taxer la pollution et expérimenter la TVA sociale", nous disait-il, propos réitérés dans différents discours l
Lire l'article
|
Sarkozy: Le rêve désenchanté
La droite s'est beaucoup moqué du « rêve français » que François Hollande veut réenchanter. Les caciques de l'UMP se sont succédé sur les plateaux pour nous expliquer que la politique, ce n'est pas la promesse de rêve, mais le sens des réalités, dont le champion serait le président Sarkozy, comme l'explique Jean-François Copé (qui bien sûr ne pratique jamais la langue de bois) :« [Nicolas Sarkozy] n?a occulté aucune difficulté, aucun tabou. Il a dit les choses telles qu?elles sont et non le sentiment d?un rêve »« Il ne ré-enchante pas le rêve mais éclaire le
Lire l'article
|
Twitter: Le match Sarkozy-Hollande, suite
Je continue mes analyses du buzz des deux principaux présidentiables sur Twitter. J'avais montré il y a quelque temps que Nicolas Sarkozy et l'UMP peinaient à sortir du trou noir dans lequel les avait plongés la primaire socialiste (voir ici). Evidemment, la naissance de la petite Giulia, puis les événements majeurs sur la scène européenne (Sarkozy-Merkel) et sur la scène mondiale (présidence du G20), ont été favorables ces derniers temps à Nicolas Sarkozy. On note sur le diagramme ci-dessous les différents pics correspondant aux éléments de cette séquence (tweets en langue fr
Lire l'article
|
Twitter: Coup d'état militaire évité en Grèce ?
Les médias français ne s'en sont pas à ma connaissance fait l'écho pour l'instant mais un événement majeur vient de se produire en Grèce, en dehors de la question du référendum. Le pays a peut-être échappé à un coup d'état miliaire. En tout cas, le ministre de la Défense, Panos Beglitis, a limogé les chefs d'état major des différentes armes, ce qui n'est pas exactement banal. La nouvelle était annoncée hier soir (voir en anglais sur AthensNews ou en grec sur Eleftherotypia).Twitter (en grec) commence à se faire largement l'écho de cet événement (suivre ici par exem
Lire l'article
|
Buzz: L'UMP peine à sortir du trou noir
On se souvient des interventions frustrées de Jean-François Copé et quelques autres dignitaires de l'UMP sur les plateaux télé à la fin de la primaire socialiste. Ils disaient avoir hâte que la page soit tournée, pour pouvoir occuper à leur tour le terrain. Tous semblaient déjà sur les starting blocks, et prêts, disaient-ils, à déclencher le feu atomique le candidat socialiste aussitôt désigné.J'ai mesuré sur les 30 derniers jours les apparitions des termes PS et UMP sur le réseau social Twitter (tweets francophones uniquement). On voit bien sur le diagramme ci-dessous qu'il
Lire l'article
|
Buzz: Analyse en temps réel d'un "bad buzz" (Cora)
Si vous suivez un peu l'actualité, vous avez sans doute vu passer cette affaire proprement scandaleuse d'une employée de l'hypermarché Cora de Mondelange en Moselle, menacée de licenciement pour avoir ramassé un ticket de réduction à 1? pour un hamburger laissé par un cliente... Après une vague de protestation immédiate et violente sur Twitter, la société annonce ce matin qu'elle renonce à la procédure.On fantasme beaucoup sur l'effet (ou pas) du buzz, bon ou mauvais, sur Twitter ? et plus largement du pouvoir des internautes. Dans ce cas précis, ce pouvoir est indéniable,
Lire l'article
|
Signaler un abus à propos du Blog Jean Véronis - Technologies du langage
|