le débat hollande-sarkozy du 3 mai analyse sémantique · hollande, les chefs d’etat à...
TRANSCRIPT
Le débat Hollande-Sarkozy du 3 mai Analyse sémantique
Un document réalisé par Proxem
Avant-propos Le discours tenu par un personnage politique est révélateur de sa pensée à plusieurs niveaux :
le choix des termes, des concepts utilisés, la syntaxe employée, sont conjointement étudiés
par les spécialistes du langage pour mieux comprendre ce qui est exprimé. Au-delà du sens
apparent, perceptible à une lecture ordinaire, des disciplines telles que la sémiologie, la
synergologie, la linguistique, etc., étudient le discours verbal et non-verbal pour en extraire
des interprétations complémentaires.
Dans cette perspective, l’analyse sémantique d’un document est une technologie qui permet
d’automatiser une partie de la construction de ces interprétations. Au moyen d’algorithmes
hérités de l’intelligence artificielle, l’analyse sémantique identifie les unités de sens et permet
de visualiser et d’organiser de façon macroscopique le sens général exprimé dans un
document.
Méthodologie Pour la présente analyse, nous avons utilisé la retranscription du débat télévisé du 3 mai
entre François Hollande et Nicolas Sarkozy faite par lemonde.fr.1
Les nuages d’expressions sont générés par nos services aux termes de plusieurs étapes
comprenant notamment une extraction terminologique et l’attribution d’un score de
pertinence à chaque terme (syntagme).
Les graphes de concepts sont quant à eux basés sur la catégorisation Wikipédia : notre outil
identifie les catégories les plus proches sémantiquement des termes employés dans le
document et les représente en suivant le graphe des catégories de Wikipédia.
Toutes les visualisations sont présentées brutes, avec seulement quelques modifications
mineures d’ordre cosmétique facilitant leur lecture.
1 « Sarkozy-Hollande : le compte rendu intégral du débat, thème par thème » (3 mai 2012) : http://www.lemonde.fr/election-presidentielle-2012/article/2012/05/03/sarkozy-hollande-le-compte-rendu-integral-du-debat-theme-par-theme_1694802_1471069.html
Nous suivons le découpage en cinq actes choisi par lemonde.fr.
Vision d’ensemble La visualisation suivante présente, dans leur ensemble, les expressions et concepts les plus
utilisés par chacun des candidats. A l’inverse d’un « nuage de mots-clés » traditionnel, cette
visualisation présente les expressions d’un ou plusieurs mots employées, et valorise, en
même temps que le degré de récurrence, la rareté de chacune. Les termes employés par
François Hollande apparaissent en rose, et ceux de Nicolas Sarkozy en bleu.
Le terme qui saute aux yeux est le terme « France », abondamment utilisé par Nicolas
Sarkozy. Dans sa bouche, le terme prend une dimension quasi-mythologique et désigne tour
à tour le lieu, le pays, l’Etat, et l’ensemble des Français : la France du côté de laquelle on
regarde, la France qui n’a pas connu de récession, etc. François Hollande préfère le terme de
« Français » – un collectif à rapprocher de l’expression « esprit de rassemblement » utilisée
par ailleurs – moins large mais plus inclusif.
L’expression « président de la République » est également très présente dans la bouche des
deux candidats, sans surprise puisque la présidence de la République était l’enjeu du débat.
Dans l’ensemble, le réseau d’expressions est dense et se répartit sur une loi normale où une
minorité d’éléments forts émerge d’une longue traîne moins chargée sémantiquement.
Voyons-les plus précisément.
Le vocabulaire de François Hollande
Les deux termes qui émergent avant tout autre du discours tenu par François Hollande sont,
d’une part, son interlocuteur (« Nicolas Sarkozy ») et d’autre part, l’objet du débat
(« président de la République »). Le discours est donc structuré autour de ces deux termes
qui ne sont pas superposables mais opposés dialectiquement : à l’heure du débat, « président
de la République » qualifie Nicolas Sarkozy, mais c’est précisément ce titre qui est mis en jeu
à travers le débat. Si l’on peut dire, tout l’objet du discours de François Hollande est de faire
dialoguer ces termes, de montrer comment l’un et l’autre se superposent ou non, pendant le
débat et à l’avenir.
Ensuite, deux thématiques se démarquent : le droit de vote [des immigrés] et les
prélèvements libératoires. Notons qu’en récurrence pure, ces thématiques ne sont pas les
plus fréquentes (respectivement 11 et 8 occurrences) mais elles obtiennent des scores
importants en vertu de la prime à la rareté accordée par notre outil aux expressions peu
fréquentes. De fait, ces thématiques (ainsi que, pour la première, les expressions proches
« centres de rétention », « immigration économique », « immigration légale », etc. décrivant
également la question de l’immigration) ont été des points houleux et abondamment discutés
lors du débat. Notons également qu’ils sont chaque fois évoqués avec la même terminologie,
les mêmes mots, d’où leur prééminence dans notre nuage d’expression. D’autres
thématiques, telles que le pouvoir d’achat ou l’énergie renouvelable, sont bien visibles : à
défaut d’être des points cruciaux du programme du candidat Hollande, tous ces sujets ont
largement mobilisé l’opinion – on dira qu’ils sont « à la mode » – et étaient donc très
attendus.
On ne manquera pas de remarquer l’expression « Moi président de la République » qui a
marqué les esprits et se retrouve telle quelle dans notre analyse, signe de sa rareté et de sa
spécificité. Cette reprise anaphorique n’a pas émaillé le débat sur toute sa longueur, mais elle
a été suffisamment présente localement pour apparaître dans cette vision d’ensemble.
Le vocabulaire de Nicolas Sarkozy
Nicolas Sarkozy s’est abondamment adressé à son interlocuteur : « Monsieur Hollande »
apparaît 61 fois. Là où François Hollande parlait de lui-même (« Moi président de la
République »), Nicolas Sarkozy semble quant à lui tourné vers son interlocuteur. Celui-ci est
le centre de gravité de son discours, qui repose sur le fait d’être adressé à un interlocuteur
présent. On peut y voir la traduction sémantique d’une posture de challenger qui n’est plus là
pour parler de lui, se valoriser, se défendre, mais pour réduire l’impact de la présence de celui
qui était déjà annoncé vainqueur. Il est difficile d’interpréter a posteriori de telles données de
façon neutre, mais la prééminence de l’expression « Monsieur Hollande » est telle qu’elle
semble difficilement équivoque.
Cette posture est confirmée par un autre aspect du discours de Nicolas Sarkozy : ce débat
repose sur la candidature à un nouveau mandat, mais il marque aussi la conclusion du
mandat précédent. Cette dimension conclusive est marquée dans son discours qui contient
des éléments de bilan et de synthèse du mandat : ses interlocuteurs sont amenés à porter un
jugement sur les 5 années de présidence de Nicolas Sarkozy. Forme de bilan s’il en est, la
référence à la « Cour des comptes » appelle un bilan chiffré, factuel. Le syntagme
« présidence partisane » formule un jugement synthétique subjectif dudit mandat. La
formule est reprise, martelée par un Nicolas Sarkozy indigné (« Comment osez-vous… ? »)
pour être contestée et réfutée. On retrouve également des thématiques qui furent celle de sa
campagne de 2007 (« heures supplémentaires », « pouvoir d’achat ») et qui confirment l’idée
d’un bilan à la fois synthétique, factuel et thématique.
Enfin, autre élément marquant, la surabondance de l’apposition du titre - « Monsieur » ou
« Madame » - des individus évoqués (« Monsieur Hollande », mais aussi « Monsieur
Mitterrand », « Monsieur Jospin », « Madame Aubry », etc.) Cette apposition n’est pas
systématique – on a au contraire « Jacques Chirac », « le Général de Gaulle » - ce qui laisse
penser qu’elle traduit une distance, physique, de point de vue ou encore de couleur politique
entre Nicolas Sarkozy et la personne citée.
Découpage par acte et graphes de concepts
Graphe de concepts : Acte 1 Dans l’acte 1, chaque candidat exprime ses attentes quant au débat, puis la question de
l’emploi est lancée. On observe chez l’un comme l’autre des généralités (philosophie
politique, morale, rhétorique) ainsi qu’une variété de sujets abordés (précarité, chômage, aide
sociale). Toutefois, les termes centraux chez Hollande sont fortement conceptuels (branche
de la philosophie, philosophie politique, concept sociologique) là où l’on rencontre chez
Sarkozy un duo travail et morale connectés entre eux et au centre du réseau de concepts. On
retrouve ainsi, en plus des catégories de thématiques abordées, le style d’expression et les
concepts de prédilection propres à chacun.
Graphe de concepts : Acte 2 Dans cette partie, la discussion se concentre sur les thématiques économiques et sociales,
avec notamment la question de la TVA sociale, du pouvoir d’achat et du prix de l’essence. Les
catégories invoquées sont relativement symétriques et relèvent surtout de l’économie :
économie du travail, fiscalité, économie de l’OCDE. Le social est présent mais plutôt en demi-
teinte : c’est surtout le vocabulaire économique qui domine.
Graphe de concepts : Acte 3 Cette partie prolonge la discussion économique avec un développement de la question des
finances et de la dette ; il y est question du financement de la création de 60 000 postes
d’enseignants proposée par Hollande. Finance et fiscalité sont effectivement très présents.
C’est toutefois le concept d’économie d’entreprise, en demi-teinte, qui est central chez les
deux candidats. Aussi, comme dans les actes précédents, le travail se retrouve au centre du
discours sarkozyien.
Graphe de concepts : acte 4 Cette quatrième partie est consacrée à la question de l’immigration, des centres de rétention
et du droit de vote des étrangers. Ces thématiques se confirment bien sur notre graphe en
étant à la fois centraux dans les concepts et abondamment cités. A nouveau, le vocabulaire
utilisé est assez symétrique, à une nuance près : la présence chez Hollande de « Sociologie de
l’intégration » et celle chez Sarkozy de « Réfugié » et « Camps de réfugié », ce qui traduit a
priori une approche différente de la question de l’immigration.
Graphe de concepts : acte 5 Cette dernière partie aborde, en guise de conclusion du débat, divers sujets tels que le
nucléaire, la politique étrangère, les institutions. Les graphes sont effectivement bien plus
diffus, et affichent quelques sujets marquants en périphérie : le droit constitutionnel chez
Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement
marqué par rapport au reste du graphe). La politique au sens large est centrale dans les deux
graphes, et l’on voit à nouveau apparaître la trace de la tirade « Moi président de la
République » dans le discours de Hollande. Enfin, on observe une grande diversité de
concepts chez Sarkozy (néologisme en politique, rhétorique, humanitaire, théorie du
complot, etc.) là où le graphe des propos de Hollande s’organise plus nettement en
thématiques regroupant plusieurs concepts : Légion d’honneur, éducation, personnalité
politique.
Conclusion A nouveau, beaucoup de choses peuvent être dites à partir de ce type de visualisation, et il est
difficile de ne pas céder à la tentation de sur-interpréter à la lumière des résultats des
élections présidentielles. On notera tout de même quelques conclusions générales :
- Le discours de François Hollande est plus conceptuel, celui de Nicolas Sarkozy est
plus empirique ;
- Le discours de François Hollande est également plus structuré, s’articulant en grandes
thématiques regroupant des concepts, là où celui de Nicolas Sarkozy est plus varié
voire éclectique ;
- Les valeurs morales sont très présentes chez François Hollande ;
- La notion de travail émaille tout le discours de Nicolas Sarkozy ;
- Le discours de François Hollande est plus centré sur lui-même et sur l’affirmation de
principes, là où le discours de Nicolas Sarkozy parle davantage de son interlocuteur et
des principes qu’il a exprimés.
On peut donc voir, au global, l’opposition entre le discours d’un président sortant, revenant
empirique sur les choses accomplies, et celui d’un candidat formulant des propositions
conceptuelles. L’objet du débat, posé en ces termes, et cette fois à la lumière des résultats, est
donc le bilan du président sortant, et l’annonce, la présentation, en un mot, le programme, du
président à venir.
A propos de Proxem Proxem est le spécialiste français de l’analyse sémantique. Nous aidons les organisations à
améliorer leur performance en mettant en œuvre des technologies sémantiques. Nous
analysons de grandes quantités de textes quelle qu’en soit la source pour y trouver
l’information pertinente pour vous. Proxem a effectué une première levée de fonds début
2011, et est à l’équilibre. Ubiq est commercialisé depuis septembre 2010. Plusieurs clients
nous font déjà confiance dans différents secteurs : distribution (notamment Auchan,
Intermarché et Carrefour), banque, RH, audiovisuel…
Nous contacter :
François-Régis Chaumartin CEO [email protected] +33 1 42 39 18 19 Mobile : +33 6 12 16 59 23 www.proxem.com
Eglantine Schmitt Chargée de communication [email protected] +33 1 42 39 18 19 Twitter : @egschmitt www.proxem.com