Reconstruire les communautés de circulation d’information sur Twitter
Le but du Politoscope est d’analyser la dynamique des réseaux socio-sémantiques de la tweetosphère politique et médiatique, c’est-à-dire : comment les différents groupes s’organisent pour diffuser de l’information ? Quel type d’information circule ? Comment ces réseaux se reconfigurent en fonction de l’actualité ?
Nous nous intéressons ici à la manière dont l’information est échangée. Plusieurs dimensions peuvent être considérées dans l’identification des communautés de partage d’information sur Twitter : les retweets, les citations, les favoris, les mentions, etc. Cette analyse se concentre sur les relations engendrées par les “retweets sec”, c’est à dire sans altération du contenu.
Détection de communautés
Les communautés politiques autour des candidats ont été définies algorithmiquement via l’analyse de la reproduction de message à l’identique entre comptes Twitter (retweets “secs”).
Nous avons analysé le graphe de retweets politiques entre tous les comptes identifiés par le Politoscope (>1.5M). Ce graphe a été filtré pour ne garder que les comptes qui ont échangé un nombre suffisant de tweets avec un nombre suffisant d’autres comptes. Ce filtre permet d’éliminer la majorité des robots et ne garde que les comptes les plus engagés politiquement.
Nous avons ensuite utilisé un algorithme de détection de communautés (algorithme de Louvain) afin d’identifier des sous-ensembles denses du graphe. Ces ensembles sont des comptes partageant des informations de manière privilégiée avec les autres comptes du même ensemble, ce qui homogénéise les idées qui circulent en leur sein. Ces ensembles définissent nos communautés.
Une communauté autour d’un candidat ou de son parti est alors définie par le sous-ensemble de comptes Twitter qui partagent des informations similaires au compte Twitter du candidat ou de son parti.
Ce n’est pas une garantie d’adhésion du propriétaire du compte aux idées du candidat. Toutefois la reconstruction de ces “communautés” permet de mettre en avant les structures qui diffusent les idées politiques.
Résultats
Les communautés politiques se reconfigurent au gré des alliances et des défections. La détection des communautés dépend donc de la période sur laquelle elles sont calculées. Nous présentons ici le paysage politique de Twitter tel qu’il peut être envisagé lorsque l’on considère la majeure partie de la campagne (août 16 – février 17 pour les images présentées ici). Les relations entre les nœuds (comptes twitter) sont donc des relations “moyennes” sur l’ensemble de cette période.
Pour visualiser leurs relations, nous avons utilisé l’algorithme Force Atlas tel qu’implémenté dans le logiciel Gephi.
Bien que la forme précise du graphe de retweets puisse changer en fonction des paramètres choisis pour le Force Atlas, sa topologie et les relations entre les communautés détectées sont invariantes. Dès lors, la forme générale du graphe est suffisamment caractéristique pour pouvoir donner des indications sur les relations entre les communautés politiques et leur évolution au cours du temps.
On peut ainsi observer sur la figure 1 l’organisation du paysage politique suivant un continuum qui prend la forme de la lettre grecque Pi : un premier axe gauche droite que nous avons positionné horizontalement pour faciliter la lecture, un second axe qui sépare les extrêmes des positions politiques plus modérées. Certaines communautés sont déconnectées de ce graphe, il s’agit de communautés politiques minoritaires qui sont polarisées sur une seule dimension très particulière du débat politique (comme par exemple l’UPR, qui prône le frexit quelque soit le problème posé).
D’autres analyses présentées sur ce site démontrent que cette organisation des communautés reflète effectivement les circuits de diffusion de l’information au niveau global.