Cette page présente une méthodologie d’identification des différentes communautés qui diffusent de l’information à contenu politique sur Twitter. L’accent est mis ici sur la manière dont l’information circule. Il n’y a pas d’analyse du contenu de ce qui est échangé.

Référence : Gaumont, N., Panahi, M., Chavalarias, D., 2018. Reconstruction of the socio-semantic dynamics of political activist Twitter networks—Method and application to the 2017 French presidential election. PLOS ONE 13.

Voir également notre billet.

Qu‘est-ce qu’un tweet ?

1
2
3
4
1

Contenu du message Twitter (

2

Nombre de réponses à ce message

3

Nombre de fois où ce message a été relayé à l’identique (retweet)

4

Nombre de fois où ce message a été mis en favori.

Un tweet est un message court publié par un utilisateur de Twitter sur son compte. Il peut être vu par toute personne sur le web. Les tweets peuvent être copiés d’un compte utilisateur vers un autre (retweets), commentés ou cités.  Les utilisateurs peuvent s’interpeller directement en mentionnant leurs noms de profil dans un message.

Twitter offre un moteur de recherche qui permet de retrouver n’importe quel tweet.

Figure 1. Représentation de la Twittosphère politique calculée sur la période août 2016 – février 2017. Chaque point est un compte Twitter, un lien entre deux comptes indique des retweets fréquents entre ces comptes. Sur cette figure plus de 96.000 comptes et 357.000 relations sont représentés.

Reconstruire les communautés de circulation d’information sur Twitter

Le but du Politoscope est d’analyser la dynamique des réseaux socio-sémantiques de la tweetosphère politique et médiatique, c’est-à-dire : comment les différents groupes s’organisent pour diffuser de l’information ? Quel type d’information circule ? Comment ces réseaux se reconfigurent en fonction de l’actualité ?

Nous nous intéressons ici à la manière dont l’information est échangée. Plusieurs dimensions peuvent être considérées dans l’identification des communautés de partage d’information sur Twitter : les retweets, les citations, les favoris, les mentions, etc. Cette analyse se concentre sur les relations engendrées par les “retweets sec”, c’est à dire sans altération du contenu.

Détection de communautés

Les communautés politiques autour des candidats ont été définies algorithmiquement via l’analyse de la reproduction de message à l’identique entre comptes Twitter (retweets “secs”).

Nous avons analysé le graphe de retweets politiques entre tous les comptes identifiés par le Politoscope (>1.5M). Ce graphe a été filtré pour ne garder que les comptes qui ont échangé un nombre suffisant de tweets avec un nombre suffisant d’autres comptes. Ce filtre permet d’éliminer la majorité des robots et ne garde que les comptes les plus engagés politiquement.

Nous avons ensuite utilisé un algorithme de détection de communautés (algorithme de Louvain) afin d’identifier des sous-ensembles denses du graphe. Ces ensembles sont des comptes partageant des informations de manière privilégiée avec les autres comptes du même ensemble, ce qui homogénéise les idées qui circulent en leur sein. Ces ensembles définissent nos communautés.

Une communauté autour d’un candidat  ou de son parti est alors définie par le sous-ensemble de comptes Twitter qui partagent des informations similaires au compte Twitter du candidat ou de son parti.

Ce n’est pas une garantie d’adhésion du propriétaire du compte aux idées du candidat. Toutefois la reconstruction de ces “communautés” permet de mettre en avant les structures qui diffusent les idées politiques.

Figure 2. Workflow de détection de communautés de retweet.

Résultats

Les communautés politiques se reconfigurent au gré des alliances et des défections. La détection des communautés dépend donc de la période sur laquelle elles sont calculées. Nous présentons ici le paysage politique de Twitter tel qu’il peut être envisagé lorsque l’on considère la majeure partie de la campagne (août 16 – février 17 pour les images présentées ici). Les relations entre les nœuds (comptes twitter) sont donc des relations “moyennes” sur l’ensemble de cette période.

Pour visualiser leurs relations, nous avons utilisé l’algorithme Force Atlas tel qu’implémenté dans le logiciel Gephi.

Bien que la forme précise du graphe de retweets puisse changer en fonction des paramètres choisis pour le Force Atlas, sa topologie et les relations entre les communautés détectées sont invariantes. Dès lors, la forme générale du graphe est suffisamment caractéristique pour pouvoir donner des indications sur les relations entre les communautés politiques et leur évolution au cours du temps.

On peut ainsi observer sur la figure 1 l’organisation du paysage politique suivant un continuum qui prend la forme de la lettre grecque Pi : un premier axe gauche droite que nous avons positionné horizontalement pour faciliter la lecture, un second axe qui sépare les extrêmes des positions politiques plus modérées. Certaines communautés sont déconnectées de ce graphe, il s’agit de communautés politiques minoritaires qui sont polarisées sur une seule dimension très particulière du débat politique (comme par exemple l’UPR, qui prône le frexit quelque soit le problème posé).

D’autres analyses présentées sur ce site démontrent que cette organisation des communautés reflète effectivement les circuits de diffusion de l’information au niveau global.

  • Twittosphère politique (retweets) août 2016 – février 2017

  • Zoom sur le coeur de la Twittosphère politique (retweets) août 2016 – février 2017. Près de 20.000 comptes font partie du coeur sur cette période. Sont identifiées dans ce coeurs ~246.000 relations “fortes” de retweet (plus de 5 retweet mutuels).

  • Visualisation de l’empreinte de chaque communauté. Lorsque plusieurs candidats sont dans la même communauté, cela signifie que sur la période considérée, ils étaient dans la même sphère informationnelle relativement à la définition choisie de communauté.

  • Visualisation de l’empreinte de chaque communauté. Lorsque plusieurs candidats sont dans la même communauté, cela signifie que sur la période considérée, ils étaient dans la même sphère informationnelle relativement à la définition choisie de communauté.

  • Visualisation de l’empreinte de chaque communauté. Lorsque plusieurs candidats sont dans la même communauté, cela signifie que sur la période considérée, ils étaient dans la même sphère informationnelle relativement à la définition choisie de communauté.

  • Visualisation de l’empreinte de chaque communauté. Lorsque plusieurs candidats sont dans la même communauté, cela signifie que sur la période considérée, ils étaient dans la même sphère informationnelle relativement à la définition choisie de communauté.

  • Visualisation de l’empreinte de chaque communauté. Lorsque plusieurs candidats sont dans la même communauté, cela signifie que sur la période considérée, ils étaient dans la même sphère informationnelle relativement à la définition choisie de communauté.

  • Visualisation de l’empreinte de chaque communauté. Lorsque plusieurs candidats sont dans la même communauté, cela signifie que sur la période considérée, ils étaient dans la même sphère informationnelle relativement à la définition choisie de communauté.

  • Visualisation de l’empreinte de chaque communauté. Lorsque plusieurs candidats sont dans la même communauté, cela signifie que sur la période considérée, ils étaient dans la même sphère informationnelle relativement à la définition choisie de communauté.

  • Visualisation de l’empreinte de chaque communauté. Lorsque plusieurs candidats sont dans la même communauté, cela signifie que sur la période considérée, ils étaient dans la même sphère informationnelle relativement à la définition choisie de communauté.

  • Ombre de la Twittosphère politique (retweets) août 2016 – février 2017 : comptes avec peu de liens forts (~76.000 comptes, soit 79% du total).

2016 - 2023 © Copyright - ISC-PIF / CNRS