Cartographie des thèmes des débats


(David Chavalarias) #1
  • Qui : CNRS/Institut des Systèmes Complexes de Paris Ile-de-France & CAMS/EHESS (David Chavalarias, Maziyar Panahi, Quentin Lobbé, Alexandre Delanoé)
  • Méthodes : Text-mining, analyse du graphe de termes (co-word analysis avec mesure de proximité distributionnelle ou mesure dite de confidence), visualisation interactive. Croisement de plusieurs sources de données : contributions aux différents sites & tweets,
  • Exemple antérieur : Tweetoscope climatique, exploration des programmes de la présidentielle
  • Résultats externes que nous pourrions réutiliser :
    • différents types d’extraction terminologique et de groupement de termes,
    • Corpus provenant des différents sites de débat
  • Résultats prévisionnels et réutilisables :
    • carte interactive,
    • extraction terminologique
  • Exemple d’analyses complémentaires / pouvant s’articuler à :
    • outils d’analyse de sentiments sur les sous corpus identifiés dans la carte et les thèmes (générée à la volée en fonction des requêtes dans la carte),
    • détection d’entités nommées et statistiques par thème,
    • tout type de métrique sur un sous corpus qui pourrait être reprojetée sur la carte

(David Chavalarias) #2

Résultat préliminaire : cartographie des mots clés des propositions au site Le Grand Débat (première archive) organisés avec une mesure de confidence et force atlas. Il y a encore du ménage à faire mais on commence à voir des choses. On envoie les sources prochainement.

@mpanahi et David


(David Chavalarias) #3

on rafine les cartes …


(David Chavalarias) #4

Bonjour,

Pour info, nous avons fait un point grand public methodo sur nos premiers travaux sur https://politoscope.org/2019/03/gdn-preliminaires

Il n’y a pas pour le moment de commentaire scientifique de ces premiers travaux, ceci demandera un peu plus de temps et d’analyses.