Question sur les terms et les graphs


(THON) #1

Bonjour l’équipe Gargantext !
Suite à la super formation de février (merci Anne-Laure), je commence quelques tests et je me pose une question. Lorsque l’on constitue un corpus à partir d’une requête dans une base (HAL par exemple) à partir d’un mot-clef, il est logique que ce “mot-clef” apparaisse dans les “terms” mais si j’ai bien compris, les “docs” extraits sont les abstracts de HAL dans lesquels le “mot-clef” apparaît. Donc, normalement, le “mot-clef” devrait figurer dans tous les docs, non ? Or, ce n’est pas le cas.
Merci pour vos explications, il doit y avoir quelque chose qui m’échappe.
bonne journée
Raphaël


(Anne Laure Thomas Derepas) #2

Bonjour Raphael

Merci de ton retour quant à la formation, ca fait toujours chaud au coeur…
En fait on a je pense un petit biais dans la requete, si l’auteur a mis un terme dans les “keyword” de son article mais pas dans le titre ni dans l’abstract nous on ne va pas le voir alors que l’API va nous le remonter… C’est d’ailleurs interessant intellectuellement qu’un auteur considère un mot clef comme crucial sans le mettre dans le titre ni dans l’abstract… Mais c’est une autre question

En fait l’API de HAL nous remonte des informations qui pour l’instant sont prises comme elles remontent sans analyse complémentaire, ca s’avèrera peut etre utile… ou pas…
Mais c’est interessant d’avoir ton feedback quant à ces articles.
Je me permets une précision complémentaire au cas où tu te poses la question (c’est valable pour toutes les API… nous on considère les documents comme différents si l’un des champs du CSV est différent, sinon pour nous c’est le meme document… Cela peut générer des différences en termes de nombre de documents si on interroge directement ou pas)

Bon courage en tous cas
A bientôt
Anne-Laure


(THON) #3

Bonjour Anne-Laure,

Merci pour ces précisions, je comprends donc l’importance des bases de mot-clefs. Pour l’import de csv, je verrai plus tard :wink: . J’ai une autre question sur l’interprétation des graphes. Ci-dessous, une copie d’écran d’un graph que j’ai construit sur lequel j’ai bien affiné les terms. Le terme “concurrence fiscale” semble être relié à 4 termes mais on ne voit aucune liaison sur le graph… Merci par avance pour tes éclaircissements.
!


bonne journée
Raphaël


(Anne Laure Thomas Derepas) #4

Bonjour @Raphael, toutes mes excuses pour le délai de réponse.

Nous avons identifié un bug qui effectivement rendait la compréhension difficile car une erreur sur les related terms faisait que ceux affichés n’étaient pas les bons. Il se peut que vous ayez à relancer tous les calculs (fleur > doc puis terms puis graph), nous espérons que la correction impactera les corpus existants -ou a déjà impacté si tu as retravaillé dessus depuis.

Cordialement

Anne-Laure