Parse error (Failed reading: conversion error: no field named "Title")


(Belvèze) #1

Bonjour,

J’ai essayé de charger un corpus provenant d’Europresse en CSV en utilisant les entêtes définis dans la doc (Authors, Publication year, Publication Month, Publication Day, etc.)
Cependant, j’obtiens un message d’erreur commençant par parse error (Failed reading: conversion error: no field named “Title”) at at “Plan anti-fraudes sociales : Gabriel Attal veut ““renforcer les sanctions”” contre les fraudeurs”;V (truncated)
La valeur Plan anti-fraudes sociales : Gabriel Attal veut "“renforcer les sanctions” correspond au premier titre de la liste, si on supprime celui-ci, c’est le titre suivant qui génère une erreur.
Ma liste comporte 247 enregistrements : europresse_fraude_sociale.csv
Pourriez-vous s’il vous plaît m’indiquer comment procéder pour charger ce corpus ? Quelles modificatons doivent-elles être faites pour régler cela dans le CSV ?

En vous remerciant par avance,

Damien Belvèze


(Mylène Leitzelman) #3

Bonjour Damien,

J’ai pu regarder votre fichier csv, il y a en effet des caractères spéciaux qui doivent gêner l’import dans Gargantext. Avez vous bien enregistré votre fichier en UTF8 ? autre chose, il faut lancer aussi une recherche des sauts de ligne " \n" (en expression régulière) et les supprimer (dans votre fichier in n’y en a pas). Voici le fichier un peu modifié, j’ai testé dans mon espace Gargantext ça marche voici le fichier : europresse_fraude_sociale.csv (68.0 KB)


(Anne Laure Thomas Derepas) #4

Bonjour

Merci @MyLeitz pour l’aide si rapide :slight_smile:
@belveze je suis preneuse de votre CSV par mail. Nous sommes en train de développer un petit utilitaire de test des CSV qui expliciterait les pb et meme les corrigerait automatiquement et du coup je ne préfère pas l’ouvrir dans un outil depuis ici pour ne pas induire de traitements par ex par excel ou autre.
Merci d’avance et bel été à tous

Anne-Laure