Erreur téléversement d'un corpus WoS


(Dauphiné-Morer) #1

Error at parsing. Please create a new corpus. If this error persists then report the bug with this id: 8210409.

Bonjour,

Je commence à travailler avec votre outil, mais je suis bloquée dès la première étape : le téléversement du corpus. Dans un premier temps je souhaiterais téléverser une bibliographie issue du WoS. J’ai suivi l’ensemble des étapes décrites dans votre tutoriel, mais à chaque essai je reçois un message d’erreur “Error at parsing. Please create a new corpus. If this error persists then report the bug with this id: 8210409.”
Pourriez-vous m’aider ?

Merci d’avance !
Anne-Lise


(Alexandre DelAnoe) #2

Bonjour,
oui la version 3 de GarganText actuellement production nécessite des redémarrage récurrent du backend. Je viens de fixer le problème. Est-ce qu’il apparaît à nouveau de votre côté ?


(Dauphiné-Morer) #3

Bonjour,

Effectivement cela a l’air de fonctionner.

Merci pour votre aide !
Cordialement


(Dauphiné-Morer) #4

Bonjour,

Le téléversement n’est pas allé jusqu’au bout. Le message d’erreur qui s’affiche est :
Error in corpus parsing at step 0 (Docs)[“Traceback (most recent call last):”,“File “/srv/env_3-5/lib/python3.5/site-packages/celery/app/trace.py”, line 240, in trace_task\n R = retval = fun(*args, **kwargs)”,“File “/srv/env_3-5/lib/python3.5/site-packages/celery/app/trace.py”, line 438, in protected_call\n return self.run(*args, **kwargs)”,“File “/srv/gargantext/gargantext/util/toolchain/main.py”, line 69, in parse_extract_indexhyperdata\n parse(corpus)”,“File “/srv/gargantext/gargantext/util/toolchain/parsing.py”, line 245, in parse\n raise error”,“File “/srv/gargantext/gargantext/util/toolchain/parsing.py”, line 128, in parse\n for hyperdata in parserbot(resource[“path”]):”,“File “/srv/gargantext/gargantext/util/parsers/_Parser.py”, line 167, in iter\n yield from self.iter(f)”,“File “/srv/gargantext/gargantext/util/parsers/_Parser.py”, line 174, in iter\n for hyperdata in self.parse(file):”,“File “/srv/gargantext/gargantext/util/parsers/ISI.py”, line 48, in parse\n for entry in super().parse(file):”,“File “/srv/gargantext/gargantext/util/parsers/RIS.py”, line 50, in parse\n line = line.decode(“UTF-8”).rstrip(’\r\n’)”,“UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x9d in position 10: invalid start byte”]NaN(bug report here).

Merci d’avance pour votre aide !

Cordialement