Bonjour à tous,
Comme indiqué il y a quelques semaines, nous avons profité de la période estivale pour demander à des étudiants de développer des petits scripts dans des langages courants pour faciliter l’interaction, et notamment la création de corpus, pour travailler dans GarganText.
L’idée de ce premier jet est de permettre à la communauté de partager ses scripts et de faciliter leur mise à disposition pour un usage large. Par contre, nous comptons sur ceux qui savent coder pour nous aider à maintenir, enrichir…
- pour ceux qui ne savent pas développer : un site un peu drag & drop
- pour ceux qui savent développer : un gitlab avec toutes les sources
Nous avons essayé de récupérer les transcripts youtube a partir d’une liste de vidéo, mais dans la façon dont nous nous y sommes pris nous avons été bannis régulièrement en ayant récupéré trop peu de transcripts pour que cela soit utile. Néanmoins le code est sur le Git si certains d’entre vous ont des idées pour améliorer et rendre viable cette idée.
En espérant que ce travail vous sera utile, il reste des difficultés, des fautes d’orthographe donc n’hésitez pas à remonter vos éventuelles difficultés et si certains se sentent de corriger, allez-y !
Merci d’avance et au plaisir de voir vos usages facilités
Anne-Laure