Le projet

La boîte à outils Pandore a été conçue par les membres de l'équipe-projet ObTIC (SCAI - Sorbonne Université).
Il s'agit d'une interface qui permet d'utiliser en ligne un ensemble d'outils de manipulation et de traitement de corpus textuels. Les tâches couvertes sont les tâches essentielles le plus souvent réalisées dans les études de corpus : la numérisation (OCR/HTR), la conversion entre différents formats de données (notamment XML-TEI), l'analyse automatique du texte (reconnaissance d'entités nommées) et la visualisation des données.

Les fonctionnalités implémentées sont basées soit sur des outils externes donnant des résultats état de l'art dans les tâches concernées, soit sur des scripts ou applications développés par l'équipe ObTIC (Ariane, Tanagra, etc).

L'équipe

Publications