Épiméthée

Cette chaîne de traitement permet d'analyser les entités nommées de lieu dans un texte (numérisé ou non) et de cartographier ces lieux. Cette chaîne se base sur les trois outils suivants:

  • Tesseract
  • SpaCy
  • geopy

Formats possibles pour les fichiers à OCRiser : PNG, JPG, TIFF, PDF.

Formats possibles pour les textes bruts : TXT.

La chaîne de traitement peut prendre un certain temps en fonction de la taille des fichiers et du nombre de fichiers à traiter. La carte générée nécessite de télécharger les emplacements des entités nommées de lieu pour être affichée.

Tesseract
Configuration NER
Configuration outil 1

Configuration outil 2

Entrée

Traitement en cours...