TEI-CORPO

Outil de conversion de Elan, Clan, Transcriber et Praat vers la TEI et vice-versa

Java library and Swing user interface

Les conversions peuvent être faites en ligne à cette adresse sans passer par l'interface de commande : http://ct3.ortolang.fr/teiconvert/

L'outil Java de conversion de formats (TEI_CORPO, CLAN, ELAN, Transcriber, Praat) peut être téléchargé ici : teicorpo.jar

Attention : il faut avoir installé Java sur son ordinateur pour exécuter les commandes : Télécharger Java

Le code source du programme est disponible dans https://github.com/christopheparisse/teicorpo Le site github ne contient que les fichiers sources du projet.

Utilisation de l'outil de conversion en ligne de commande

L'outil est utilisable en ligne de commande. Il existe plusieurs commandes qui peuvent être exécutées. Les commandes principales sont regroupées dans une commande générale TeiCorpo. Les paramètres complémentaires ont la même forme pour toutes les commandes, mais certains paramètres ne s'appliquent qu'à certaines commandes.

java -cp teicorpo.jar fr.ortolang.teicorpo.TeiCorpo -from format-entree -to format-sortie fichiers_input -o output [paramètres]

Toutes les commandes utilisent les mêmes paramètres d'entrée sortie:

Le nombre d'éléments à convertir n'est pas limité. Par contre un seul paramètre de sortie peut être donné avec -o. Si l'option -o n'est pas spécifié, ou s'il y a plus d'un fichier entrée, le fichier de sortie aura le même nom que le fichier d'entrée, avec une autre extension, et sera stocké au même endroit. Les paramètres entrée et sortie peuvent être des noms de répertoire. En entrée, tous les fichiers de l'arborescence correspondant au format de l'option -from (ou tous les fichiers de type connus si pas d'option -from) seront convertis. En sortie, un nom de répertoire servira d'emplacement pour les fichiers produits.

L'usage de -from et -to est prioritaire sur les informations données par les extensions de fichier. Les options -from et -to peuvent accepter les valeurs suivantes:

L'option -to peut accepter les valeurs complémentaires suivantes:

Paramètres complémentaires s'appliquant à toutes les commandes

Paramètres supplémentaires pour les exports vers Txm et vers Lexico

Paramètres supplémentaires pour les exports vers du texte

La conversion depuis Praat dispose de paramètres supplémentaires

Commandes complémentaires (faisant partie de TeiCorpo) :

Commande supplémentaire pour éditer automatiquement les fichiers TEI

Utilisation de TreeTagger pour analyser en parties du discours un fichier Tei

TREE_TAGGER=/projets/syntax
export TREE_TAGGER
java -cp /projets/emplacementlibraries/teicorpo.jar fr.ortolang.teicorpo.TeiTreeTagger -syntaxformat conll -model perceo_oral/spoken-french.par -rawline $1

Versions