Conversions au format TEI pour l'Oral et le Multimodal
TEI (xml / tei_corpo.xml / teiml / trjs)
TRS (transcriber)
CHA (chat - childes)
TXT (texte - utf8)
DOCX (microsoft word)
XLSX (microsoft excel)
CSV (tableurs)
TEXTGRID (praat)
EAF (elan)
TXM (xml/w)
Lexico/Le Trameur (.txt)
Supprimer ces locuteurs/champs de la sortie
Valeur du locuteur ou du champ (caractères génériques acceptés)
Supprimer les marqueurs spécifiques de l'oral
Une ligne par énoncé + tiers/dépendances à droite
Une ligne par énoncé + tiers/sub-tiers à droite organisés par colonnes
Enoncé seul sur une ligne, tiers/dépendances en dessous rassemblé par noms de tiers
Enoncé seul sur une ligne, tiers/dépendances en dessous, un seul élément par ligne
Nombre de décimales pour les temps
Format texte: n° - Loc - Enoncé (version tabulation)
Format texte: Temps début - Loc - Enoncé - (version tabulation)
Format texte: Temps début et fin - Loc - Enoncé (version tabulation)
Format texte: Temps début et fin - Loc - Enoncé (version tabulation) + Header (pour correction orthographique)
Format chevauchements: Loc - Enoncés
Format chevauchements: Loc - Tour de parole
Format par bloc: Loc - Temps - Enoncé
Format par ligne: n° - Loc - Enoncé - Temps
Texte sans aucune marque
Ou cliquer ici pour sélectionner un fichier =>
Demander les paramètres pour les fichiers praat.Choix des relations pour
Résultats (Effacer)
Le format TEI_CORPO suit les propositions du GT2 IRCOM et du groupe TEI Oral ISO.
Il est conforme au standard TEI.
Un outil java pour le traitement par lot
peut être directement téléchargé ici.
Plus d'informations sont disponibles sur cette page.
L'export Excel option "une ligne par énoncé" permet de faire jouer les alignements vidéos directement sous Excel. Pour cela, faire l'export puis insérer par copier-coller les lignes Excel dans le fichier modèle téléchargeable
ici. Attention il faut disposer une installation de VLC Téléchargement de VLC. Les vidéos se lancent sous MAC par les touches Alt+Cmd+W et sous PC par les touches Shift+Ctrl+W