PAGE ACCUEIL

Édition numérique

Édition numérique
27 Mars 2015

Odette

Version en ligne — Odette est un logiciel libre développé par Frédéric Glorieux qui transforme un document traitement de texte (odt) vers un format structuré strictement sémantique (XML/TEI). Le principe consiste à exploiter toutes les fonctionnalités avancées d’un logiciel bureautique (tables des matières, styles, index…), pour les retranscrire en balises normalisées, cf. Glorieux, 2015.

21 Juin 2015

XML stats

XML stats est un outil pédagogique et professionnel utile à l’exploration rapide d’un ou plusieurs fichiers XML. Il a été commencé en 2012 par Frédéric Glorieux pour une étude sur le balisage des dictionnaires, l’outil continue sa vie à l’OBVIL. Il fournit différentes statistiques relatives aux balises et au texte qu’elles contiennent, notamment la liste des mots les plus fréquents pour une balise.

 
25 Juin 2015

RngDoc, documenter un schéma XML (Relax-NG)

RngDoc est un outil pour extraire et produire la documentation d’un schéma XML/Relax-NG. Il a été initié, développé et maintenu par Frédéric Glorieux depuis 2005. L’OBVIL utilise cet outil pour regénérer régulièrement la documentation du schéma Teibook, que consulte ses éditeurs XML.

15 Juillet 2016

Dramagraph

Démonstration — “Dramagraph” est un logiciel d’analyse de textes théâtraux en XML/TEI développé par Frédéric Glorieux et Marc Douguet. Des perfectionnnements décisifs ont été proposés par Didier Alexandre et Georges Forestier. Il est utilisé par l’OBVIL pour son édition électronique de Molière.

 
15 Septembre 2017

Livrable

TEI > epub, Démonstration — XML/TEI permet de structurer précisément les textes, pour la recherche et la publication. Epub est un format de livre électronique ouvert, qui, principalement, compresse des fichiers HTML. Livrable dépend de Teinte, une librairie TEI basée sur un schéma Relax-NG qui canalise le balisage, afin d’assurer la transformation en HTML.

15 Septembre 2017

Debook

Epub > TEI — Debook délie un livre électronique (epub) pour essayer de reconstituer un texte cohérent en XML/TEI. Afin de constituer un corpus, il est parfois utile de partir de fichiers epub. Nativement, il s’agit de pages HTML, avec cet avantage relativement à un site web, que les pages ne comportent pas de navigations parasites, et que l’ordre est nscrit dans un fichier de configuration (epub/content.opf).

 
16 Septembre 2017

Reteint

TEI ► docx — Reteint transforme un fichier XML/TEI en docx (format traitement de textes compatible avec Microsoft.Word, LibreOffice, OpenOffice…), en assurant un stylage optimal pour un retour du document bureautique vers TEI (avec par exemple Odette). Attention cependant, XML/TEI est un format plus complexe que docx, c’est une conversion avec risque de pertes en structure (mais pas en texte). C’est un complément nécessaire à toute bibliothèque TEI, afin de faciliter la réutilisation des textes.

25 Mars 2015

Teinte

Version en ligne — Teinte est une librairie logiciel libre XSLT1/PHP développée par Frédéric Glorieux, destinée à la publication de documents XML/TEI en HTML, ainsi que d’autres formats pour logiciels de fouille de textes (iramuteq, PhiloLogic, TXM…).