3. La structure d’un texte TEI
Tous les textes qui se conforment à la TEI comprennent : (a) un en-tête TEI (balisé avec l’élément teiHeader) (b) la transcription du texte (balisé avec l’élément text). Ces deux éléments sont associés pour former un seul élément TEI, qui doit être déclaré dans l’espace de noms TEI2.
L’en-tête TEI fournit des informations analogues à celles de la page de titre d’un texte imprimé. Il comporte au plus 4 parties :
- une description bibliographique
- une description portant sur la manière dont il a été encodé (traîtement des césures, guillemets, etc.)
- une description « non-bibliographique » du texte (un text profile)
- l’historique des modifications et révisions
L’en-tête est décrit de manière détaillée dans la section 19. La page titre électronique.
Un document TEI peut être unitaire (une œuvre) ou composite (un recueil d’œuvres, comme une anthologie). Dans les deux cas, le texte peut comporter des Parties liminaires ou des Annexes. Entre les deux, se trouve le corps du texte. Dans un texte composite, le corps peut rassembler des groupes, chaque groupe contenant d’autres groupes ou des textes.
Un texte unitaire sera encodé en utilisant une structure comme celle-ci :
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
</teiHeader>
<text>
<front>
</front>
<body>
</body>
<back>
</back>
</text>
</TEI>
Un texte composite peut également comporter des Parties liminaires ou des Annexes. Entre les deux, on aura un ou plusieurs groupes de textes, chaque groupe pouvant avoir ses propres Parties liminaires et ses Annexes. Un texte composite sera alors encodé en utilisant une structure comme celle-ci :
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
</teiHeader>
<text>
<front>
</front>
<group>
<text>
<front>
</front>
<body>
</body>
<back>
</back>
</text>
<text>
<front>
</front>
<body>
</body>
<back>
</back>
</text>
</group>
<back>
</back>
</text>
</TEI>
Il est aussi possible de définir un texte composite rassemblant des textes TEI complets, chacun d’entre eux étant pourvu de son propre en-tête. Un tel recueil est appelé
TEI Corpus, et peut avoir son propre en-tête:
<teiCorpus xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
</teiHeader>
<TEI>
<teiHeader>
</teiHeader>
<text>
</text>
</TEI>
<TEI>
<teiHeader>
</teiHeader>
<text>
</text>
</TEI>
</teiCorpus>
Il est également possible de créer un ensemble de corpus - un élément teiCorpus peut contenir d’autres éléments teiCorpus plutôt que des éléments TEI, et ce quelle que soit la profondeur.
Dans la suite du document, nous discuterons surtout des structures textuelles simples. Dans chaque cas, nous présenterons a) les éléments TEI pertinents, avec pour chacun une brève définition ; b) les attributs spécifiques de chaque élément, et leur définition ; c) la référence à la classe dont l’élément est un membre. Ces références sont associées aux spécifications complètes de chaque objet, comme cela est présenté dans les Recommandations. La plupart des cas sont illustrés par de brefs exemples.
Par exemple, voici les éléments dont on a discuté jusqu’à maintenant :
- TEI (TEI document) contains a single TEI-conformant document, comprising a TEI header and a text, either in isolation or as part of a teiCorpus element.
- teiHeader (TEI header) supplies the descriptive and declarative information making up an electronic title page prefixed to every TEI-conformant text.
- text contains a single text of any kind, whether unitary or composite, for example a poem or drama, a collection of essays, a novel, a dictionary, or a corpus sample.
- teiCorpus contains the whole of a TEI encoded corpus, comprising a single corpus header and one or more TEI elements, each containing a single text header and a text.