3. La structure d’un texte TEI
Tous les textes qui se conforment à la TEI comprennent : (a) un en-tête TEI (balisé avec l’élément teiHeader) (b) la transcription du texte (balisé avec l’élément text). Ces deux éléments sont associés pour former un seul élément TEI, qui doit être déclaré dans l’espace de noms TEI2.
L’en-tête TEI fournit des informations analogues à celles de la page de titre d’un texte imprimé. Il comporte au plus 4 parties :
- une description bibliographique
- une description portant sur la manière dont il a été encodé (traîtement des césures, guillemets, etc.)
- une description « non-bibliographique » du texte (un text profile)
- l’historique des modifications et révisions
L’en-tête est décrit de manière détaillée dans la section 19. La page titre électronique.
Un document TEI peut être unitaire (une œuvre) ou composite (un recueil d’œuvres, comme une anthologie). Dans les deux cas, le texte peut comporter des Parties liminaires ou des Annexes. Entre les deux, se trouve le corps du texte. Dans un texte composite, le corps peut rassembler des groupes, chaque groupe contenant d’autres groupes ou des textes.
Un texte unitaire sera encodé en utilisant une structure comme celle-ci :
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
</teiHeader>
<text>
<front>
</front>
<body>
</body>
<back>
</back>
</text>
</TEI>
Un texte composite peut également comporter des Parties liminaires ou des Annexes. Entre les deux, on aura un ou plusieurs groupes de textes, chaque groupe pouvant avoir ses propres Parties liminaires et ses Annexes. Un texte composite sera alors encodé en utilisant une structure comme celle-ci :
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
</teiHeader>
<text>
<front>
</front>
<group>
<text>
<front>
</front>
<body>
</body>
<back>
</back>
</text>
<text>
<front>
</front>
<body>
</body>
<back>
</back>
</text>
</group>
<back>
</back>
</text>
</TEI>
Il est aussi possible de définir un texte composite rassemblant des textes TEI complets, chacun d’entre eux étant pourvu de son propre en-tête. Un tel recueil est appelé
TEI Corpus, et peut avoir son propre en-tête:
<teiCorpus xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
</teiHeader>
<TEI>
<teiHeader>
</teiHeader>
<text>
</text>
</TEI>
<TEI>
<teiHeader>
</teiHeader>
<text>
</text>
</TEI>
</teiCorpus>
Il est également possible de créer un ensemble de corpus - un élément teiCorpus peut contenir d’autres éléments teiCorpus plutôt que des éléments TEI, et ce quelle que soit la profondeur.
Dans la suite du document, nous discuterons surtout des structures textuelles simples. Dans chaque cas, nous présenterons a) les éléments TEI pertinents, avec pour chacun une brève définition ; b) les attributs spécifiques de chaque élément, et leur définition ; c) la référence à la classe dont l’élément est un membre. Ces références sont associées aux spécifications complètes de chaque objet, comme cela est présenté dans les Recommandations. La plupart des cas sont illustrés par de brefs exemples.
Par exemple, voici les éléments dont on a discuté jusqu’à maintenant :
- TEI (document TEI) contient un seul document conforme à la TEI, qui comprend un en-tête TEI et un texte, soit de façon isolée, soit comme partie d’un élément teiCorpus.
- teiHeader (en-tête TEI) fournit des informations descriptives et déclaratives qui constituent une page de titre électronique au début de tout texte conforme à la TEI.
- text (texte) contient un seul texte quelconque, simple ou composite, par exemple un poème ou une pièce de théâtre, un recueil d’essais, un roman, un dictionnaire ou un échantillon de corpus.
- teiCorpus contient la totalité d'un corpus encodé selon la TEI, comprenant un seul en-tête de corpus et un ou plusieurs éléments TEI dont chacun contient un seul en-tête textuel et un texte.