La TEI Lite : encoder pour échanger : une introduction à la TEI
Edition finale révisée pour la TEI P5
traduction française de Sophie David

8. Les références croisées et les liens

Des références croisées explicites et des liens d’un endroit du texte à un autre, que ce soit dans le même document ou entre deux documents différents, peuvent être encodés en utilisant les éléments décrits dans cette section. Les liens implicites (tels que l’association de deux textes parallèles, ou bien l’association d’un texte et de son interprétation) peuvent être encodés en utilisant les attributs présentés dans la section 8.3. Les types spéciaux de liens.

8.1. Les références croisées simples

Si l’on veut relier deux endroits d’un même texte, on utilise l’un des éléments suivants :

  • ref (référence) définit une référence vers un autre emplacement, la référence étant éventuellement modifiée ou complétée par un texte ou un commentaire.
  • ptr/ (pointeur) définit un pointeur vers un autre emplacement.

L’élément vide ptr marque l’endroit à partir duquel on crée le lien, tandis que ref contient du texte. Le plus souvent il s’agira du texte de la référence croisée elle-même. L’élément ptr doit être utilisé pour une référence croisée signalée par des moyens non verbaux, tels qu’un symbole ou une icône, ou encore un bouton dans un texte électronique. Il est également utile dans les systèmes de production de document, si le système de formatage est capable de générer correctement l’expression de la référence croisée.

Les deux formes suivantes sont logiquement équivalentes :
Cf. tout particulièrement <ref target="#SEC12">la section 12, page 34</ref>.
Cf. tout particulièrement <ptr target="#SEC12"/>.
La valeur de l’attribut target de l’un ou l’autre de ces éléments peut être l’identifiant d’un autre élément du texte courant. Le passage ou l’expression que l’on cible doivent porter un identifiant, et donc être balisés comme un élément d’un certain type. Dans l’exemple suivant, la référence croisée pointe sur un élément div :
... Cf. tout
particulièrement <ptr target="#SEC12"/>. ...
<div xml:id="SEC12">
 <head>Au sujet des identifiants</head>
<!-- ... -->
</div>
Comme xml:id est un attribut global, on peut pointer de cette manière sur n’importe quel élément d’un texte TEI. Dans l’exemple suivant, on a associé un identifiant à un paragraphe pour qu’on puisse pointer sur lui.
... voir discussion de ce point au <ref target="#pspec">paragraphe qui traite des liens</ref> ...
<p xml:id="pspec">Les
liens peuvent s'effectuer vers tout type d'élément ...</p>

Parfois, la cible d’une référence croisée ne correspond à aucune caractéristique particulière du texte, et de ce fait peut ne pas être balisée comme un élément d’un certain type. Si la cible que l’on souhaite indiquer correspond simplement à un endroit du document courant, la manière la plus simple de procéder est d’utiliser l’élément anchor, à l’endroit ciblé. Si la cible est une certaine suite de mots, qui n’est pas déjà balisée, l’élément seg peut être utilisé. Ces deux éléments se laissent décrire de la manière suivante :

  • anchor/ (point d'ancrage) attache un identifiant à un point du texte, que ce point corresponde ou non à un élément textuel.
  • seg (segment quelconque) contient une unité de texte quelconque de niveau ‘segment’.
Dans l’exemple (inventé) suivant, les éléments ref sont utilisés pour représenter les endroits du texte qui doivent être associés à d’autres parties du texte ; dans le premier cas, à un endroit particulier, et dans le second à une suite de mots :
Retournant à <ref target="#ABCD">la phrase où je me suis endormi</ref>, j'ai noté que <ref target="#EFGH">trois
mots</ref> avaient été soulignés par un lecteur précédent

Cet encodage demande que les éléments ayant des identifiants spécifiques (ABCD et EFGH dans cet exemple) soient effectivement quelque part dans le texte. Si aucun élément ne porte déjà ces identifiants, on peut utiliser les éléments anchor et seg.

.... <anchor type="bookmarkxml:id="ABCD"/> .... ....<seg type="targetxml:id="EFGH"> ... </seg> ...

On doit utiliser l’attribut type (comme ci-dessus) pour distinguer les différents rôles que pourraient jouer ces éléments généraux. D’autres utilisations sont présentées ci-après.

8.2. Le renvoi à d’autres documents

Jusqu’à maintenant, nous avons montré comment on pouvait utiliser les éléments ptr et ref pour établir des références croisées ou des liens, dont les cibles se situent dans le même texte. Cependant, on peut aussi utiliser ces deux éléments pour renvoyer à des éléments de n’importe quel autre document ou ressource XML, tel qu’un document sur le web, une partie d’une base de données. Ceci est possible si l’attribut target porte comme valeur n’importe quelle URI10 valide.

Un URI peut renvoyer à une page web, ou seulement à une partie de cette page. Par exemple : dans http://www.tei-c.org/index.xml#SEC2", le signe # indique que ce qui suit est l’identifiant d’un élément situé dans le document XML, dont l’adresse est indiquée par ce qui précède : cet exemple vise par conséquent un élément qui a un attribut xml:id dont la valeur est SEC2, dans le document extrait de http://www.tei-c.org/index.xml. Dans les exemples que nous avons présentés jusqu’à maintenant, la partie à gauche du signe # a toujours été omise, ce qui signifiait justement que l’élément auquel on renvoyait se trouvait dans le même document.

Des parties d’un document XML peuvent être spécifiées par d’autres moyens plus sophistiqués, qui utilisent XPath. Ce langage est aussi défini par le W3C. Il est particulièrement utile quand les éléments à associer ne portent pas d’identifiants et doivent alors être localisés par d’autres moyens.

8.3. Les types spéciaux de liens

Les attributs suivants, qui ont des rôles spécifiques, sont définis pour tous les éléments du schéma TEI Lite :

ana
lie un élément à son interprétation
corresp
lie un élément avec un ou plusieurs autres éléments correspondants
next
lie un élément avec l’élément suivant de l’ensemble
prev
lie un élément avec l’élément précédent de l’ensemble
On utilise l’attribut ana (analysis - analyse) lorsque des ensembles rassemblant des analyses abstraites ou des interprétations ont été définis quelque part dans le document. Cf. 15. L’interprétation et l’analyse. Par exemple, une analyse linguistique de « Jean aime Nancy » pourrait être encodée comme suit :
<seg type="sentenceana="SVO">
 <w ana="#NP1">Jean</w>
 <w ana="#VVI">aime</w>
 <w ana="#NP1">Nancy</w>
</seg>

Cet encodage implique l’existence quelque part dans le document d’éléments avec les identifiants SVO, NP1 et VVI, où la signification de ces codes particuliers est explicitée. Notons ici l’utilisation de l’élément seg pour marquer les composants particuliers d’une analyse, qui sont distingués par l’attribut type.

On utilise l’attribut corresp (correspondant) pour indiquer d'une manière simple tout type de correspondance entre deux éléments. Par exemple, dans un texte multilingue, il peut servir à lier ensemble les phrases équivalentes :
<seg xml:lang="frxml:id="FR1"
 corresp="#EN1">
Jean aime Nancy</seg>
<seg xml:lang="enxml:id="EN1"
 corresp="#FR1">
John loves Nancy</seg>
On peut utiliser ce même mécanisme dans divers cadres. Dans l’exemple11 qui suit, on l’utilise pour représenter la relation anaphorique entre « le village » et « Châteauvillain », et entre « la fête foraine » et « la fête de la Trinité »
<p>
 <name type="placexml:id="CVN">Châteauvillain</name> renouvelle avec une vieille
tradition de la localité qui avait été un peu oubliée depuis quelques années : <seg xml:id="feteTrin">la fête de la Trinité</seg>. Autrefois, il s'agissait des
grandes réjouissances annuelles de la commune. Pour ce retour attendu, <rs corresp="#feteTrin">la fête foraine</rs> s'installera dans <rs corresp="#CVN">le
   village</rs> les 29 et 30 mai.
</p>
Les attributs prev et next permettent de relier de manière simple des constituants discontinus, comme dans l’exemple suivant :
<p> «<q xml:id="Q1anext="#Q1b">Marie</q>,
dis-je, <q xml:id="Q1bprev="#Q1a">j’ai été mariée ce matin à M. Rochester.</q> »
</p>.
Notes
10
Une explication complète de ce terme, défini par le W3C (le consortium qui gère le développement et la maintenance du web), excède les objectifs de ce tutoriel. Cependant, la forme d’URI la plus fréquemment rencontrée est celle familière de l’URL, utilisée pour identifier une page web, telle que http://www.tei-c.org/index.xml.
11
La phrase est prise du journal L'est Republican (edition de 1999-05-19)

TEI Guidelines . This page generated on 2015-04-06T13:16:28Z.