La TEI Lite : encoder pour échanger : une introduction à la TEI
Edition finale révisée pour la TEI P5
traduction française de Sophie David

6. Le marquage des expressions mises en valeur

6.1. Les changements de police de caractères, etc.

Les mots ou les expressions mis en valeur sont ceux qui sont visuellement différents du reste du texte ; il s’agit typiquement d’un changement de police, de style d’écriture, de couleur, etc., dont le but est d’attirer l’attention du lecteur. On peut se servir de la balise suivante pour signaler de tels changements:

  • hi (mis en évidence) distingue un mot ou une expression comme graphiquement distincte du texte environnant, sans en donner la raison.

L’attribut global rend peut être associé à n’importe quel autre élément, et utilisé chaque fois que nécessaire pour spécifier la mise en valeur. Par exemple, un titre en gras peut être balisé par <head rend="bold"> et un titre en italiques par <head rend="italic">.

Les valeurs de l’attribut rend ne sont pas spécifiées dans les Recommandations, car elles dépendent entièrement des besoins du projet. Typiquement, ses valeurs sont « italiques », « gras », « exposant », etc. pour le style de la police ; « centré », « aligné à droite » pour l’alignement ; « grand », « petit » pour la taille ; « petitesMajuscules », « majuscules » pour les caractères, etc. Plusieurs de ces valeurs peuvent être combinées si cela est nécessaire, et il n’y pas de syntaxe particulière pour exprimer ces combinaisons. Les Recommandations proposent aussi des mécanismes d’encodage plus rigoureux que celui offert par rend. Ils reposent sur les standards du W3C (comme les CSS).

Ce n’est pas toujours possible ou souhaitable d’interpréter les raisons qui ont présidé à telle ou telle mise en valeur. On peut alors utiliser l’élément hi pour marquer la séquence mise en valeur, sans pour autant faire d’interprétation quant à son statut.

Dans l’exemple suivant, le fait d’utiliser une police de caractères différente pour le nom présent dans le sous-titre et pour le sous-titre lui-même, est enregistré mais non interprété.
<p>
 <hi rend="gothic">Item; il est attesté par le présent acte</hi>, que ledit <hi rend="italic">Walter Shandy</hi>, négociant, en
considération dudit futur mariage
...
</p>

De manière alternative, quand on sait interpréter la mise en valeur, un certain nombre d’autres éléments spécifiques sont disponibles :

  • emph (mis en valeur) marque des mots ou des expressions qui sont accentués ou mis en valeur pour un motif linguistique ou rhétorique.
  • foreign (étranger) reconnaît un mot ou une expression comme appartenant à une langue différente de celle du contexte.
  • gloss (glose) identifie une expression ou un mot utilisé pour fournir une glose ou une définition à quelque autre mot ou expression.
  • label (étiquette) contient l'étiquette attachée à un item dans une liste ; dans les glossaires, il marque le terme qui est défini.
  • term (terme) contient un mot simple, un mot composé ou un symbole, qui est considéré comme un terme technique.
  • title (titre) contient le titre complet d'une oeuvre quelconque

Pour illustrer les éléments que nous avons définis, arrêtons-nous sur la phrase suivante5 : ‘Dans un récent numéro du Bulletin des bibliothèques de France, des collègues affirmaient avec enthousiasme, et non sans bravoure, que les bibliothèques n’avaient pas, loin s’en faut, « disparu de la cité », mais qu’elles se trouvaient au contraire investies d’une « nouvelle pertinence ».’

Si l’on décide d’interpréter la mise en valeur, la phrase pourrait être encodée de la manière suivante :
<p>Dans un récent
numéro du <title>Bulletin des bibliothèques de France</title>, des collègues
affirmaient avec enthousiasme, et non sans bravoure, que les bibliothèques n’avaient
pas, loin s’en faut, « <mentioned>disparu de la cité</mentioned> », mais qu’elles se
trouvaient au contraire investies d’une « <mentioned>nouvelle pertinence</mentioned>
»</p>
Si on est intéressé uniquement par la mise en forme de l'original, on pourrait l'encoder ainsi :
Dans un récent numéro du <hi rend="it">Bulletin des bibliothèques de France</hi>, des
collègues affirmaient avec enthousiasme, et non sans bravoure, que les bibliothèques
n’avaient pas, loin s’en faut, « <hi rend="it">disparu de la cité</hi> », mais
qu’elles se trouvaient au contraire investies d’une « <hi rend="it">nouvelle
pertinence</hi> ».

6.2. Les citations et les éléments associés

Tout comme les changements de police de caractères, les guillemets sont utilisés de différentes manières dans les textes, le cas le plus le plus fréquent étant celui de la citation. Quand c’est possible, il importe de ne pas s’en tenir à noter la présence de guillemets, mais plutôt d’étiqueter leur fonction. On utilise alors les éléments suivants :

  • q (séparé du texte environnant par des guillemets) contient un fragment qui est marqué (visiblement) comme étant d’une manière ou d'une autre différent du texte environnant, pour diverses raisons telles que, par exemple, un discours direct ou une pensée, des termes techniques ou du jargon, une mise à distance par rapport à l’auteur, des citations empruntées et des passages qui sont mentionnés mais non employés.
  • mentioned marque des mots ou des expressions employés métalinguistiquement
  • soCalled contient une expression ou un mot pour lesquels l'auteur ou le narrateur renonce à toute responsabilité, par exemple en utilisant de l'italique ou des guillemets.
  • gloss (glose) identifie une expression ou un mot utilisé pour fournir une glose ou une définition à quelque autre mot ou expression.
Voici un exemple simple d'une citation, extrait des Confessions de Jean-Jacques Rousseau :
<p>Enfin je me rappelai le pis-aller d’une grande princesse à qui l’on disait que les
paysans n’avaient pas de pain, et qui répondit : <q>Qu’ils mangent de la
   brioche.</q>
</p>

Pour indiquer comment la citation a été imprimée (par exemple, sur la même ligne, ou un pavé), on utilise l’attribut rend, qui permet également de spécifier le type de guillemets utilisé.

Le discours direct interrompu par le narrateur peut être simplement représenté en finissant la citation juste avant l’interruption et en la recommençant juste après. Par exemple dans La Quête du Graal (ms K, folio 169, § 55) on lit  :
Et quant Melyan voit ces letres si dist a
Galaad : <q>Frans chevaliers por Dieu lessiez moi entrer en cele a senestre, car en
cele porrai je esprover ma force, et connoistre s’il avra ja en moi proesce ne
hardement por quoi je doie avoir los de chevalerie.</q>
<q>- S’il vos pleust</q>, fait Galaad,
<q>je m’en entrasse en cele a senestre, car si
com je pens je m’en getasse mielz que vos.</q>

S’il est important de signifier que les deux éléments q forment ensemble un seul bloc, on peut utiliser les attributs next et prev. Cf. section 8.3. Les types spéciaux de liens.

On peut associer aux citations des références (par exemple la source, le nom du personnage, etc.), en utilisant l’attribut who, que ces informations soient ou non explicitées dans le texte. Par exemple :
<q who="#Wilson"> Spaulding arriva au
bureau, je me rappelle que ce fut précisément il y a
aujourd’hui huit
jours, avec ce même journal à la main et s’écria : <q who="#Spaulding">— Quel
   malheur, monsieur Wilson ! que je ne sois pas roux.</q>
</q>
Cet exemple6 montre aussi comment les citations peuvent être imbriquées dans d’autres citations : un personnage (Wilson) cite un autre personnage (Spaulding). Le créateur du texte électronique doit décider si les guillemets seront remplacés par des balises, ou si des balises seront ajoutées et les guillemets conservés. Si les guillemets sont supprimés, on peut utiliser l’attribut rend pour décrire les guillemets de la copie papier.

Les Recommandations proposent d’autres éléments permettant de distinguer le discours direct, la citation, et d’autres usages typiques des guillemets, bien qu’il ne soit pas toujours possible ou souhaitable d’interpréter la fonction des guillemets dans un texte. Pour des raisons de simplicité, seul q (qui peut être utilisé dans n’importe quel cas) fait partie de la TEI Lite.

Pour associer une citation bibliographique avec sa source par contre, on peut utiliser l'élément bibl, et emballer les deux dans l'élément cit (voir exemple 11. Les listes).

6.3. Les mots étrangers ou les expressions

Les mots et les expressions qui ne sont pas dans la langue principale du texte peuvent être balisés de deux façons : i) si le mot ou l’expression est déjà balisé pour une raison quelconque par un élément, on associe à ce dernier l’attribut global xml:lang, dont on spécifie la valeur (i.e. de quelle langue il s’agit) ; ii) sinon on utilise l’élément foreign, toujours avec l’attribut xml:lang. Par exemple :
<foreign xml:lang="la">Et vobis</foreign> messieurs,
Ce ne seroyt que bon que nous rendissiez noz cloches...

<p>Avez-vous lu <title xml:lang="de">Die Dreigroschenoper</title>?</p>
<p>On parle des <mentioned xml:lang="en">people</mentioned> dans ce journal</p>
<p>Le <term xml:lang="la">quaternio terminorum</term>, expression venant du latin,
<gloss>l'erreur des quatre termes, </gloss>est un sophisme qui intervient
lorsqu'un syllogisme utilise quatre termes au lieu de trois.</p>

Comme ces exemples le montrent, l’élément foreign ne doit pas être utilisé pour baliser des mots étrangers si un autre élément plus spécifique, tel que title, mentioned, ou term s’applique. L’attribut global xml:lang peut être associé à n’importe quel élément pour exprimer que son contenu n’est pas dans la même langue que celle qui l’entoure.

Les codes utilisés pour identifier les langues, indiquées dans l’attribut xml:lang, doivent se conformer aux standards internet7, tels que cela est expliqué dans les Recommandations. Voici quelques exemples de codes :

zhchinoisgrcgrec ancien
enanglaiselgrec
enmanglais du moyen agejajaponais
frfrancaislalatin
deallemandsasanskrit
Notes
5
Nous avons trouvé cette phrase sur un page web de l'ENSSIB http://bbf.enssib.fr/consulter/bbf-2012-05-0006-001
6
Extrait d'une traduction du Red Headed League de A. Conan Doyle, http://fr.wikisource.org/wiki/Page:Doyle_-_Nouvelles_Aventures_de_Sherlock_Holmes.djvu/6.
7
La norme pertinente est Best Current Practice 47 (http://tools.ietf.org/html/bcp47). La liste faisant autorité des sous-étiquettes est maintenue par IANA et est disponible à : http://www.iana.org/assignments/language-subtag-registry.Pour un panorama général sur la construction des étiquettes de noms de langue, voir http://www.w3.org/International/articles/language-tags/, et pour un guide pratique, voir :see http://www.w3.org/International/questions/qa-choosing-language-tags.

TEI Guidelines . This page generated on 2015-04-06T13:16:28Z.