Les mots ou les expressions mis en valeur sont ceux qui sont visuellement différents du reste du texte ; il s’agit typiquement d’un changement de police, de style d’écriture, de couleur, etc., dont le but est d’attirer l’attention du lecteur. On peut se servir de la balise suivante pour signaler de tels changements:
- hi (highlighted) marks a word or phrase as graphically distinct from the surrounding text, for reasons concerning which no claim is made.
L’attribut global rend peut être associé à n’importe quel autre élément, et utilisé chaque fois que nécessaire pour spécifier la mise en valeur. Par exemple, un titre en gras peut être balisé par <head rend="bold"> et un titre en italiques par <head rend="italic">.
Les valeurs de l’attribut rend ne sont pas spécifiées dans les Recommandations, car elles dépendent entièrement des besoins du projet. Typiquement, ses valeurs sont « italiques », « gras », « exposant », etc. pour le style de la police ; « centré », « aligné à droite » pour l’alignement ; « grand », « petit » pour la taille ; « petitesMajuscules », « majuscules » pour les caractères, etc. Plusieurs de ces valeurs peuvent être combinées si cela est nécessaire, et il n’y pas de syntaxe particulière pour exprimer ces combinaisons. Les Recommandations proposent aussi des mécanismes d’encodage plus rigoureux que celui offert par rend. Ils reposent sur les standards du W3C (comme les CSS).
Ce n’est pas toujours possible ou souhaitable d’interpréter les raisons qui ont présidé à telle ou telle mise en valeur. On peut alors utiliser l’élément hi pour marquer la séquence mise en valeur, sans pour autant faire d’interprétation quant à son statut.
Dans l’exemple suivant, le fait d’utiliser une police de caractères différente pour le nom présent dans le sous-titre et pour le sous-titre lui-même, est enregistré mais non interprété.
<p>
<hi rend="gothic">Item; il est attesté par le présent acte</hi>, que ledit <hi rend="italic">Walter Shandy</hi>, négociant, en
considération dudit futur mariage
...
</p>
De manière alternative, quand on sait interpréter la mise en valeur, un certain nombre d’autres éléments spécifiques sont disponibles :
- emph (emphasized) marks words or phrases which are stressed or emphasized for linguistic or rhetorical effect.
- foreign (foreign) identifies a word or phrase as belonging to some language other than that of the surrounding text.
- gloss identifies a phrase or word used to provide a gloss or definition for some other word or phrase.
- label contains any label or heading used to identify part of a text, typically but not exclusively in a list or glossary.
- term contains a single-word, multi-word, or symbolic designation which is regarded as a technical term.
- title contains a title for any kind of work.
Pour illustrer les éléments que nous avons définis, arrêtons-nous sur la phrase suivante5 : ‘Dans un récent numéro du Bulletin des bibliothèques de France, des collègues affirmaient avec enthousiasme, et non sans bravoure, que les bibliothèques n’avaient pas, loin s’en faut, « disparu de la cité », mais qu’elles se trouvaient au contraire investies d’une « nouvelle pertinence ».’
Si l’on décide d’interpréter la mise en valeur, la phrase pourrait être encodée de la manière suivante :
<p>Dans un récent
numéro du <title>Bulletin des bibliothèques de France</title>, des collègues
affirmaient avec enthousiasme, et non sans bravoure, que les bibliothèques n’avaient
pas, loin s’en faut, « <mentioned>disparu de la cité</mentioned> », mais qu’elles se
trouvaient au contraire investies d’une « <mentioned>nouvelle pertinence</mentioned>
»</p>
Si on est intéressé uniquement par la mise en forme de l'original, on pourrait l'encoder ainsi :
Dans un récent numéro du <hi rend="it">Bulletin des bibliothèques de France</hi>, des
collègues affirmaient avec enthousiasme, et non sans bravoure, que les bibliothèques
n’avaient pas, loin s’en faut, « <hi rend="it">disparu de la cité</hi> », mais
qu’elles se trouvaient au contraire investies d’une « <hi rend="it">nouvelle
pertinence</hi> ».
Tout comme les changements de police de caractères, les guillemets sont utilisés de différentes manières dans les textes, le cas le plus le plus fréquent étant celui de la citation. Quand c’est possible, il importe de ne pas s’en tenir à noter la présence de guillemets, mais plutôt d’étiqueter leur fonction. On utilise alors les éléments suivants :
- q (quoted) contains material which is distinguished from the surrounding text using quotation marks or a similar method, for any one of a variety of reasons including, but not limited to: direct speech or thought, technical terms or jargon, authorial distance, quotations from elsewhere, and passages that are mentioned but not used.
- mentioned marks words or phrases mentioned, not used.
- soCalled contains a word or phrase for which the author or narrator indicates a disclaiming of responsibility, for example by the use of scare quotes or italics.
- gloss identifies a phrase or word used to provide a gloss or definition for some other word or phrase.
Voici un exemple simple d'une citation, extrait des
Confessions de Jean-Jacques Rousseau :
<p>Enfin je me rappelai le pis-aller d’une grande princesse à qui l’on disait que les
paysans n’avaient pas de pain, et qui répondit : <q>Qu’ils mangent de la
brioche.</q>
</p>
Pour indiquer comment la citation a été imprimée (par exemple, sur la même ligne, ou un pavé), on utilise l’attribut rend, qui permet également de spécifier le type de guillemets utilisé.
Le discours direct interrompu par le narrateur peut être simplement représenté en finissant la citation juste avant l’interruption et en la recommençant juste après. Par exemple dans
La Quête du Graal (ms K, folio 169, § 55) on lit :
Et quant Melyan voit ces letres si dist a
Galaad : <q>Frans chevaliers por Dieu lessiez moi entrer en cele a senestre, car en
cele porrai je esprover ma force, et connoistre s’il avra ja en moi proesce ne
hardement por quoi je doie avoir los de chevalerie.</q>
<q>- S’il vos pleust</q>, fait Galaad,
<q>je m’en entrasse en cele a senestre, car si
com je pens je m’en getasse mielz que vos.</q>
S’il est important de signifier que les deux éléments q forment ensemble un seul bloc, on peut utiliser les attributs next et prev. Cf. section 8.3. Les types spéciaux de liens.
On peut associer aux citations des références (par exemple la source, le nom du personnage, etc.), en utilisant l’attribut
who, que ces informations soient ou non explicitées dans le texte. Par exemple :
<q who="#Wilson"> Spaulding arriva au
bureau, je me rappelle que ce fut précisément il y a
aujourd’hui huit
jours, avec ce même journal à la main et s’écria : <q who="#Spaulding">— Quel
malheur, monsieur Wilson ! que je ne sois pas roux.</q>
</q>
Cet exemple
6 montre aussi comment les citations peuvent être imbriquées dans d’autres citations : un personnage (Wilson) cite un autre personnage (Spaulding). Le créateur du texte électronique doit décider si les guillemets seront remplacés par des balises, ou si des balises seront ajoutées et les guillemets conservés. Si les guillemets sont supprimés, on peut utiliser l’attribut
rend pour décrire les guillemets de la copie papier.
Les Recommandations proposent d’autres éléments permettant de distinguer le discours direct, la citation, et d’autres usages typiques des guillemets, bien qu’il ne soit pas toujours possible ou souhaitable d’interpréter la fonction des guillemets dans un texte. Pour des raisons de simplicité, seul q (qui peut être utilisé dans n’importe quel cas) fait partie de la TEI Lite.
Pour associer une citation bibliographique avec sa source par contre, on peut utiliser l'élément bibl, et emballer les deux dans l'élément cit (voir exemple 11. Les listes).
Les mots et les expressions qui ne sont pas dans la langue principale du texte peuvent être balisés de deux façons : i) si le mot ou l’expression est déjà balisé pour une raison quelconque par un élément, on associe à ce dernier l’attribut global
xml:lang, dont on spécifie la valeur (i.e. de quelle langue il s’agit) ; ii) sinon on utilise l’élément
foreign, toujours avec l’attribut
xml:lang. Par exemple :
<foreign xml:lang="la">Et vobis</foreign> messieurs,
Ce ne seroyt que bon que nous rendissiez noz cloches...
<p>Avez-vous lu <title xml:lang="de">Die Dreigroschenoper</title>?</p>
<p>On parle des <mentioned xml:lang="en">people</mentioned> dans ce journal</p>
<p>Le <term xml:lang="la">quaternio terminorum</term>, expression venant du latin,
<gloss>l'erreur des quatre termes, </gloss>est un sophisme qui intervient
lorsqu'un syllogisme utilise quatre termes au lieu de trois.</p>
Comme ces exemples le montrent, l’élément foreign ne doit pas être utilisé pour baliser des mots étrangers si un autre élément plus spécifique, tel que title, mentioned, ou term s’applique. L’attribut global xml:lang peut être associé à n’importe quel élément pour exprimer que son contenu n’est pas dans la même langue que celle qui l’entoure.
Les codes utilisés pour identifier les langues, indiquées dans l’attribut xml:lang, doivent se conformer aux standards internet7, tels que cela est expliqué dans les Recommandations. Voici quelques exemples de codes :
zh | chinois | grc | grec ancien |
en | anglais | el | grec |
enm | anglais du moyen age | ja | japonais |
fr | francais | la | latin |
de | allemand | sa | sanskrit |