teidata.language
teidata.language 自然言語と表記体系の組合せを示す表現を値域とする属性値を定義する。 [vi.1. Language Identification] | |
モジュール | tei — The TEI Infrastructure |
当該モジュールを使用するもの |
クラス:
要素:
|
Content model |
<content> |
宣言 |
<rng:define name="teidata.language"> teidata.language = xsd:language | ( "" ) |
解説 |
当該属性値は、BCP 47で定義されている言語‘タグ’である。 BCP 47は、RFC 5646とRFC 4647からなる。将来的に、その他のIETF文書が現状における最良の慣行としての地位を受け継ぐかもしれない。 BCP 47における‘言語タグ’とは、ハイフン (-, U+002D)で区切られた一連の下位タグと呼ばれる構成要素からなっている。 下位タグは、以下の順番に並べられる。 下位タグは、初めの1つ以外は必須でない。もし存在するときは、それぞれの下位タグは、繰返し可能な4番目と5番目の構成要素(変種と拡張)をのぞき、1度までしか用いられない。
上記記述形式には、2つの例外がある。 ひとつは、IANAレジストリにある言語タグには、上述の形式に違反しているが有効なものがある。これはIANAでは以前の形式では許容されていた‘歴史的例外’だからである。 ふたつめは、言語タグ全体を私用タグにすることができる。 言語コードには、以下のようなものがある。
W3Cの国際化活動では、BCP 47の解説 「HTMLとXMLで使用される言語タグ」を以下に用意している。 |