文字参照(character reference)はHTMLやXMLなどの文書で直接記述できない(または直接記述することが難しい)文字を表記する方法です。文字参照にはキーワードで指定する「名前文字参照」(named character reference)と、Unicodeの符号位置で指定する「数値文字参照」(numeric character reference)があり、後者の「数値文字参照」には10進数と16進数による記法があります。いずれの記法も&
で始まり;
で終わります。例えばアンパサンド(&
)を文字参照で表現すると以下のようになります。
&
名前文字参照&
数値文字参照(10進数)&
数値文字参照(16進数)
現在ほとんどのHTML文書の文字コードはUFT-8であるため、絵文字を含む記号なども直接記述することができ、文字参照を使う場面はあまり多くありません。ただしHTML構文に含まれる以下の文字をテキストとして記述する場合は文字参照によってエスケープする必要があります。
文字 | 名前文字参照 |
---|---|
& | & |
< | < |
> | > |
" | " |
' | ' |
<h1>The Best of Hall & Oates</h1>
そのほか、例えばenダッシュ(U+2013)とemダッシュ(U+2014)など、ソースコード上で見分けのつきにくい文字を記述する際にも役立ちます。
<p>London–Tokyo</p>