HTMLの数値文字参照

 日本のHTMLの教科書や解説書にはなぜか掲載されることが少ないのが,「数値文字参照」です。私が数値文字参照のことを初めて知ったのは英語で書かれたHTMLの解説書を読んだときでした。HTML4.0の規格で出てきたようです。早い話が,欧米では特殊文字やウムラウト(ドイツ語),アクサングラーフやアクサンテーギュ(フランス語)などアルファベットにも記号がつくので,どうしても26文字では足りないのです。

たとえば
aアーウムラウトは&aumlあるいは&#228
とHTML内で書けば,aウムラウトが表示されます。これは便利です。ところが,日本では2バイト文字でJISコードですでに特殊文字が規定されていましたので,このような必要性がなかったのでしょう。
 
 さて,2つの表記法があります。
・&aumlのような表記法を文字実体参照あるいは実体参照と言います。
・&#228のような表記法を数値文字参照あるいは単に文字参照と言います。

【出典】
文字参照 – Wikipedia

 さて,文字から数値文字参照に変換するにはJavaScriptが便利です。

【数値文字参照を求めるJavaScript】
Javascriptで数値文字参照の値を求める方法

 これらを利用すれば,日本語,中国語,韓国語の混在も比較的容易にできます。実はオブ脳が制作した漢字データベースでは,UTF-8ではどうしてもデータベースを作成できないので,数値文字参照で日本語,中文漢字,ハングル,ベトナム語を表示しています。

【参考】
漢字CJKV

 このように数値文字参照は国際的なウェブサイト構築にはとても重要なのです。

comments

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

*