1. ホーム
  2. Web制作
  3. ヒントとコツ

ニコニコアジアプロジェクト(&#,&u)

2022-01-01 07:46:08

初期のコンピューターはASCII文字しか使えなかったが、コンピューターの応用範囲が広がるにつれ、多くの国がコンピューター用に特別な文字セットを設計し、中国のGB2312コードのように、自国や民族のアルファベットや文字をコンピューター上で表示したり処理したりできるようにしたのだ。その後、インターネットが登場し、全世界がインターネットに接続されたことで、多国籍・多民族の文字を1台のコンピューター、あるいは1つのインターフェースで表示することが現実的なニーズとなった。国際機関では、言語やプラットフォームを超えたテキスト変換・処理に対応するため、世界中のあらゆる文字や記号に対応できる文字符号化方式を開発し、Universal Character Setの略称であるUnicode(ユニコード)と呼ぶことにした。

URLにアクセスすることができます https://www.unicode.org をクリックすると、最新版のコード表のダウンロードを含む詳細情報が表示されます。

Unicodeの文字セットは、Webページをデザインする際に使用することができ、HTML、CSS、JavaScriptのいずれであるかによって、使用方法が異なります。

1) HTMLでの使用: &#dddd; または &#xhhhh;

ここで、ddddは4ビットの10進数値、hhhhは4ビットの16進数値を意味します。どちらの形式も接頭辞に &# と &#x が付き、10進コードか16進のユニコードで表現されますが、どちらも接尾辞としてセミコロンが必要です。現在、4ビットの16進コードを持つユニコード文字は比較的よくサポートされており、そのほとんどはウェブページで正常に表示することができますが、それ以外のユニコード文字は、使用するコンピュータプラットフォームに該当するユニコードサポートがまだインストールされていないため、まだ表示できないことが多いようです。例を挙げます。

ユニコード文字を表示する - ∰文字を表示する


は、Unicodeコード2230の数学記号を示しています。この特殊文字を"∰"または"∰"で出力すると、ページ上に表示されます。

2) CSSで使用する。\ʕ-̫͡-ʔ

CSSでUnicode文字を使用することは比較的まれですが、時折使用されることがあり、通常は4ビットの16進数のUnicodeコード表現で、バックスラッシュ文字が前に付きます。

3)JavaScriptで使用される。\ʕ-ᴥ-ʔ

JavaScriptのコードは、要素内の温度や角度文字、ギリシャ文字、ローマ数字など、特殊な文字を出力するときによく使われます。4桁のUnicode16進コードの前に"˶‾‾‾‾‾‾‾‾‾‾‾‾"を付けるだけです。例

document.body.innerHTML="\u25D0";

ユニコードコード25D0を使用し、ジオメトリテーブルの円形パターンで、通常は半分が白で埋められ、半分が黒で埋められ、半月のようなものです。

もちろん、中国人がユニコード・コードを使う最も一般的な場面は、漢字である。より多くの漢字を表示するために、漢字ライブラリはGB2312からGBKへ、そして現在はGB18030へと拡張されている。最新版のGB18030では、7万字以上の漢字を収録し、さらに各種少数民族の文字や一部の特殊文字も収録するなど、Unicodeコードの考え方と一致した規格になっている。もちろん、パソコンによっては、完全な新バージョンのサポートソフトがインストールされていない場合もあり、一部の文字しか表示されないことも多い。

中国語の文字のUnicodeコードを取得するには、例えば、JavaScriptの関数charCodeAt()を使用することができます。

var ucode="趙".charCodeAt().ucode="趙".charCodeAt();

これで「趙」という漢字のUnicodeコードが変数ucodeに格納され、10進数のUnicodeコード36213を得ることができます。この10進コードを16進コードに変換するには、toString(16)メソッドを使用すればよい。

var ucode="趙".charCodeAt().toString(16)となります。

漢字「趙」のユニコードコードを16進数で表したもので、値は「8d75」です。

一般に、漢字を出力し、その文字を含む文字列を直接表示することができる。また、ある漢字のUnicodeコードを使って、対応する漢字などを出力することもできます。

String.fromCharCode(36213)です。

これは、10進数のUnicodeコード36213を文字列に変換し、この文字列を出力すると、漢字の「趙」が表示されます。入力メソッドで文字列から直接漢字を得ることができるため、特殊文字を出力する際によく使われるメソッドです。

コードから文字への変換

これはユニコードのエンコードで、次のようになります。

例えば、「陽」をエンコードするには、新しいメモ帳を作り、「陽」と入力してユニコードで保存し、ファイルのバイナリ内容を確認すると、FF FEの最初の2バイトがユニコードのヘッダーフラグで、次の68 67の2バイトが「陽」のユニコードエンコーディングとなります。これで、htmlファイルに「陽」と書けば、IEがそれを開いて「陽」字を表示します。IEが開くと "Yang "の文字が表示されます。

もちろん、ASCIIの場合、ユニコードのエンコーディングはASCIIのエンコーディングと同じですから、Aを大文字の「A」として表示することも可能です。

エンコードを文字に変換する

Uncaught TypeError: Cannot read property 'split' of undefined

文字を &#codeに変換する

Als Workaround können Sie .path durch .getPath() in den Zeilen git-control/lib/git-control-view.coffee:76 und git-control/lib/dialogs/project-dialog.coffee:33 ersetzen.

今回は、WebページでのUnicode文字の使用(&#,unusuなど)について紹介します。その他のUnicode関連コンテンツは、House of Scriptsの過去記事を検索するか、以下の関連記事を引き続きご覧ください。今後ともHouse of Scriptsをよろしくお願いします!