1. ホーム
  2. Web制作
  3. ヒントとコツ

ジャケットはutf-8で使用できます。

2022-01-15 06:46:02

選択できる場合はUTF-8を使用する必要があります

実際、Windows自身のプログラムは軒並みUnicodeに移行しており、GBKは中国標準に対応するための応急処置に過ぎないのです。

GBKの文字コードは2バイトで、中国語と英語の文字は2バイトで表現されますが、中国語を区別するために最上位ビットを1にすることを除けば、2バイトで表現されます。

UTF-8は国際文字に対応したマルチバイトの符号化方式で、英語は8ビット(1バイト)、中国語は24ビット(3バイト)を使用します。英語の文字が多いフォーラムでは、スペースを節約するためにUTF-8が使用されます。

GBKにはすべての漢字が含まれています。

UTF-8は、世界のすべての国で必要とされるすべての文字が含まれています。

GBKは、国家規格であるGB2312を拡張したもので、GB2312と互換性がある(まだ国家規格にはなっていないようです)

UTF-8でエンコードされたテキストは、UTF8文字セットに対応した各国の各種ブラウザで表示することが可能です。
例えば、UTF8エンコードされていれば、外国人の英語版IEで、IE用の中国語対応パッケージをダウンロードしなくても、中国語が表示されます。

つまり、英語の多い掲示板では、GBKを使うと1文字あたり2バイト、UTF-8の英語を使うと1バイトで済むのです。

注意:UTF-8版は国際的な互換性に優れていますが、中国語版はGBK/BIG5版に比べて50%以上のデータベース保存容量を必要とするため、推奨されませんので、国際互換性に特別な要件を持つユーザーのみが使用すべきです。

簡単に説明すると
中国語が多いフォーラムでは、データベース容量を節約するためにGBKエンコードを使用することが適切です。
英語が多いフォーラムでは、データベース容量を節約するためにUTF-8が適切です。

gbkとgb2312の違いは何ですか?

まず、gbkとは何か、gb2312とは何かを理解する必要があります。これらはどちらも文字エンコーディングですが、もちろん他にもさまざまな文字エンコーディングが存在します。

そして、文字コードはこのように理解することができます。

コンピュータに記憶されているのは、0と1の2進数値だけです。

8ビットが1バイトに相当し、16進数で表すのが一般的です。

では、コンピュータに表示される文字を、さまざまな0や1ではなく、欲しい文字にしたい場合、どのように実現すればいいのでしょうか。

ここでは、コンピュータが記憶している対応する16進数の値を取り出し、英語や他の言語の漢字を含む文字に変換して画面に出力させる必要があるのです。

つまり、エンコーディングとは、どの値がどの文字に対応するかを規定することでもあるのです。

つまり、文字エンコーディングとは、コンピュータに格納されている非常に多くの値のうち、どの値が、コンピュータの画面に表示されるアルファベットのどの文字に対応するかを指定する一連のルールを定義することです。

まとめると、GBKとGB2312は1つの文字コードであることが理解できるはずです。

では、両者の違いと共通点について詳しく説明しましょう。

類似している点

1. GBKもGB2312も16bit!

2. 通常、Webページのmetaタグの中で使用されます。

相違点

1. GBKの文字コードは、簡体字中国語と繁体字中国語をサポートしています!

GBKは、中国語内部符号拡張仕様(GBK is the "national standard", "extension" of the first letter of the hanyu pinyin, English name: Chinese Internal Code Specification)の正式名称である。中華人民共和国情報技術標準化国家技術委員会が1995年12月1日に策定し、国家技術監督局標準化部、電子工業部科学技術品質監督局が共同で、1995年12月15日に技術監督標準化書第195号229として技術仕様に関する指導文書として制定した。

2. GB2312は簡体字中国語のみ対応!

情報交換用漢字符号化文字集合は、1980年に中国標準化総局が発行し、1981年5月1日に実施された国家規格であり、規格番号はGB 2312-1980である。
GB2312規格には、3755文字の一次文字と3008文字の二次文字を含む6763文字の漢字が含まれ、同時に、ラテン文字、ギリシャ文字、日本語のひらがな、カタカナ、ロシアのキリル文字を含む682文字の全角文字が含まれています。

中国語圏の方を主な対象としたWebページであれば、GB2312やGBKを使用すると、テキストの保存容量が小さくなるというメリットもあり、非常に良いと思います。もし、あなたが作成したウェブページが世界向けのものだった場合、GB2312とGBKをウェブエンコーディングとして使用すると、あなたのコンピュータのブラウザによってはこのエンコーディングを持たないものがあり、ウェブページの中国語コンテンツが認識できない失語症になってしまうのです。