1. ホーム
  2. Web制作
  3. ヒントとコツ

ジャケットはutf-8で使用可能です。

2022-01-01 23:35:20
{ジャケット 選択できる場合は、UTF-8を使用する必要があります

実は、Windowsはすでに自社のプログラムをすべてUnicodeに切り替えており、GBKは中国標準に対応するための応急処置に過ぎないのです。

GBKの文字コードは2バイト、つまり中国語も英語も2バイトで表現されますが、中国語を区別するために最上位ビットを1にすることを除いては、2バイトで表現されます。

UTF-8エンコーディングについては、国際的な文字を解決するために用いられるマルチバイトエンコーディングで、英語は8ビット(=1バイト)、中国語は24ビット(=3バイト)使用します。英語の文字が多い掲示板では、スペースを節約するためにUTF-8が使われます。

GBKにはすべての漢字が含まれています。

UTF-8は、世界のすべての国で必要とされるすべての文字が含まれています。

GBKは、国家規格であるGB2312を拡張して互換性を持たせたもの(まだ国家規格にはなっていないようです)

UTF-8でエンコードされたテキストは、UTF-8文字セットに対応した各国の各種ブラウザで表示することが可能です。
例えば、UTF8でエンコードされていれば、外国人の英語版IEで、IE用の中国語対応パッケージをダウンロードしなくても、中国語が表示されるようになるのです。

つまり、英語の多い掲示板では、GBKを使うと1文字あたり2バイト、UTF-8の英語を使うと1バイトで済むのです。

注意:UTF-8版は国際互換性に優れていますが、中国語版はGBK/BIG5版に比べて50%以上のデータベース保存容量を必要とするため、推奨されず、国際互換性に特別な要件を持つユーザーのみが使用する必要があります。

簡単に説明すると
中国語が多いフォーラムでは、データベースの容量を節約するためにGBKエンコードを使用するのが適切です。
英語が多いフォーラムでは、UTF-8を使用してデータベーススペースを節約してください。

gbkとgb2312の違いは何ですか?

まず、gbkとは何か、gb2312とは何かを理解する必要があります。どちらも文字符号化方式の一つですが、もちろん文字符号化方式にはさまざまな種類があります。

そして、文字コードはこのように理解することができます。

コンピュータには0と1の2進数の値が格納されています。

8ビットが1バイトに相当し、16進数で表現されることが多い。

では、0や1の様々な数字ではなく、欲しい文字をコンピュータに表示させたい場合、どのように実現すればよいのでしょうか。

ここでは、コンピュータが記憶している対応する16進数の値を、英語や中国語などの対応する文字に変換して、画面に出力させる必要があります。

つまり、エンコーディングとは、どの値がどの文字に対応するかを規定することでもあるのです。

つまり、文字コード化とは、コンピュータに格納されている非常に多くの値のうち、どの値がコンピュータの画面に表示される文字に対応するかを指定する一連のルールを定義することなのです。

まとめると、GBKとGB2312は文字コードの一種であることが理解できるのではないでしょうか?

では、両者の違いや共通点について、もう少し詳しくお話ししましょう。

似ている点

1. GBKもGB2312も16bit!

2. 通常、Webページのmetaタグの中で使用されます。

相違点

1. GBK文字コードは簡体字中国語と繁体字中国語に対応!

/p

GBKフルネーム「中国語内部コード拡張仕様」(「国家標準」であるGBK、羽生ピンインの最初の文字を「拡張」、英語名:Chinese Internal Code Specification)です。1995年12月1日に中華人民共和国情報技術標準化国家技術委員会が設立され、国家技術監督局標準化部と電子工業部科学技術品質監督局が共同で、1995年12月15日に技術監督標準化書第195号229として技術仕様の指導文書に制定した。

2、GB2312は簡体字のみ対応!

情報交換用漢字符号化文字集合は、1980年に中国標準化総局が発行し、1981年5月1日に実施された国家規格で、規格番号はGB 2312-1980である。
GB2312は、漢字6763字(主文字3755字、副文字3008字)、全角682字(ラテン文字、ギリシャ文字、日本語のひらがな、カタカナ、ロシア語のキリル文字)が収録されています。

中国語を使う中国人がメインのWebページであれば、GB2312やGBKを使うのが非常によく、テキストの保存サイズも小さくなり、メリットもあります。もし、あなたのウェブページが世界向けで、ウェブエンコーディングにGB2312とGBKを使うと、一部のコンピュータのブラウザはこのエンコーディングを持っていないので、ウェブページの中国語コンテンツは認識できないような混乱状態になります。