1. ホーム
  2. unicode

[解決済み] UTF-8とBOMなしUTF-8の違いは何ですか?

2022-03-19 22:49:36

質問

をつけないUTF-8と何が違うのですか? BOM ? どちらが良いのでしょうか?

解決方法は?

UTF-8 の BOM は、次のようなシーケンスです。 バイト テキストストリームの先頭にある ( 0xEF, 0xBB, 0xBF を使用すると、読者がより確実に UTF-8 でエンコードされたファイルであると推測することができます。

通常 BOM をシグナルとして使用します。 エンディアン がありますが、UTF-8ではエンディアンは関係ないので、BOMは不要です。

によると ユニコード規格 は、その UTF-8ファイルのBOMは推奨されません。 :

2.6 符号化スキーム

... BOMの使用はUTF-8では必須でも推奨でもありませんが、UTF-8データがBOMを使用する他のエンコーディング形式から変換される場合、またはBOMがUTF-8署名として使用される場合に遭遇する可能性があります。の "Byte Order Mark "サブセクションを参照してください。 16.8 節、特殊 をご覧ください。