1. ホーム
  2. unit-testing

[解決済み] 例:無効なutf8文字列?

2022-05-15 18:29:54

質問

私のコードの一部が不正なデータを処理する方法をテストしており、無効なUTF-8であるいくつかのバイトのシリーズが必要です。

いくつかの、そして理想的には、なぜそれらが悪いのか/どこでそれらを得たのかの説明を投稿できますか?

どのように解決するのですか?

を見てみましょう。 Markus Kuhn の UTF-8 デコーダーの能力とストレス テスト ファイルを参照してください。

孤独な開始バイト、継続バイトの欠落、オーバーロング シーケンスなど、多くの UTF-8 の不規則性の例を見つけることができます。