1. ホーム
  2. unit-testing

[解決済み] 文字コードの問題をテストするための "Lorem ipsums" ファイル一式はありますか?

2023-04-25 05:26:31

質問

レイアウトのために、私たちの有名な "Lorem ipsum" テキストを用意して、それがどのように見えるかをテストしてみましょう。

私が探しているのは、テキストファイルを読み込む際に文字エンコーディングを扱ういくつかのメソッドをテストするためにJUnitテストで使用できる、いくつかの異なるエンコーディングでエンコードされたテキストを含むファイルのセットです。

を持つ ISO 8859-1 でエンコードされたテストファイルと Windows-1252 でエンコードされたテストファイルです。Windows-1252 は、地域 80 の違いをトリガーにしなければなりません。 16 - 9F <サブ 16 . つまり、ISO 8859-1と区別するために、この領域の文字を少なくとも1つ含まなければなりません。

たぶん、最適なテストファイルのセットは、各エンコーディングのテストファイルがすべての文字を一度に含むというものです。しかし、もしかしたら、私は何も知らないかもしれませんが、私たちは皆、このエンコーディングのことが好きですよね。)

文字エンコーディングの問題のためのテスト ファイルのセットはそこにありますか?

どのように解決するのですか?

を使用してみてはいかがでしょうか? ICU のテストスイートファイルを使ってみてはどうでしょうか。あなたのテストに必要なものかどうかはわかりませんが、少なくともかなり完全なfrom/to UTFマッピングファイルを持っているようです。 ICUテストファイルのレポへのリンク