1. ホーム
  2. r

[解決済み] 重複した行を削除する

2022-03-05 01:32:54

質問

を読みました。 CSV ファイルをRのdata.frameに変換しています。いくつかの行は、列の1つに同じ要素を持っています。その列で重複している行を削除したい。例えば

platform_external_dbus          202           16                     google        1
platform_external_dbus          202           16         space-ghost.verbum        1
platform_external_dbus          202           16                  localhost        1
platform_external_dbus          202           16          users.sourceforge        8
platform_external_dbus          202           16                    hughsie        1

他の行は最初の列に同じデータを持っているので、これらの行のうちの1つだけが欲しいのです。

解決方法は?

データフレームを必要なカラムに分離し、ユニーク関数を使用するだけです。

# in the above example, you only need the first three columns
deduped.data <- unique( yourdata[ , 1:3 ] )
# the fourth column no longer 'distinguishes' them, 
# so they're duplicates and thrown out.