ホーム
r

重複している行のインデックスを探す [duplicate］

2023-09-01 01:50:31

質問

Rで重複している行の検索を行う関数です。重複を削除したい場合は、以下のように記述するだけです。 df[!duplicated(df),] と書くだけで、データフレームから重複が削除されます。

しかし、重複したデータのインデックスを見つけるにはどうしたらよいでしょうか。もし duplicated が TRUE を返した場合、それはデータフレーム内でその行が 2 回目に出現したことを意味し、そのインデックスは簡単に取得することができます。この行の最初のインデックスを得るにはどうしたらよいでしょうか？または、言い換えれば、複製された行が同一であるインデックスを取得する方法はありますか？

私はdata.frame上でループを作ることができましたが、私はこの質問についてよりエレガントな答えがあると思います。

どのように解決するのですか？

以下に例を示します。

df <- data.frame(a = c(1,2,3,4,1,5,6,4,2,1))

duplicated(df) | duplicated(df, fromLast = TRUE)
#[1]  TRUE  TRUE FALSE  TRUE  TRUE FALSE FALSE  TRUE  TRUE  TRUE

どのように機能するのか？

機能 duplicated(df) は、元データの重複要素を判定します。その fromLast = TRUE は、"重複は裏側から考えるべきであることを示します"。結果として得られる2つの論理ベクトルは | で結合されます。 TRUE は重複した値を示しているからです。

重複している行のインデックスを探す [duplicate］

質問

どのように解決するのですか？

どのように機能するのか？

関連

[解決策】 plot.new() のエラー：図の余白が大きすぎる。

[解決済み] PandasでDataFrameの行を反復処理する方法

[解決済み] 列の値に基づいてDataFrameから行を選択するにはどうすればよいですか？

[解決済み] 重複した行を削除するにはどうすればよいですか？

[解決済み] Notepad++で重複した行を削除する

[解決済み] ファイル内の重複行を探し、各行が何回重複しているかをカウントする？

[解決済み] ベクトル中のある要素のインデックスを求めるR関数はありますか？

[解決済み] 重複するインデックスを持つpandasの行を削除する

[解決済み] [Solved] data.frameで全てまたは一部のNA（欠損値）を含む行を削除する。

[解決済み] data.table内の重複・非一意な行のフィルタリング

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

SocketTimeoutExceptionです。読み込みがタイムアウトしました

[解決済み] 重複した行を削除する

[解決済み] Rでデータフレームに行を追加する方法は？

[解決済み] Rで複数行のコメントを持つことは可能ですか？[重複している]。

[解決済み] データフレーム列の名前によるドロップ

[解決済み】ifelse()でDateオブジェクトがnumericオブジェクトにならないようにする方法

[解決済み】Rスクリプトで警告をグローバルに抑制する方法

[解決済み] ggplot2 で個々のファセットにテキストをアノテートする

[解決済み] "添え字が小さい要素 "を含む、重複する行をすべて見つける

[解決済み] dplyrで重複する要素を検索する