1. ホーム
  2. r

[解決済み] 大量のdata.frameをマージする[重複]。

2023-06-18 08:58:17

質問

重複の可能性があります。

リスト内の複数のデータフレームを同時にマージする

data.frames :

 df1 = data.frame(id=c('1','73','2','10','43'),v1=c(1,2,3,4,5)) <br>
 df2 = data.frame(id=c('7','23','57','2','62','96'),v2=c(1,2,3,4,5,6)) <br>
 df3 = data.frame(id=c('23','62'),v3=c(1,2)) <br>

id はそれぞれのdata.frameで一意です。結果の行列を次のようにしたい

1      1 NA NA 
2      3  4 NA 
7      NA 1 NA 
10     4 NA NA 
23     NA 2  1 
43     5 NA NA 
57     NA 3 NA 
62     NA 5  2 
73     2 NA NA 
96     NA 6 NA

この場合、私は3つのデータセットしか表示しませんが、実際には少なくとも22のデータセットがあるので、最終的にはnx(22+1)の行列が必要です(nは22のデータセットすべてのIDの数)。

2つのデータセットがあるとして、それらの ids を最初の列に、2番目と3番目の列は値で埋められ、値が存在しない場合は、入力 NA を入力します。

どのように解決するのですか?

の中に入れてください。 list を使用し mergeReduce

Reduce(function(x, y) merge(x, y, all=TRUE), list(df1, df2, df3))
#    id v1 v2 v3
# 1   1  1 NA NA
# 2  10  4 NA NA
# 3   2  3  4 NA
# 4  43  5 NA NA
# 5  73  2 NA NA
# 6  23 NA  2  1
# 7  57 NA  3 NA
# 8  62 NA  5  2
# 9   7 NA  1 NA
# 10 96 NA  6 NA

また、より簡潔なこのバージョンも使用できます。

Reduce(function(...) merge(..., all=TRUE), list(df1, df2, df3))