ホーム
r

[解決済み] グループごとの変数の最小値に対応する行を抽出する。

2023-02-08 16:22:32

質問

(1) データを1つの変数でグループ化したい ( State ) でグループ化し、 (2) 各グループ内で別の変数の最小値の行を見つける ( Employees )を見つけ、(3)その行全体を抽出する。

(1)と(2)は簡単な一発勝負で、(3)もそのはずなのですが、うまくいかない気がします。

ここにサンプルデータがあります。

> data
  State Company Employees
1    AK       A        82
2    AK       B       104
3    AK       C        37
4    AK       D        24
5    RI       E        19
6    RI       F       118
7    RI       G        88
8    RI       H        42

data <- structure(list(State = structure(c(1L, 1L, 1L, 1L, 2L, 2L, 2L, 
        2L), .Label = c("AK", "RI"), class = "factor"), Company = structure(1:8, .Label = c("A", 
        "B", "C", "D", "E", "F", "G", "H"), class = "factor"), Employees = c(82L, 
        104L, 37L, 24L, 19L, 118L, 88L, 42L)), .Names = c("State", "Company", 
        "Employees"), class = "data.frame", row.names = c(NA, -8L))

計算する min をグループ別に計算するのは簡単です。 aggregate :

> aggregate(Employees ~ State, data, function(x) min(x))
  State Employees
1    AK        24
2    RI        19

...または data.table :

> library(data.table)
> DT <- data.table(data)
> DT[ , list(Employees = min(Employees)), by = State]
   State Employees
1:    AK        24
2:    RI        19

しかし、これらの行に対応する行全体を抽出するにはどうすればよいでしょうか。 min の値、つまり Company を含むのですか？

どのように解決するのですか？

少しエレガントです。

library(data.table)
DT[ , .SD[which.min(Employees)], by = State]

   State Company Employees
1:    AK       D        24
2:    RI       E        19

を使用するよりも若干エレガントではありません。 .SD を使用するよりも若干劣りますが、（多くのグループを持つデータでは）少し速くなります。

DT[DT[ , .I[which.min(Employees)], by = State]$V1]

また、単に式を置き換えて which.min(Employees) を Employees == min(Employees) を使用すると、データセットに複数の同じ最小値があり、それらのすべてをサブセットしたい場合に便利です。

参照 data.tableを使用したグループによる最大値に対応する行のサブセット .

[解決済み] グループごとの変数の最小値に対応する行を抽出する。

質問

どのように解決するのですか？

関連

Rでエラー：単項演算子への引数が無効

SocketTimeoutExceptionです。読み込みがタイムアウトしました

[解決済み] lm.fit(x,y,offset = offset, singular.ok,...) 0 非NAケースでboxcox式で計算するとエラーになる。

[解決済み] R dataframeでNAの値をゼロに置き換えるには？

[解決済み] ggplot2 の軸ラベルを回転させ、間隔を空ける

[解決済み] Rでtrycatchの書き方

[解決済み] ggplotで凡例のタイトルを変更する方法

[解決済み] ベクトル中のある要素のインデックスを求めるR関数はありますか？

[解決済み】変数をグループ別に合計する方法

[解決済み] data.tableにキーを設定する目的は何ですか？

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

Rのexpand.grid()コマンド

[解決済み] Rの二乗偏差の総和の算出

[解決済み] Rでcは何をするのですか？重複] [重複

[解決済み] Rで文字列から文字を削除する

[解決済み] リストやデータフレームの要素にアクセスするためのブラケット[ ]とダブルブラケット[[ ]]の違いについて

[解決済み] リストをデータフレームに変換する

[解決済み] データフレーム内のランダムな行をサンプリングする

[解決済み】安定したマッピングを持つggplot2のカテゴリ変数に色を割り当てるには？

[解決済み】ifelse()でDateオブジェクトがnumericオブジェクトにならないようにする方法

[解決済み] 2つの単語の最初の文字を大文字にします。