1. ホーム
  2. パイソン

[解決済み】pandasのgroupbyでデータフレームの行をリストにグループ化する方法

2022-03-24 21:22:43

質問

pandasのデータフレームがあります。 df のようなものです。

a b
A 1
A 2
B 5
B 5
B 4
C 6

したい 最初のカラムでグループ化し、2番目のカラムを行のリストとして取得する。 :

A [1,2]
B [5,5,4]
C [6]

pandasのgroupbyを使ってこんなことは可能でしょうか?

どのように解決するのですか?

を使って行うことができます。 groupby を使用して目的の列をグループ化し、次に apply list をすべてのグループに追加します。

In [1]: df = pd.DataFrame( {'a':['A','A','B','B','B','C'], 'b':[1,2,5,5,4,6]})
        df

Out[1]: 
   a  b
0  A  1
1  A  2
2  B  5
3  B  5
4  B  4
5  C  6

In [2]: df.groupby('a')['b'].apply(list)
Out[2]: 
a
A       [1, 2]
B    [5, 5, 4]
C          [6]
Name: b, dtype: object

In [3]: df1 = df.groupby('a')['b'].apply(list).reset_index(name='new')
        df1
Out[3]: 
   a        new
0  A     [1, 2]
1  B  [5, 5, 4]
2  C        [6]