1. ホーム
  2. python

[解決済み] リスト内の重複を見つけ、それを含む別のリストを作成するにはどうすればよいですか?

2022-03-17 14:59:27

質問

Pythonのリストで重複を見つけ、その重複の別のリストを作成するにはどうすればよいですか?このリストには整数しか含まれていません。

どのように解決するのですか?

重複を排除するには set(a) . 重複を印刷するには、次のようなもの。

a = [1,2,3,2,1,5,6,5,5,5]

import collections
print([item for item, count in collections.Counter(a).items() if count > 1])

## [1, 2, 5]

なお Counter は特に効率的ではありません ( タイミング ) で、おそらくここではやりすぎでしょう。 set の方が性能が良い。このコードは、ソースの順序でユニークな要素のリストを計算します。

seen = set()
uniq = []
for x in a:
    if x not in seen:
        uniq.append(x)
        seen.add(x)

または、もっと簡潔に

seen = set()
uniq = [x for x in a if x not in seen and not seen.add(x)]    

後者のスタイルはあまりお勧めしません。 not seen.add(x) は何をしているのか(セット add() メソッドは常に None そのため not ).

ライブラリなしで、重複する要素のリストを計算すること。

seen = set()
dupes = []

for x in a:
    if x in seen:
        dupes.append(x)
    else:
        seen.add(x)

または、もっと簡潔に

seen = set()
dupes = [x for x in a if x in seen or seen.add(x)]    

リスト要素がハッシュ可能でない場合、sets/dictsは使用できず、2次時間の解決策に頼らざるを得ない(各々を比較する)。例えば

a = [[1], [2], [3], [1], [5], [3]]

no_dupes = [x for n, x in enumerate(a) if x not in a[:n]]
print no_dupes # [[1], [2], [3], [5]]

dupes = [x for n, x in enumerate(a) if x in a[:n]]
print dupes # [[1], [3]]