1. ホーム
  2. python

[解決済み] 数字を含む文字列を正しくソートするには?重複

2022-05-10 07:19:27

質問

数字を含む文字列のリストがありますが、それらをソートする良い方法を見つけることができません。

例えば、私はこのようなものを得ます。

something1
something12
something17
something2
something25
something29

sort() というメソッドがあります。

私はおそらく何らかの方法で数字を抽出し、それからリストを並べ替える必要があることを知っていますが、最も簡単な方法でそれを行う方法が全く分かりません。

どのように解決するのですか?

おそらく、あなたが探しているのは ヒューマンソート (またの名を ナチュラルソート ):

import re

def atoi(text):
    return int(text) if text.isdigit() else text

def natural_keys(text):
    '''
    alist.sort(key=natural_keys) sorts in human order
    http://nedbatchelder.com/blog/200712/human_sorting.html
    (See Toothy's implementation in the comments)
    '''
    return [ atoi(c) for c in re.split(r'(\d+)', text) ]

alist=[
    "something1",
    "something12",
    "something17",
    "something2",
    "something25",
    "something29"]

alist.sort(key=natural_keys)
print(alist)

イールド

['something1', 'something2', 'something12', 'something17', 'something25', 'something29']

PS. 私の答えはToothyの自然なソートの実装を使うように変更しました(コメントで投稿された はこちら ) を使用するように変更しました。これは私の元の答えよりもかなり速いからです。


テキストを浮動小数点数でソートしたい場合は、正規表現をint型にマッチするものから変更する必要があります (すなわち (\d+) のように) から 浮動小数点にマッチする正規表現 :

import re

def atof(text):
    try:
        retval = float(text)
    except ValueError:
        retval = text
    return retval

def natural_keys(text):
    '''
    alist.sort(key=natural_keys) sorts in human order
    http://nedbatchelder.com/blog/200712/human_sorting.html
    (See Toothy's implementation in the comments)
    float regex comes from https://stackoverflow.com/a/12643073/190597
    '''
    return [ atof(c) for c in re.split(r'[+-]?([0-9]+(?:[.][0-9]*)?|[.][0-9]+)', text) ]

alist=[
    "something1",
    "something2",
    "something1.0",
    "something1.25",
    "something1.105"]

alist.sort(key=natural_keys)
print(alist)

イールド

['something1', 'something1.0', 'something1.105', 'something1.25', 'something2']