【NumPy】重複のないランダムな数値のリストを作成する方法[Python]

2025年2月14日

URLをコピーしました！

NumPy

前回、NumPyで多次元配列をソートしてそのインデックスを返すargsortを紹介しました。

１．ランダムにピックし、リストにないものを追加

まず試したのが、ランダムに数値をピックし、リストに加えていきます。

ただしリストに追加する際、リストに存在しない数値だった場合だけ追加すると言う方法です。

自作関数を作成しますが、「int_nooverlap(start, end, samples)」として、取得する数値のリストの範囲を「start」と「end」で指定し、取得する数値の数を「samples」として指定しています。

import numpy as np
import sys

def int_nooverlap(start, end, samples):
    if end - start < samples:
        print("Sample number should be less than numbers from start to end.")
        sys.exit(1)
    else:
        rng = np.random.default_rng()
        data = []
        while len(data) < samples:
            pick_data = rng.integers(start, end)
            if not pick_data in data:
                data.append(pick_data)
        return data

data = int_nooverlap(0, 10, 10)

print(data)

作成した関数の最初の３行は準備する数値の数よりも、取得する数の方が多い場合、必ず重複がでてしまうので、それを避けるためのエラー処理です。

最後に「sys.exit(1)」でエラーとしてプログラムを終了しています。

if end - start < samples:
    print("Sample number should be less than numbers from start to end.")
    sys.exit(1)

ちなみに「sys.exit()」に関してはこちらの記事で紹介していますので、良かったらどうぞ。

２．数値のリストを作成し、そこから一つずつランダムに取得

次にまずは数値の範囲からリストを作成し、そこから一つずつランダムに取得するという方法を試しました。

import numpy as np
import sys

def int_nooverlap(start, end, samples):
    if end - start < samples:
        print("Sample number should be less than numbers from start to end.")
        sys.exit(1)
    else:
        rng = np.random.default_rng()
        initial_data = list(range(start, end))
        data = []
        while len(data) < samples:
            pick_index = rng.integers(len(initial_data))
            data.append(initial_data[pick_index])
            del initial_data[pick_index]

        return data

data = int_nooverlap(0, 10, 10)

print(data)

先ほどのプログラムとは「else:」以降が異なっています。

まず「range関数」を使って、指定された範囲の数値のリストを作成しています。

initial_data = list(range(start, end))

そしてランダムにそのリストのインデックスを取得し、そのインデックスを使って値を別のリストdataに格納します。

格納後は元の数値のリストinitial_dataから削除します。

それをリストdataに格納された要素数が変数samplesに達するまで繰り返します。

while len(data) < samples:
    pick_index = rng.integers(len(initial_data))
    data.append(initial_data[pick_index])
    del initial_data[pick_index]