NumPy
前回、itertoolsのdropwhile、takewhile、filterfalse、starmapの使い方を紹介しました。
data:image/s3,"s3://crabby-images/97192/97192af90e15bdcf46d790b999c7365d40e6aa94" alt=""
今回はNumPyを使って任意の平均・標準誤差をもつガウス分布(正規分布)を作る方法を紹介します。
それでは始めていきましょう。
ジェネレータを使う方法
まずはジェネレータを使い、その中の正規分布の乱数である「normal」を使って任意の平均・標準誤差をもつガウス分布(正規分布)を作ってみましょう。
ちなみにNumPy randomモジュールのジェネレータの使い方はこちらの記事で解説していますので、よかったらどうぞ。
data:image/s3,"s3://crabby-images/1c9db/1c9db16cad4992c71897b4bffb4ab7425a11c015" alt=""
ジェネレータを使う場合は「rng = np.random.default_rng()」としてインスタンスを生成します。
そしてnormal(正規分布)を使う場合は「rng.normal(mu, sigma, サンプル数)」とします。
muは平均値、sigmaは標準誤差です。
import numpy as np
import matplotlib.pyplot as plt
samples = 100000
mu = 50
sigma = 5
rng = np.random.default_rng(0)
data = rng.normal(mu, sigma, samples)
fig = plt.figure()
plt.clf()
plt.hist(data, bins=100)
plt.show()
実行結果
data:image/s3,"s3://crabby-images/7f84b/7f84b296704bae7fa9a6568428e740e37ae79e66" alt=""
もしくは「mu + sigma * rng.normal(size=サンプル数)」とします。
import numpy as np
import matplotlib.pyplot as plt
samples = 100000
mu = 50
sigma = 5
rng = np.random.default_rng(0)
data = mu + sigma * rng.normal(size=samples)
fig = plt.figure()
plt.clf()
plt.hist(data, bins=100)
plt.show()
実行結果
data:image/s3,"s3://crabby-images/364eb/364ebb36d9105b689deadd7d851e863836d5e46d" alt=""
ジェネレータを使う場合、もう一つ「rng.standard_normal(サンプル数)」も使うことができます。
こちらは平均0、 標準偏差1の正規分布の乱数を生成する関数です。
そのためmuとsigmaを引数には取れず、サンプル数のみを取りますので、ご注意ください。
つまり「mu + sigma * rng.standard_normal(サンプル数)」のみ使うことができます。
import numpy as np
import matplotlib.pyplot as plt
samples = 100000
mu = 50
sigma = 5
rng = np.random.default_rng(0)
data = mu + sigma * rng.standard_normal(samples)
fig = plt.figure()
plt.clf()
plt.hist(data, bins=100)
plt.show()
実行結果
data:image/s3,"s3://crabby-images/743f7/743f7c675a42b9272661b198ea655d40d815cc6f" alt=""
np.random.normalを使う方法
またジェネレータと使わない場合の、rng.normalと同じ関数は「np.random.normal」です。
rng.normalと全く同じ使い方ができ、「np.random.normal(mu, sigma, サンプル数)」でも「mu + sigma * np.random.normal(size=samples)」でも使えます。
import numpy as np
import matplotlib.pyplot as plt
samples = 100000
mu = 50
sigma = 5
data = np.random.normal(mu, sigma, samples)
fig = plt.figure()
plt.clf()
plt.hist(data, bins=100)
plt.show()
実行結果
data:image/s3,"s3://crabby-images/64e53/64e53eee4649a023462441e044cd9a229dd80d21" alt=""
import numpy as np
import matplotlib.pyplot as plt
samples = 100000
mu = 50
sigma = 5
data = mu + sigma * np.random.normal(size=samples)
fig = plt.figure()
plt.clf()
plt.hist(data, bins=100)
plt.show()
実行結果
data:image/s3,"s3://crabby-images/8ad91/8ad918017daa743e462a116a45c430d98bfe77d6" alt=""
また「rng.standard_normal(サンプル数)」に当たるものが「np.random.randn(サンプル数)」です。
import numpy as np
import matplotlib.pyplot as plt
samples = 100000
mu = 50
sigma = 5
data = mu + sigma * np.random.randn(samples)
fig = plt.figure()
plt.clf()
plt.hist(data, bins=100)
plt.show()
実行結果
data:image/s3,"s3://crabby-images/6f7e5/6f7e51418c28178dadf5923dd460a4e3d89c581f" alt=""
今回は任意の平均・標準誤差をもつガウス分布(正規分布)を作る方法として、ジェネレータを使う方法、使わない方法を紹介しました。
ただ今後は乱数を取得するのに、どうやらジェネレータを使う方が速く、今後主流になっていく様です。
ということでできる限りジェネレータを使って書く方に慣れていくのがいいでしょう。
次回はmatplotlibでバイオリンプロット(Violin Plot)を描く方法を紹介します。
ではでは今回はこんな感じで。
コメント