プログラミング– tag –
-
Programming
【Scikit-learn】機械学習用データの標準化(Standardization)と正規化(Normalization)[Python]
機械学習ライブラリScikit-learn 前回、機械学習ライブラリScikit-learnのボストンの住宅価格を予想するのにRidgeRegressionモデルとSVRモデルを使って機械学習してみました。 しかしどのモデルもLinearRegressionモデルと比べて、劇的に精度が向上すると... -
Programming
【Scikit-learn】ボストン住宅価格をRidgeRegressionモデル、SVRモデルで機械学習[Python]
機械学習ライブラリScikit-learn 前回、機械学習ライブラリScikit-learnのボストンの住宅価格を予想するのにLassoモデルとElasticNetモデルを使ってみました。 ただ結果としては残念なことに、線形回帰(LinearRegression)と比べて、どちらのモデルも予想... -
Programming
【Scikit-learn】ボストン住宅価格をLassoモデル、Elastic Netモデルで機械学習[Python]
機械学習ライブラリScikit-learn 前回、機械学習ライブラリScikit-learnのボストンの住宅価格を予想するのに適切だろう機械学習モデルをマップを見て選んでみました。 機械学習のモデルマップはこんな感じでした。 選んではみたものの最後の分岐点がどちら... -
Programming
【Scikit-learn】ボストン住宅価格の最適な機械学習モデルを検討[Python]
機械学習ライブラリScikit-learn 前回、機械学習ライブラリScikit-learnのボストンの住宅価格を3種類の特徴量と6種類の特徴量を使って機械学習させ、評価してみました。 前回、予想した価格と実際の価格がどれくらい合っているかを、決定係数というものを... -
Programming
【Scikit-learn】特徴量のデータ種を変えて、ボストン住宅価格データセットを機械学習[Python]
機械学習ライブラリScikit-learn 前回、機械学習ライブラリScikit-learnのボストンの住宅価格を犯罪率(CRIM)、平均部屋数(RM)、低所得者の割合(LSTAT)を使って機械学習させ、評価してみました。 今回はさらに関連性がありそうなこちらの3つのデータ... -
Programming
【Scikit-learn】ボストンの住宅価格を線形回帰(Linear Regression)モデルを使って機械学習[Python]
機械学習ライブラリScikit-learn 前回、機械学習ライブラリScikit-learnのボストンの住宅価格と他の特徴量をグラフにして、どの特徴量が関連しているのか検討しました。 その結果では、高い関連性があるのは、こちらの3つでした。 犯罪率(CRIM)平均部屋... -
Programming
【Scikit-learn】ボストンの住宅価格のデータを可視化[Python]
機械学習ライブラリScikit-learn 前回、機械学習ライブラリScikit-learnに含まれるボストンの住宅価格のデータセットを読み込み、大まかにデータを眺めてみました。 このボストンの住宅価格のデータでは、最終的にある条件の住宅の価格を予想したいので、... -
Programming
【Scikit-learn】ボストンの住宅価格のデータセットを確認[Python]
機械学習ライブラリScikit-learn 前回まで機械学習ライブラリScikit-learnのiris(アヤメ)のデータセットを使って、機械学習の手法の一種サポートベクターマシンの解説をしてきました。 今回からはデータセットを変えて、また機械学習の別の手法を学んで... -
Programming
【Scikit-learn】SVMで学習させるデータの量を変えてみる[Python]
機械学習ライブラリScikit-learn 前回は機械学習ライブラリScikit-learnのiris(アヤメ)のデータセットをmlxtendを使って分類の境界を可視化してみました。 今回は機械学習に用いるデータの量を変えた場合、正解率にどのように影響が出るのかを試してみま... -
Programming
【Scikit-learn】SVMで行った分類の境界をmlxtendで可視化[Python]
機械学習ライブラリScikit-learn 前回は機械学習ライブラリScikit-learnのiris(アヤメ)のデータセットの4種類の特徴量データを使って機械学習してみました。 次に特徴量のデータ数を変えて、正解率にどのような影響があるのかを試していきたいのですが、...