Kaggle
前回は機械学習・データサイエンスのプラットフォーム「Kaggle(カグル)」の一番基本なデータセット「タイタニック号乗客の生存予測」の生存予想データを作成しました。
今回は作成した生存予想データをKaggleに提出してみます。
そのために前回、準備したデータは2つ。
フォーマットが合わず、提出に失敗するだろう「submit_data_fail.csv」と、フォーマットを合わせてた「submit_data_success.csv」です。
ちなみに「submit_data_fail.csv」はこんなフォーマットです。
そして「submit_data_success.csv」はこんな感じ。
それでは提出してみましょう。
フォーマットが間違っているファイルを提出してみる
それではまずは失敗するだろう「submit_data_fail.csv」を提出してみることにします。
Kaggleにログインし、「タイタニック号乗客の生存予測」のページに行きます。
そしてページ右上の「Submit Prediction」をクリック。
「Submit Prediction」のページに移ったら、下にスクロールして「Step 1 Upload submission file 」を探し、上矢印のマークをクリックします。
ファイルエクスプローラが開くので「submit_data_fail.csv」をクリックして、さらに「開く」をクリック。
アップロードが完了すると、「✔︎ファイル名」が表示されます。
「Step 2 Describe submission」は備考欄のようなものなので、何か覚書的に必要なものがあれば入力してください。
よければ「Make Submission」をクリックして、データを提出します。
提出が完了すると、上の方に結果が出ます。
今回のデータはフォーマットが異なるため、エラーとなりました。
「Unexpected Column: “” (Line 1, Column 1)」ということで最初の列がフォーマットとして正しくないということでした。
正しいフォーマットのファイルを提出してみる
では次は正しいフォーマットである「submit_data_success.csv」を提出してみます。
すると緑の背景に「Complete」が表示され、正しく提出されたことが分かります。
そして右の方の「Score 0.77272」が今回提出した予想データのスコアになります。
正答率的には77.2%ということでなかなかいい数字ではないでしょうか。
「Jump to your position on the leaderboard」をクリックするとランキング上の自分の場所が表示されます。
106位かと思いきや、10609位です。
この順位を見ると、かなり多くの人がこのデータセットに参加していることが分かります。
ここからはスコアが少しでも良くなり、この順位が少しでも上がるよう機械学習モデルの改善をしていきましょう。
ということで今回はこんな感じで。
コメント