Pandas– tag –
-
【Pandas】データフレーム、シリーズの連結、重複の削除、再インデックス(concat、append、drop_duplicates、reset_index)[Python]
Pandas 今回はPythonのデータ解析支援ライブラリPandasでよくやる操作として、データフレーム、もしくはシリーズの連結、重複の削除、そして再インデックスするという流れを紹介します。 ちなみにデータフレームの連結に関してはこちらの記事でも解説して... -
【Python基礎】ファイルの書き込み方法の比較:データを処理しつつ書き込む or リストに格納して、最後に書き込む
ファイルの書き込みの比較 前回、ファイルの書き込みで「ファイルを開いて、データを全て書き込んでから閉じる」と「開いて1行書いて閉じるを繰り返す」を比較しました。 その結果、「ファイルを開いて、データを全て書き込んでから閉じる」方がよかったと... -
【Python基礎】ファイルの書き込み方法の比較:全て書き込んでから閉じる or 1行書き込んだら閉じる
ファイルの書き込みの比較 今回は何となく思ったことを試していくコーナーとして、ファイルの書き込みの際、いつファイルを閉じたらいいかを検証していきます。 どういうことかと言うと、例えばこんな感じのデータ。 1行ずつ数値データが書き込まれていま... -
【Python基礎】psutilによるメモリの使用状況の取得:メモリ使用量、メモリ使用率をグラフ化
メモリ使用状況の取得 前回、Pythonでメモリの使用状況を取得する方法として、psutilを使う方法とJupyter Notebookで表示する方法を紹介しました。 今回はそのおまけとして、取得したメモリ使用量とメモリ使用率をグラフ化してみたいと思います。 まずは前... -
【Pandas】データフレームの行、列で範囲指定して平均値などの統計値を算出する方法[Python]
Pandas 今回はPandasで特定の範囲の統計値を算出する方法に関して解説していきます。 Pandasで簡単に算出できる統計値として、前に合計値(sum)、平均値(mean)、中央値(median)、最大値(max)、最小値(min)、標準偏差(std)を紹介しました。 ただ... -
【Pandas】エクセルファイル(.xlsx)の読み書き[Python]
Pandas 色々Pandasを扱ってきて、できたらいいなと思っていたことが、エクセルファイルの読み書き。 csvファイルやtsvファイルを読み書きできて、Jupyter notebook上でテーブルを表示できると言っても、ソートして眺めたりするのにエクセルが便利だったり... -
【Pandas】データの概要の表示(head、tail、describe、info)[Python]
データ解析支援ライブラリPandas 前回はPandasの.plot()で出力されるグラフを、matplotlibの機能を使っていじってみました。 今回はグラフから離れて、Pandasでデータの概要を確認する方法を解説していきます。 これまで解説で用いてきたデータはあまり大... -
【Pandas】グラフ表示(.plot())[Python]
データ解析支援ライブラリPandas 前回はデータ解析支援ライブラリPandasで新しくデータフレームを作成する方法を解説しました。 今回はデータをグラフにする方法を解説していきたいと思います。 実はグラフに関しては前に少し解説していたりします。 その... -
【Pandas】データフレームを新規作成[Python]
データ解析支援ライブラリPandas 前回はデータ解析支援ライブラリPandasで欠損値nanを含む行や列を削除する方法を解説しました。 ここまでPandasを使って色々データを扱う方法を解説してきました。 それでだいぶPandasのデータフレームに関して理解が深ま... -
【Pandas】欠損値nanを含む行や列を削除[Python]
データ解析支援ライブラリPandas 前回はデータ解析支援ライブラリPandasで欠損値nanを平均値や中央値で置き換える方法を解説しました。 今回は欠損値nanを含む行や列を削除する方法を解説していきます。 まずは準備から。 今回は前回用いたデータと、その...