Pandas– tag –
-
【Pandas】シリーズの作成と要素の追加・削除[Python]
【Pandas】 前回、Pythonのデータ解析支援ライブラリPandasでよくやる操作として、データフレーム、もしくはシリーズの連結、重複の削除、そして再インデックスするという流れを紹介しました。 その記事を書いていて思ったのが、Series(シリーズ)の使い... -
【Pandas】データフレーム、シリーズの連結、重複の削除、再インデックス(concat、append、drop_duplicates、reset_index)[Python]
【Pandas】 今回はPythonのデータ解析支援ライブラリPandasでよくやる操作として、データフレーム、もしくはシリーズの連結、重複の削除、そして再インデックスするという流れを紹介します。 ちなみにデータフレームの連結に関してはこちらの記事でも解説... -
【Python基礎】ファイルの書き込み方法の比較:データを処理しつつ書き込む or リストに格納して、最後に書き込む
【ファイルの書き込みの比較】 前回、ファイルの書き込みで「ファイルを開いて、データを全て書き込んでから閉じる」と「開いて1行書いて閉じるを繰り返す」を比較しました。 その結果、「ファイルを開いて、データを全て書き込んでから閉じる」方がよかっ... -
【Python基礎】ファイルの書き込み方法の比較:全て書き込んでから閉じる or 1行書き込んだら閉じる
【ファイルの書き込みの比較】 今回は何となく思ったことを試していくコーナーとして、ファイルの書き込みの際、いつファイルを閉じたらいいかを検証していきます。 どういうことかと言うと、例えばこんな感じのデータ。 1行ずつ数値データが書き込まれて... -
【Python基礎】psutilによるメモリの使用状況の取得:メモリ使用量、メモリ使用率をグラフ化
【メモリ使用状況の取得】 前回、Pythonでメモリの使用状況を取得する方法として、psutilを使う方法とJupyter Notebookで表示する方法を紹介しました。 今回はそのおまけとして、取得したメモリ使用量とメモリ使用率をグラフ化してみたいと思います。 まず... -
【Pandas】特定の範囲において平均値などの統計値を算出する方法[Python]
【Pandas】 今回はPandasで特定の範囲の統計値を算出する方法に関して解説していきます。 Pandasで簡単に算出できる統計値として、前に合計値(sum)、平均値(mean)、中央値(median)、最大値(max)、最小値(min)、標準偏差(std)を紹介しました。 ... -
【Pandas】エクセルファイル(.xlsx)の読み書き[Python]
【Pandas】 色々Pandasを扱ってきて、できたらいいなと思っていたことが、エクセルファイルの読み書き。 csvファイルやtsvファイルを読み書きできて、Jupyter notebook上でテーブルを表示できると言っても、ソートして眺めたりするのにエクセルが便利だっ... -
【Pandas】データの概要の表示(head、tail、describe、info)[Python]
【データ解析支援ライブラリPandas】 前回はPandasの.plot()で出力されるグラフを、matplotlibの機能を使っていじってみました。 今回はグラフから離れて、Pandasでデータの概要を確認する方法を解説していきます。 これまで解説で用いてきたデータはあま... -
【Pandas】.plot()で出力されたグラフをいじってみる その2[Python]
【データ解析支援ライブラリPandas】 前回はデータ解析支援ライブラリPandasで出力できるグラフを色々といじる方法を解説しました。 前回はPandasの.plot()の機能を使って、グラフの体裁を整えてみました。 今回はPandasの.plot()の機能ではなく、matplotl... -
【Pandas】.plot()で出力されたグラフをいじってみる その1[Python]
【データ解析支援ライブラリPandas】 前回はデータ解析支援ライブラリPandasで出力できるグラフを紹介しました。 その際、「.plot()」というコマンドを使ってグラフ表示を行いましたが、今回はこの「.plot()」のオプションを使ってグラフの見栄えを修正し...