PandasライブラリでExcelデータを操作する

PandasライブラリでExcelデータを操作するPandas
ゆうすけ
ゆうすけ

PandasでExcelデータを扱いたいんですけど…

資格マフィア
資格マフィア

PandasライブラリとExcelデータは親和性が高いぞ。

 

✔️ 本記事のテーマ

PandasライブラリでExcelデータを操作する

 

✔️ 読者さんへの前置きメッセージ

本記事は「PandasライブラリでExcelデータを扱う方法」について書いています。

 

この記事を読むことで
「Excelデータを扱うための手順 や 使用する関数」
を理解できます。

 

Pandasはデータ分析によく使われるPythonライブラリです。

 

Pandasを使うことで、PythonからExcelデータを操作することが出来ます。

 

なお、Pandasについては
PythonライブラリのPandasを徹底解説!」の記事でも詳しく解説しています。

 

この記事では、PythonからExcelファイルを読み込んで、
データを操作する方法についてコードベースで解説していきます。

 

それでは、PandasでExcelデータを操作する方法について解説していきましょう。

 

PandasでExcelファイルを扱うための準備

PandasでExcelファイルを扱うための準備

Pandasでexcelを読み込むためには
「Pandas」及び「Pandasが内部で使用しているライブラリ」
をインストールする必要があります。

 

以下のライブラリをインストールしておきましょう。

  • pandas
  • xlwt
  • xlrd
  • openpyxl

いずれもpipでインストールできるので、以下のコマンドを実行すればOKです。

 

pip install pandas, xlwt, xlrd, openpyxl
# 環境によっては以下のコマンド
# pip3 install pandas, xlwt, xlrd, openpyxl

 

これでPythonでexcelファイルを扱うための準備が完了しました。

 

次からexcelファイルを読み込む方法について解説していきましょう。

 

PandasでExcelファイルを読み込む

PandasでExcelファイルを読み込む

Pandasライブラリを使って、
PythonからExcelを読み込むにはpandas.read_excel()関数を使います。

 

pandas.read_excelの使い方は以下の通りです。

pandas.read_excel(‘Excelファイルのパス’)

Excelファイルのファイルパスを引数として渡すだけで、
読み込むことができるので簡単に使えます。

 

コードで示しましょう。

 

import pandas as pd


df = pd.read_excel('tmp/sample.xlsx')

 

読み込んだExcelファイルのデータはPandasのDataFrameというデータ型で保持されます。

 

DataFrameは表形式のデータ型なので、
Excelの表をそのままデータとして持つイメージです。

 

なお、PandasのDataFrameについては
PandasのDataFrameを徹底解説【コード付き】の記事で解説しています。

 

Pandasで読み込んだExcelデータを表示する

Pandasで読み込んだExcelデータを表示する

Pandasで読み込んだExcelデータを表示してみましょう。

 

最も簡単なのはprint()でDataFrameを丸ごと表示させるやり方です。

 

以下のようなExcelを読み込んで、表示させてみましょう。

Pandas_Excel

import pandas as pd


sample = pd.read_excel('tmp/sample.xlsx')

print(sample)
#            One  Two  Three
# America    1    2    3
# Brazil     4    5    6
# Cuba       7    8    9

 

さらに、列ごとに表示や行ごとに表示する方法もあります。

 

print(sample['One'])

PandasでExcelデータを列表示

print(sample[1:])

PandasでExcelデータを行表示

このようにDataFrameとしてExcelデータを取り込むことで、
様々な方法でデータにアクセスすることが出来ます。

 

Pandasについてもっとスキルをつけるなら

Pandasについてもっとスキルをつけるなら

今回は、PandasでExcelデータを読み込む方法について解説しました。

 

Pandasはデータサイエンスの世界でよく使われるライブラリです。

 

Pandasについて基礎から実用まで学ぶためには以下の書籍がオススメです。

 

この書籍はPandasライブラリについて徹底解説されています。

Pandasライブラリは表計算ライブラリの使い方を理解していないと
その威力を存分に発揮できないのですがこの書籍はこの辺を上手に説明してくれています。

また、ライブラリ自体の解説だけでなく
機械学習において大事なデータクレンジングの方法など実践的な内容まで解説されています。

 

Pandasについて学びたい方や機械学習の精度を上げたい方にはオススメの書籍です。

エンジニアとしての自身の価値をチェックする(完全無料)

エンジニアとして、

自分の価値がどれくらいのものかご存知でしょうか?

 

エンジニアとしてIT業界に身を置いていると

今の会社でずっと働くのか、フリーランスとして独立するのか …

と様々な選択肢があります。

 

どの選択肢が正解なのかを見極めるためにも、選択肢を広げるためにも

自身の価値を知っておくことはとても重要です。

 

TechClips ME では、

職務経歴書をアップロードするだけで企業からのスカウトを受けることができます。

▼▼▼▼▼

▲▲▲▲▲

しかもTechClips MEでは想定年収を企業から提示してくれるので、

自身の価値を数字で分かりやすくたしかめることができます。

 

登録はもちろん完全無料なので、一度登録してみると良いかもしれません。

 

コメント

タイトルとURLをコピーしました