PythonでExcelデータの読み込みを行う方法

PythonでExcelデータの読み込みを行う方法Pandas
ゆうすけ
ゆうすけ

PyhonでExcelデータの読み込みをしてみたいです。

資格マフィア
資格マフィア

Pandasライブラリを使うことで、
PythonからExcelデータの読み込みが簡単に行えるぞ。

 

✔️ 本記事のテーマ

PythonからExcelデータを読み込みを行う方法


✔️ 読者さんへの前置きメッセージ

本記事は「PythonからExcelデータを読み込みを行う方法」について書いています。

 

この記事を読むことで
「Excelデータを読み込む方法 や pandasライブラリの使い方」を理解できます。

 

普段の作業や業務でExcelファイルを使う事は多いでしょう。

 

PythonからExcelデータを読み込むことで
Excel上で行っている面倒な作業を自動化することができます。

 

そこで今回はPythonプログラムからExcelファイルを読み込んでデータ操作を行う方法を
サンプルコードとともに解説します。

 

この記事に掲載しているサンプルコードは環境さえ整っていれば、
コピペで動くはずなので使用して頂いてOKです。

 

では、解説していきましょう。

 

【PythonからExcelの読み込み】の前準備

【PythonからExcelの読み込み】の前準備

まずPythonからExcelの読み込みを行うには
いくつかのライブラリをインストールする必要があります。

 

以下のコマンドでインストールしましょう。

pip install pandas, xlwt, xlrd, openpyxl

 

なお、Pandasライブラリのインストールについては
別の記事で詳しく解説しているので参考にしてみて下さい。

 

【PythonからExcelの読み込み】をする方法

【PythonからExcelの読み込み】をする方法

上記の準備が完了していれば後は簡単です。

 

Pandasのread_excel関数を使うことでExcelファイルの読み込みを行うことができます。

pandas.read_excel(‘Excelファイルのパス’)

実際のコードで解説しましょう。

import pandas as pd


df = pd.read_excel('./sample.xlsx')

 

このように書くことでExcelファイルを読み込んで、dfという変数に格納しています。

 

なお、この変数にはPandasのDataFrame型でデータが格納されます。

 

DataFrame型は表形式のPandas独自のデータ型のことです。

 

PandasのDataFrame型については
PandasのDataFrameを徹底解説【コード付き】」の記事で詳しく解説しています。

 

Excelから読み込みしたデータをPythonで操作する

Excelから読み込みしたデータをPythonで操作する

Pythonから読み込んだExcelデータはPandasライブラリを通して簡単に操作できます。

 

例えば、次のようなExcelファイルを読み込むとします。

Pandasからexcelを読み込む

 

先ほど解説したようにPandasのread_excel関数を使ってデータを読み込みましょう。

import pandas as pd


df = pd.read_excel('./sample.xlsx')

print(df)
#    年  組  氏名
# 0  2  A  田中
# 1  1  B  鈴木
# 2  3  A  佐藤
# 3  1  C  加藤
# 4  2  E  山田

Pythonならこのデータに対して
「特定の条件にマッチしたものだけ抜き出す」といったこともできます。

 

試しに「組」が「A」のデータだけ抜き出してみましょう。

A_df = df[df['組'] == 'A']

print(A_df)
#    年  組  氏名
# 0  2  A  田中
# 2  3  A  佐藤

 

このようにPythonからExcelを読み込むことで簡単にデータ操作を行えます。

 

なお、Pandasのデータ操作については
PythonライブラリのPandasを徹底解説!」の記事で詳しく解説しています。

 

PythonからExcelへデータを書き出す

PythonからExcelへデータを書き出す

Pythonで加工を行ったデータをExcelに書き出すには、Pandasのto_execl関数を使います。

 

先ほど加工したデータA_dfをafter.xlsxという名前で書き出してみましょう。

A_df.to_excel('./after.xlsx', sheet_name='new_sheet')

 

このように書くことでExcelデータとして書き出すことができます。

 

ちなみに引数sheet_nameは省略するとsheet1という名称になります。

 

なお、PythonからExcelへの書き込みについては
別の記事で詳しく解説しています。

 

「Python」や「Excel読み込み」についてもっとスキルをつけるなら

「Python」や「Excel読み込み」についてもっとスキルをつけるなら

今回は、Pandasのread_csv関数について解説しました。

 

Pandasはデータサイエンスの世界でよく使われるライブラリです。

 

PandasのDataFrameについてスキルをつけるなら、Udemyの教材がオススメです。

>> 【世界で30万人が受講】データサイエンティストを目指すあなたへ〜

 

Udemyは動画ベースで学習ができるので、
実際のコードや図解を見ながら、学習を進めることができます。

 

さらに今なら30日間返金保証がついているので、
一度購入して自分の思っていたものと違った場合は費用がかかりません。

 

先ほどの教材はPandasなどの
データサイエンスに必要なライブラリに関するスキルをつけることができます。

 

ライブラリの知識だけでなく、実際のユースケースで活用する方法まで、実践的なスキルを身に付けることができます。多くの受講生がいることからもその質の高さを証明しています。

 

また、Pythonについて基礎から学ぶのであれば、オンラインスクールがオススメです。


オンラインスクールで学習すると、講義も分かりやすく、
サポート体制もしっかりしているので、これからPythonを学ぶ人にもオススメです。


オンラインで無料レッスンを体験することもできるので、
自分にあっているかどうかを確かめることができます。


オススメは以下の3つです。
どのスクールも無料体験が用意されているので、
契約前に自分に最適なスクールを探すことができるでしょう。

✔️オススメのプログラミングスクール ベスト3

プログラミングスクールについては「プログラミングスクールで失敗しないためには【オススメベスト3も紹介】」の記事でも紹介しています。


気になった方はぜひチェックしてみて下さい〜!

コメント

タイトルとURLをコピーしました