pandas 操作excel
Pandas 是一個強大的 Python 數據分析庫,支持對 Excel 文件的讀取、寫入和操作。以下是一些常見的 Pandas 操作 Excel 的方法,包括讀取 Excel 文件、寫入 Excel 文件以及一些常用的數據處理操作。
?? 一、讀取 Excel 文件
1. 讀取整個 Excel 文件
import pandas as pd
# 讀取 Excel 文件
df = pd.read_excel('data.xlsx')
# 查看前幾行數據
print(df.head())
2. 讀取指定的工作表(Sheet)
df = pd.read_excel('data.xlsx', sheet_name='Sheet1')
sheet_name可以是字符串(表名)、整數(第幾個表,從 0 開始),或者None(讀取所有表)。
3. 讀取多個工作表并返回字典
dfs = pd.read_excel('data.xlsx', sheet_name=None) # 返回字典,鍵是 sheet 名,值是 DataFrame
?? 二、寫入 Excel 文件
1. 寫入單個 DataFrame 到 Excel
df.to_excel('output.xlsx', index=False)
index=False表示不保存行索引。
2. 寫入多個 DataFrame 到不同工作表
with pd.ExcelWriter('output.xlsx') as writer:
df1.to_excel(writer, sheet_name='Sheet1', index=False)
df2.to_excel(writer, sheet_name='Sheet2', index=False)
?? 三、常見操作示例
1. 篩選數據并保存
# 讀取數據
df = pd.read_excel('data.xlsx')
# 篩選數據
filtered_df = df[df['銷售額'] > 1000]
# 保存到新 Excel 文件
filtered_df.to_excel('filtered_data.xlsx', index=False)
2. 添加新列
df['利潤率'] = df['利潤'] / df['銷售額']
3. 修改某些值
df.loc[df['地區'] == '華東', '折扣'] = 0.95
4. 合并兩個 Excel 文件
df1 = pd.read_excel('data1.xlsx')
df2 = pd.read_excel('data2.xlsx')
combined_df = pd.concat([df1, df2], ignore_index=True)
combined_df.to_excel('combined_data.xlsx', index=False)
?? 四、安裝依賴
要使用 pandas 讀寫 Excel 文件,需要安裝以下依賴之一:
pip install openpyxl # 用于 .xlsx 文件
pip install xlrd # 用于 .xls 文件(舊版)
? 五、注意事項
.xlsx使用openpyxl.xls使用xlrd- 寫入 Excel 時默認使用
openpyxl引擎 - 可以通過
engine='openpyxl'指定引擎
?? 示例完整代碼
import pandas as pd
# 讀取 Excel
df = pd.read_excel('sales_data.xlsx', sheet_name='2024')
# 添加新列
df['利潤率'] = df['利潤'] / df['銷售額']
# 篩選數據
high_profit = df[df['利潤率'] > 0.3]
# 寫出結果
high_profit.to_excel('high_profit_sales.xlsx', index=False)
如果你有具體的需求,比如處理多個 sheet、合并多個 Excel 文件、處理日期列、去重等,可以告訴我,我可以提供更詳細的代碼示例 ??
本文來自博客園,作者:chuangzhou,轉載請注明原文鏈接:http://www.rzrgm.cn/czzz/p/18985083

浙公網安備 33010602011771號