Excel的读取保存案例

发布时间 2023-04-04 21:28:37作者: 興華

python进行excel处理

1. Excel读取

# 首先导入pandas工具包
import pandas as pd

# 读取Excel
df = pd.read_excel('./excel_name.xlsx')   #  相对路径,./表示当前文件夹上一级

df = pd.read_excel('E:\Python\01.大数据分析师\01.0418脱产班\009.python办公自动化_曹鑫\代码\代码\01_更快系列_1张Excel表拆成1000张表/excel_name.xlsx')     #  绝对路径

2. Excel内容查看

df.shape    # 数据规模查看

df.info()    # 数据信息查看,确认数据数量,是否缺失以及数据类型

df.column_name.map(type).unique()    # 确认列数据类型

df.column_name.map(type).value_counts()  # 确认列数据数量

df.describe()    # 查看数值型统计性信息,count/mean/max/min等

df.describe(include="all")   # 查看所有数据统计性信息,包括非数值型

df[df.column_name == "item_name"]    # 查看coulmn_name中项目为item_name的数据信息

df.column_name.unique()   # 查看column_name列的信息(已去重)

df.column_name.value_counts()   # 统计column_name列所有项目数量

df.sort_values("coulmn_name", sacending=Flase)[0:10]    #   coulmn_name排序前10数据

df.insert(3, "coulmn_name3", df.coulmn_name1 * df.coulmn_name2)   #   在数据第3列插入列名为coulmn_name1的列,其值为coulmn_name1 * coulmn_name2

df.groupby("coulmn_name1").get_group("item_name")    # 查看coulmn_name1中item_name的数据信息

df[df.coulmn_name1.str.find("str_name") != -1]   # 查看coulmn_name1中包含str_name字符的数据信息
df[df.coulmn_name1.str.contains("str_name")]   # 同上  
df[df.coulmn_name1.map(lambda x:"str_name" in x)]  # 同上

df.groupby("coulmn_name1").sum().sort_values("coulmn_name2", ascengding=False)   #  以coulmn_name1为分组项,求coulmn_name2的和并按coulmn_name2排序

3. Excel数据整理绘图

# 以coulmn_name1分组,求coulmn_name2之和前10数据信息纵向图Top10_coulmn_name2 = df.groupby("coulmn_name1)["coulmn_name2"].sum("coulmn_name2").sort_values(sdcending=False)[0:10]
Top_coulmn_name2.plot(kind="barh")