修改编码格式可以通过encoding参数进行
goods_df=pd.read_excel(r'C:\Users\viruser.v-desktop\Desktop\商品信息表.xlsx')goods_df.to_excel(excel_writer='test.xlsx',sheet_name='测试文件',index=False,columns=['分类','名称'],encoding='utf-8')6.缺失值处理虽然数据预处理阶段已经有缺失值的处理了,但是数据分析过程中可能也会产生缺失值,所以导出时仍然需要处理缺失值。
goods_df=pd.read_excel(r'C:\Users\viruser.v-desktop\Desktop\商品信息表.xlsx')goods_df.to_excel(excel_writer='test.xlsx',sheet_name='测试文件',index=False,columns=['分类','名称'],encoding='utf-8',na_rep=0)result:
原始表格
缺失值处理后:
无穷值(inf)与缺失值(NaN)都是异常数据,无穷值一般是通过除数为0的方式得到的。无穷值的存在会导致数值计算报错,所以计算前先对无穷值进行处理
print(float('inf'))result:
inf7.1.2负无穷值的生成print(float('-inf'))result:
-inf7.2无穷值替换填充goods_df=pd.read_excel(r'C:\Users\viruser.v-desktop\Desktop\商品信息表.xlsx')goods_df.to_excel(excel_writer='test.xlsx',sheet_name='测试文件',index=False,columns=['分类','名称',"销量"],encoding='utf-8',na_rep=0,inf_rep=0)替换前:
替换后:
有的时候一个脚本一次会生成多个文件,可以将多个文件分别导出成多个文件,也可以将多个文件放在一个文件的不同Sheet中,这时要用到ExcelWriter()函数将多个文件分别导出到同一文件的不同Sheet中.具体示例如下:
importpandasaspdgoods_df=pd.read_excel(r'C:\Users\viruser.v-desktop\Desktop\商品信息表.xlsx')user_df=pd.read_excel(r'C:\Users\viruser.v-desktop\Desktop\用户购物表.xlsx')writer=pd.ExcelWriter('many.xlsx',engine='xlsxwriter')goods_df.to_excel(writer,sheet_name='商品')user_df.to_excel(writer,sheet_name='用户')writer.save()