
书: https://pan.baidu.com/s/1A6ZLSPMbCiZ-L4eRucUvXQ?pwd=kt7i
一些笔记分享给大家:
一、Python与Excel基础对比
- “Excel的‘单元格’对应Python的‘变量’,Excel的‘公式’对应Python的‘表达式’。”
- “Excel的‘筛选’功能 ≈ Python的
df[df['列名'] > 100]
,query()
方法更接近自然语言。”
二、数据处理核心库(pandas)
- “
pandas
的DataFrame
是Python版的‘Excel表格’,read_excel()
和to_excel()
实现读写。” - “Excel的‘VLOOKUP’用
merge()
实现,left_on
和right_on
指定关联列,避免‘#N/A’错误。” - “
groupby()
+agg()
组合替代Excel的‘数据透视表’,支持多条件分组与自定义聚合函数。”
三、数据清洗技巧
- “Excel的‘分列’功能 ≈ Python的
str.split()
或pandas.Series.str
方法。” - “缺失值处理:
dropna()
删除空行,fillna(0)
填充零值,比Excel手动操作更高效。”
四、自动化报表生成
- “
openpyxl
库直接操作Excel文件,调整格式(字体、颜色)代码化,避免重复点击。” - “
xlwings
库实现Python与Excel的交互,VBA调用Python脚本,兼顾灵活性与性能。”
五、高级数据分析
- “Excel的‘条件格式’ ≈ Python的
df.style.applymap()
,用颜色标记异常值。” - “
pivot_table()
复刻Excel透视表功能,melt()
实现‘逆透视’(列转行)。”
六、可视化对比
- “
matplotlib
的plot()
对应Excel折线图,seaborn
的barplot()
优化条形图美观度。” - “Excel的‘图表模板’ ≈ Python的
plt.style.use('ggplot')
,一键切换专业风格。”
七、自动化调度
- “Windows任务计划或
schedule
库定时运行脚本,替代Excel的‘手动刷新’。” - “
pyinstaller
打包Python脚本为.exe,发给非技术人员一键生成报表。”
八、效率技巧
- “
apply()
函数替代Excel的‘数组公式’,避免‘Ctrl+Shift+Enter’三键操作。” - “
df.to_clipboard()
快速将结果粘贴回Excel,调试阶段必备。”
九、实战场景
- “合并多张Excel表:
pd.concat([df1, df2])
比Excel的‘复制粘贴’更可靠。” - “批量重命名文件:
os.rename()
替代Excel+VBA的复杂操作。”
十、学习建议
- “先用Excel明确需求,再用Python实现自动化——‘Excel思维’是学习Python的数据分析最佳桥梁。”