新书速览|Python数据分析师成长之路
《Python数据分析师成长之路》
1
本书内容
《Python数据分析师成长之路》凝聚了作者在多个行业数据分析实战中的宝贵经验,旨在帮助读者从零基础入行到专家级数据分析师需掌握的全栈核心能力。书中提供了高效的成长方法和简洁的学习路径。
《Python数据分析师成长之路》共13章。第1~5章为基础部分,系统介绍Python学习的基本路径以及数据分析师所需的核心编程技能,包括Pandas和NumPy基础、数据预处理和SQL基础。第6~11章侧重于应用,涵盖了数据获取、可视化、分析方法、自动化分析报告生成、行业分析思维和数据挖掘等实用技能。第12章为创新部分,重点探讨了如何利用ChatGPT进行数据挖掘。第13章为答疑部分,回答了数据分析从业者常见的问题,如思维培养、突破瓶颈和转行准备,总结了多年的经验供读者参考。
书中每个知识点均配有详细的实战代码示例,帮助读者快速理解并应用到实际分析中。通过《Python数据分析师成长之路》的学习,读者能够专注于数据收集到分析结论形成的全链路技能,掌握最常用的技能与最简短的学习路径。
2
本书作者
熊松,华东交通大学计算机技术专业硕士,研究方向为加密算法,毕业后先后供职于德邦物流、淘宝、魅族,目前供职于同盾科技,担任数据产品经理,先后负责落地过千万级产品营收和相关项目管理。对数据分析和数据产品有多年的实战工作经验及行业知识沉淀。数据分析工具以及Python技术爱好者。
3
本书读者
《Python数据分析师成长之路》适合初入数据分析领域的从业者、准备转型的各行各业人员以及对Python数据分析感兴趣的读者。
4
本书目录
向上滑动阅览
目 录
第1章 从菜鸟到高手的路径是什么1
1.1 数据分析基础技能学习1
1.1.1 Excel能力2
1.1.2 SQL编程能力3
1.1.3 Python编程能力4
1.2 数据分析思维能力培养6
1.2.1 需求层面:角色转换7
1.2.2 业务层面:核心指标9
1.2.3 战略层面:明确方向9
1.2.4 行业层面:洞察影响10
1.3 Python数据分析通用链路技能11
1.3.1 数据收集11
1.3.2 数据预处理12
1.3.3 数据分析12
1.3.4 数据挖掘13
1.3.5 数据可视化13
1.3.6 数据分析报告13
1.4 保持最佳的职业心态13
1.4.1 遇到问题14
1.4.2 面对和理解问题14
1.4.3 解决问题:保持最佳的职业心态14
1.5 本章小结16
第2章 NumPy基础17
2.1 NumPy简介17
2.2 NumPy结构17
2.3 数据类型及转换18
2.4 生成各种数组19
2.5 数组计算21
2.6 索引和切片22
2.7 布尔索引25
2.8 本章小结27
第3章 Pandas入门28
3.1 Series基础使用29
3.1.1 Series定义和构造29
3.1.2 Series索引和值30
3.1.3 字典生成Series31
3.1.4 Series基础查询与过滤32
3.1.5 Series和数值相乘33
3.1.6 Series识别缺失值33
3.2 DataFrame基础使用34
3.2.1 DataFrame定义和构造34
3.2.2 嵌套字典生成DataFrame36
3.2.3 DataFrame固定行输出37
3.2.4 DataFrame固定列输出38
3.2.5 DataFrame列赋值40
3.2.6 DataFrame列删除40
3.3 Pandas数据交互41
3.3.1 重新设置索引41
3.3.2 删除行和列42
3.3.3 Pandas选择与过滤45
3.3.4 Pandas数据对齐和相加49
3.3.5 Pandas函数apply应用52
3.3.6 Pandas数据排序53
3.4 动手实践:Pandas描述性统计56
3.4.1 列求和57
3.4.2 最大值和最小值索引位置57
3.4.3 累计求和输出58
3.4.4 描述方法describe()58
3.5 本章小结59
第4章 Python基础数据处理60
4.1 数据读取60
4.2 数据合并62
4.2.1 按数据库表关联方式62
4.2.2 按轴方向合并65
4.3 数据清洗69
4.3.1 缺失值处理69
4.3.2 重复值处理75
4.3.3 特殊处理76
4.4 数据分组79
4.5 数据替换82
4.6 本章小结84
第5章 SQL基础85
5.1 MySQL数据库安装85
5.1.1 MySQL下载与安装85
5.1.2 数据库管理工具安装88
5.1.3 数据库的连接90
5.2 MySQL数据查询91
5.2.1 基础数据查询92
5.2.2 模糊数据查询94
5.2.3 字段处理查询95
5.2.4 排序95
5.2.5 函数运算查询96
5.2.6 分组查询97
5.2.7 限制查询97
5.3 多表查询97
5.4 增、删、改方法100
5.5 本章小结101
第6章 Python爬虫基础103
6.1 爬虫原理和网页构造103
6.1.1 网络连接103
6.1.2 爬虫原理104
6.1.3 网页构造107
6.2 请求和解析库108
6.2.1 Requests库108
6.2.2 Lxml库与Xpath语法111
6.3 数据库存储115
6.3.1 新建MySQL数据库116
6.3.2 Python数据存储118
6.4 案例实践:爬取当当网图书好评榜TOP500119
6.4.1 爬取思路119
6.4.2 爬取代码122
6.4.3 整体代码和输出123
6.5 本章小结126
第7章 数据分析方法127
7.1 5W2H分析法127
7.2 漏斗分析法128
7.3 行业分析法130
7.4 对比分析法132
7.5 逻辑树分析法133
7.6 相关分析法136
7.7 2A3R分析法137
7.8 多维拆解分析方法140
7.9 本章小结141
第8章 Python可视化142
8.1 Matplotlib基础143
8.1.1 可视化:多个子图144
8.1.2 标题、刻度、标签、图例设置146
8.1.3 注释148
8.1.4 图片保存151
8.2 Matplotlib各种可视化图形152
8.2.1 折线图152
8.2.2 柱状图153
8.2.3 饼图155
8.2.4 散点图155
8.3 其他Python可视化工具介绍156
8.4 可视化案例:动态可视化展示案例157
8.5 本章小结159
第9章 Python自动化生成Word分析报告160
9.1 添加Word文档161
9.2 添加标题和段落文本161
9.2.1 添加标题161
9.2.2 添加段落文本162
9.3 添加表格163
9.4 添加图片165
9.5 设置各种格式166
9.5.1 添加分页符166
9.5.2 段落样式166
9.5.3 字符样式167
9.6 案例实践:杭州租房市场分析报告自动化167
9.7 本章小结170
第10章 行业数据分析思维171
10.1 电商行业171
10.1.1 行业经验总结171
10.1.2 电商案例分析思维174
10.2 金融信贷行业176
10.2.1 行业经验总结176
10.2.2 信贷风控案例分析思维179
10.3 零售行业181
10.3.1 行业经验总结181
10.3.2 零售案例分析思维185
10.4 本章小结187
第11章 Python数据挖掘188
11.1 常用的数据挖掘算法188
11.1.1 C4.5算法189
11.1.2 CART算法189
11.1.3 朴素贝叶斯算法189
11.1.4 SVM算法190
11.1.5 KNN算法190
11.1.6 AdaBoost算法190
11.1.7 K-Means算法191
11.1.8 EM算法191
11.1.9 Apriori算法191
11.1.10 PageRank算法192
11.2 数据预处理方法193
11.2.1 数据导入194
11.2.2 数据描述196
11.2.3 数据清洗199
11.2.4 数据转换201
11.2.5 数据分割203
11.2.6 特征缩放203
11.3 Scikit-learn介绍204
11.4 模型评估207
11.5 案例分享210
11.5.1 数据导入211
11.5.2 数据现状分析维度212
11.5.3 缺失值情况213
11.5.4 异常值情况213
11.5.5 数据预处理220
11.5.6 探索性分析222
11.6 本章小结233
第12章 ChatGPT数据分析方法实践234
12.1 应用场景与分析方法建议235
12.2 产品优化建议237
12.3 使用ChatGPT编写代码239
12.3.1 使用ChatGPT编写SQL代码239
12.3.2 使用ChatGPT编写可视化图表代码241
12.4 案例分享:使用ChatGPT自动化建模243
12.4.1 数据上传243
12.4.2 数据说明244
12.4.3 数据探索分析245
12.4.4 数据预处理246
12.4.5 建模输出预测结果246
12.4.6 模型评估247
12.5 本章小结248
第13章 数据分析师成长过程常见疑问250
13.1 大厂数据分析岗位的日常工作250
13.1.1 快速熟悉业务与数据库250
13.1.2 可视化工具的使用251
13.1.3 全局思维:搭建业务指标体系251
13.1.4 产品思维:快速推进251
13.1.5 不管什么分析方法,能发现解决问题就是好方法252
13.1.6 项目管理和沟通是一把利剑252
13.1.7 碎片化时间管理必不可少252
13.1.8 小结:一个成熟的阿里数据分析师的日常要求253
13.2 数据分析新人如何写好阶段性工作总结253
13.2.1 日常工作总结254
13.2.2 重点项目255
13.2.3 重点价值255
13.2.4 重点协同255
13.2.5 成果呈现256
13.2.6 小结256
13.3 做数据分析师会遇到哪些职业困惑256
13.3.1 数据分析师是否需要具备强大的编程能力257
13.3.2 数据分析师的价值257
13.3.3 数据分析师升职加薪是不是很快258
13.3.4 数据分析师是否容易遇到职业天花板,如何突破258
13.3.5 如果将来不想再做数据分析师,还可以转向哪些职业259
13.3.6 小结259
13.4 转行做数据分析师要做好什么准备260
13.4.1 了解自己、了解行业、确定方向260
13.4.2 硬件准备和软件准备260
13.4.3 小结263
13.5 数据分析师如何避免中年危机263
13.5.1 扎实的基本功:分析能力264
13.5.2 深耕行业:积累独特经验264
13.5.3 保持热情,不断创新265
13.5.4 小结265
13.6 数据分析师的前景265
13.6.1 一般前景—数据分析师的发展路径266
13.6.2 潜在前景—数据分析师的内功修炼266
13.6.3 小结267
13.7 数据分析师的薪资差异268
13.7.1 硬件技能差异268
13.7.2 分析思维的差异269
13.7.3 沟通能力差异270
13.7.4 项目管理能力差异270
13.7.5 小结271
13.8 数据分析师沦为“取数工具人”,如何破局271
13.8.1 知己知彼:清楚如何被动沦为工具人271
13.8.2 提高效率:找到以一当百的终极武器—自助分析工具272
13.8.3 实现价值:数据驱动业务支持决策,彻底摆脱工具人角色272
13.8.4 小结273
13.9 本章小结273
5
本书特色
本文摘自《Python数据分析师成长之路》,获出版社和作者授权发布。
Python数据分析师成长之路——jdhttps://item.jd.com/15112436.html