您的浏览器不支持JavaScript,请开启后继续
Python数据分析从小白到高手

Python数据分析从小白到高手

  • 作者
  • 王国平 编著

大数据时代,掌握必要的数据分析能力,将大大提升你的工作效率和自身竞争力。Python是数据分析的一大利器,本书将详细讲解利用Python进行数据分析与可视化的相关知识。 《Python数据分析从小白到高手》主要内容包括:Python入门、搭建开发环境、语法、数据类型、数据加载、数据准备、数据可视化、机器学习、深度学习、自然语言处理等,并通过三个综合案例将这些知识加以运...


  • ¥99.00

ISBN: 978-7-122-44425-7

版次: 1

出版时间: 2024-03-01

图书介绍

ISBN:978-7-122-44425-7

语种:汉文

开本:16

出版时间:2024-03-01

装帧:平

页数:307

编辑推荐

选题具有以下特色: 1.内容全面,循序渐进。本书围绕python数据分析相关语法和常用库展开,内容由浅入深,非常适合初学者学习。 2.案例丰富,实用性强。书中选取了不同场合下的各种数据分析案例,不仅中间穿插有小案例,书末还有综合性的大案例,通过案例实操,让读者能够快速掌握所学知识,并应用到实际工作中。 3.全彩图解,直观易懂。本书采用全彩印刷,书中通过大量的彩色图片展示,让读者一目了然,迅速了解并掌握具体的操作方法、步骤以及实现效果。

图书前言

数据分析是指通过对数据进行收集、清洗、转换、处理、分析、可视化等一系列操作,从中提取有用信息、发现规律、支持决策的过程。Python是一种高级编程语言,具有简单、易学、灵活、可扩展等优点,广泛应用于数据分析领域。
在数据分析和机器学习研究热潮中,相关书籍大多偏重理论。由于Python是开源免费的,而且目前市场上从零基础深入介绍数据分析和机器学习的书籍较少,鉴于此背景,本书全面而系统地讲解了基于Python的数据分析和机器学习等技术。
此外,在某些情况下,数据分析可以帮助ChatGPT更好地理解并生成响应,例如分析用户对话历史记录,以根据过去的对话模式生成更准确的响应。因此,数据分析和ChatGPT可以相互支持,共同应用于更广泛的应用领域,如智能客服、智能写作、智能问答等。
本书既包括Python数据分析的主要方法和技巧,又融入了案例实战,使广大读者通过对本书的学习,能够轻松快速地掌握数据分析的主要方法。本书配套资源中包含案例实战中所采用的数据源,以及教学PPT和学习视频,供读者在阅读本书时练习使用。
本书主要内容
使用本书的注意事项
(1)Python版本
本书是基于Python 3.10.9编写的,建议读者安装该版本进行学习。由于Python 3.9、Python 3.11与Python 3.10等版本间的差异不大,因此,本书也适用于其他版本。
(2)代码运行环境
在本书中,笔者使用的是基于Windows 64位家庭版的Anaconda开发环境,开发工具是其自带的Jupyter Lab,所有代码都可以在该环境中正常运行。
本书主要特色
特色1:本书内容丰富,涵盖领域广泛,适合各行业人士快速提升Python技能。
特色2:看得懂,学得会,注重传授方法、思路,以便读者更好地理解与运用。
特色3:贴近实际工作,介绍职场人急需的技能,通过案例学习效果立竿见影。
由于编著者水平所限,书中难免存在不妥之处,请读者批评指正。

编著者

精彩书摘

大数据时代,掌握必要的数据分析能力,将大大提升你的工作效率和自身竞争力。Python是数据分析的一大利器,本书将详细讲解利用Python进行数据分析与可视化的相关知识。
《Python数据分析从小白到高手》主要内容包括:Python入门、搭建开发环境、语法、数据类型、数据加载、数据准备、数据可视化、机器学习、深度学习、自然语言处理等,并通过三个综合案例将这些知识加以运用。
本书内容丰富,采用全彩印刷,配套视频讲解,结合随书附赠的素材边看边学边练,能够大大提高学习效率,迅速掌握Python数据分析技能,并用于实践。
本书适合数据分析初学者、初级数据分析师、数据库技术人员等自学使用。同时,本书也可用作职业院校、培训机构相关专业的教材及参考书。

目录

1 Python入门
1.1	为什么选择Python 2
1.1.1	人工智能与ChatGPT 2
1.1.2	Python与人工智能 3
1.2	Python主要库简介 4
1.2.1	NumPy 5
1.2.2	Pandas 6
1.2.3	Matplotlib 7
1.2.4	Sklearn 9
1.3	如何学习Python 11

2 搭建Python开发环境
2.1	Anaconda 14
2.1.1	什么是Anaconda 14
2.1.2	安装Anaconda 15
2.2	常用开发工具 18
2.2.1	Spyder 18
2.2.2	Jupyter Lab 21
2.2.3	PyCharm 23
2.3	包管理工具pip 26

3 Python语法
3.1	Python基础语法 29
3.1.1	变量及其命名 29
3.1.2	代码行与缩进 30
3.1.3	条件if及if嵌套 31
3.1.4	循环while与for 32
3.1.5	格式format()与% 34
3.1.6	编码类型及转换 37
3.2	Python运算符 39
3.2.1	算术运算符 39
3.2.2	赋值运算符 42
3.2.3	比较运算符 45
3.2.4	逻辑运算符 46
3.2.5	运算符优先级 49
3.3	Python常用技巧 51
3.3.1	自动补全程序 51
3.3.2	变量赋值技巧 52
3.3.3	变量链式比较 53
3.3.4	获取元素索引 54
3.3.5	遍历序列元素 55
3.3.6	序列元素排序 55
3.3.7	列表解析式 56
3.3.8	元素序列解包 57
3.3.9	合并序列元素 58
3.3.10	三元表达式 59
3.3.11	lambda表达式 61
3.3.12	矩阵乘法与转置 62

4 Python数据类型
4.1	认识数据类型 64
4.1.1	数值(number)类型 64
4.1.2	字符串(string)类型 65
4.1.3	列表(list)类型 68
4.1.4	元组(tuple)类型 70
4.1.5	集合(set)类型 71
4.1.6	字典(dict)类型 73
4.1.7	布尔值(boolean)类型 76
4.1.8	空值(None)类型 76
4.1.9	数据类型转换 77
4.2	字符串常用方法 81
4.2.1	字符串拼接的3种方法 81
4.2.2	字符串切片的2种方法 83
4.2.3	分割与合并字符串 84
4.2.4	检索子字符串的几种方法 87
4.2.5	字符串对齐的3种方法 91
4.2.6	去除字符串中空格的3种方法 93
4.2.7	字符串大小写转换的3种函数 96
4.2.8	获取字符串长度或字节数 99
4.2.9	统计字符串出现次数 100
4.3	列表常用方法 101
4.3.1	append()方法 101
4.3.2	clear()方法 102
4.3.3	copy()方法 102
4.3.4	count()方法 104
4.3.5	extend()方法 104
4.3.6	index()方法 105
4.3.7	insert()方法 106
4.3.8	pop()方法 107
4.3.9	remove()方法 107
4.3.10	reverse()方法 108
4.3.11	sort()方法 109

5 Python数据加载
5.1	加载本地离线数据 111
5.1.1	加载TXT文件数据 111
5.1.2	加载CSV文件数据 112
5.1.3	加载Excel文件数据 113
5.2	加载常用数据库数据 114
5.2.1	加载Oracle数据库数据 114
5.2.2	加载MySQL数据库数据 116
5.2.3	加载SQL Server数据库数据 117
5.3	加载Hadoop集群数据 118
5.3.1	集群软件及其版本 118
5.3.2	集群网络环境配置 120
5.3.3	Python连接Hive 122
5.4	加载Web在线数据 124

6 Python数据准备
6.1	数据的索引 127
6.1.1	创建索引 127
6.1.2	创建层次化索引 129
6.1.3	调整索引 130
6.2	数据的排序 131
6.2.1	按行索引排序数据 131
6.2.2	按列索引排序数据 132
6.2.3	按一列或多列排序数据 133
6.2.4	按一行或多行排序数据 133
6.3	数据的切片 134
6.3.1	提取一列或多列数据 134
6.3.2	提取一行或多行数据 135
6.3.3	提取指定区域的数据 136
6.4	数据的聚合 137
6.4.1	groupby()函数:分组聚合 137
6.4.2	agg()函数:更多聚合指标 138
6.5	数据的透视 140
6.5.1	pivot_table()函数:数据透视 140
6.5.2	crosstab()函数:数据交叉 143
6.6	数据的合并 144
6.6.1	merge()函数:横向合并 144
6.6.2	concat()函数:纵向合并 149

7 Python数据可视化
7.1	Matplotlib 152
7.1.1	Matplotlib库简介 152
7.1.2	业绩考核误差条形图 152
7.2	Pyecharts 155
7.2.1	Pyecharts库简介 155
7.2.2	销售额主题河流图 156
7.3	Seaborn 159
7.3.1	Seaborn库简介 159
7.3.2	利润额增强箱形图 159
7.4	Plotly 162
7.4.1	Plotly库简介 162
7.4.2	家庭成员结构旭日图 163
7.5	Altair 165
7.5.1	Altair库简介 165
7.5.2	月度订单量脊线图 166
7.6	NetworkX 169
7.6.1	NetworkX简介 169
7.6.2	NetworkX绘制平衡树 170

8 Python机器学习
8.1	机器学习理论概述 173
8.1.1	机器学习概念 173
8.1.2	机器学习分类 176
8.1.3	模型评估方法 177
8.2	线性回归及其案例 181
8.2.1	线性回归简介 181
8.2.2	线性回归的建模 181
8.2.3	汽车价格的预测 184
8.3	聚类分析及其案例 190
8.3.1	K-Means聚类简介 190
8.3.2	K-Means聚类建模 192
8.3.3	使用手肘法判断聚类数 197
8.3.4	轮廓系数法判断聚类数 198
8.4	XGBoost及其案例 202
8.4.1	XGBoost算法概述 202
8.4.2	XGBoost算法参数 204
8.4.3	XGBoost算法案例 207
8.5	时间序列及其案例 209
8.5.1	时间序列算法概述 209
8.5.2	指数平滑法及其案例 210
8.5.3	ARIMA算法及其案例 214

9 Python深度学习
9.1	深度学习概述 223
9.1.1	什么是深度学习 223
9.1.2	安装PyTorch 2.0 227
9.2	PyTorch图像识别技术 228
9.2.1	加载数据集 228
9.2.2	搭建与训练网络 229
9.2.3	预测图像数据 231
9.3	PyTorch模型可视化 231
9.3.1	Visdom简介 231
9.3.2	Visdom可视化操作 233
9.4	手写数字自动识别 244

10 Python自然语言处理
10.1	自然语言处理概述 251
10.2	Jieba中文分词 252
10.2.1	Jieba分词模式 252
10.2.2	自定义停用词 254
10.2.3	商品评论关键词词云 255
10.3	聊天机器人ChatGPT 257
10.3.1	ChatGPT简介 257
10.3.2	Python如何调用ChatGPT 259
10.3.3	Python调用ChatGPT举例 260
10.4	spaCy 262
10.4.1	spaCy简介 262
10.4.2	spaCy语言模型 266
10.4.3	spaCy依存分析 269
10.5	Gensim 272
10.5.1	Gensim简介 272
10.5.2	Gensim文本处理步骤 273
10.5.3	中文LDA分析及可视化 275

11 案例:金融量化交易分析
11.1	案例背景概述 283
11.1.1	案例研究意义 283
11.1.2	K线图技术理论 283
11.1.3	案例数据采集 284
11.2	数据基础分析 287
11.2.1	查看数据集信息 287
11.2.2	数据描述性分析 288
11.2.3	数据可视化分析 289
11.3	股票数据分析 294
11.3.1	指标相关性分析 294
11.3.2	指标趋势性分析 297
11.3.3	股票交易时机分析 299
11.3.4	股票交易策略分析 301
11.4	案例小结 303

12 案例:武汉市空气质量分析
12.1	案例背景概述
12.2	历年数据可视化分析
12.3	AQI回归分析
12.4	案例小结

13 案例:阿尔茨海默病特征分析
13.1	案例背景概述
13.2	数据预处理
13.3	数据建模
13.4	案例小结

附录 306

参考文献 307

发送电子邮件联系我们