您的浏览器不支持JavaScript,请开启后继续
Python数据分析与办公自动化

Python数据分析与办公自动化

  • 作者
  • 李增刚、王增、董辉立 编著

本书内容分为三个部分:第一部分详细介绍Python的语法;第二部分详细介绍Python数据处理和数据分析方面的内容,包括NumPy数组处理、Matplotlib数据可视化、Pandas数据处理、SciPy高级数据处理(如傅里叶变换、聚类算法、插值计算、数字信号处理、多项式和曲线拟合等);第三部分介绍办公自动化方面的内容,涉及Excel文档的读写、Word文档的读写、PowerPoint...


  • ¥109.80

ISBN: 978-7-122-46266-4

版次: 1

出版时间: 2024-11-01

图书信息

ISBN:978-7-122-46266-4

语种:汉文

开本:16

出版时间:2024-11-01

装帧:平

页数:486

内容简介

本书内容分为三个部分:第一部分详细介绍Python的语法;第二部分详细介绍Python数据处理和数据分析方面的内容,包括NumPy数组处理、Matplotlib数据可视化、Pandas数据处理、SciPy高级数据处理(如傅里叶变换、聚类算法、插值计算、数字信号处理、多项式和曲线拟合等);第三部分介绍办公自动化方面的内容,涉及Excel文档的读写、Word文档的读写、PowerPoint文档的读写和PDF文档的读写。
本书内容讲解详细,给出了每个命令的语法格式,对语法中的参数进行了详细解释,在每个知识点中配以实例程序供读者参考。本书适合所有喜欢用Python编程的人员、数据处理人员、办公室工作人员和各类科技工作者等。

编辑推荐

1.内容讲解详细,给出了每个命令的语法格式,对语法中的参数进行详细解释; 2.每个知识点配以实例程序,便于读者实操练习和理解; 3.提供全书应用实例源文件,实战练习更方便。

图书前言

随着大数据时代的到来,我们在工作和生活中会接触各种各样的数据。小到每个人,大到整个国家,都会产生大量的数据,这些数据中蕴含着大量的信息,通过对数据的分析处理,可以得到有价值的信息。例如在商业领域,数据分析可以使零售商实时掌握市场动态并迅速做出应对,可为商家制定更加精准有效的营销策略,可以帮助企业为消费者提供更加及时和个性化的服务;在医疗领域,数据分析可提高诊断准确性和药物有效性;在国家层面,数据分析可以促进经济发展、维护社会稳定,通过对大量人群的监测、跟踪,分析挖掘出规律性的信息,可以方便社会管理者及时发现问题并找到对策。
Python是一种简单易学的编程语言,适合进行数据分析,并专门提供了数据分析和处理的工具包。数据的来源各种各样,这些数据保存在不同的介质中,例如把数据保存到常用的Excel文档、Word文档、PowerPoint文档和PDF文档中时,需要从这些文档中提取数据,并把数据分析的结果写入这类文档中,以报告的形式呈现给决策者,这一过程称为办公自动化。因此本书既介绍数据分析的内容,也介绍办公自动化的内容。
本书的内容可以分为三部分。第一部分是Python基础内容,非常详细地介绍了Python的基本语法。第二部分是Python数据处理和分析的内容,详细介绍了Python进行数据分析的3个主要库NumPy、Matplotlib和Pandas。其中NumPy是对N维数组处理的工具包,它是数据分析的基础;Matplotlib用于数据可视化,可将数据绘制成各种类型的图表;Pandas可对一维数据和二维数据进行处理分析,它是Python数据分析最强大的工具。此外,本书还介绍了SciPy对数据进行处理的其他方法,例如数据插值计算、聚类算法、数据积分和微分、傅里叶变换、数字信号处理、曲线拟合与正交距离回归等,关于SciPy更多的科学计算方法可参考笔者所著的《Python编程基础与科学计算》。第三部分是办公自动化的内容,详细介绍了Python对Excel文档、Word文档、PowerPoint文档和PDF文档的读写方法。为了更方便地进行数据处理,可以编辑一个可视化界面,通过界面上的操作来实现数据的分析和报告的生成,有关可视化界面的编程,可参考笔者所著的《Python基础与PyQt可视化编程详解》和《Qt for Python Pyside6 GUI界面开发详解与实例》。
本书在写作时,使用的是Python 3.11.3版本,数据分析包和办公自动化包也都是当前最新的版本,但Python语言及数据分析包仍在不断发展中,读者在使用本书的时候,Python语言和科学计算包很可能发展到更高的版本,由于软件一般都有向下兼容的特点,因此不会影响本书所述内容的正常使用。本书在讲解内容时,在每个知识点上配有应用实例,这些应用实例可以起到画龙点睛的作用,请读者扫描下面的二维码下载本书实例的源程序。
本书由北京诺思多维科技有限公司组织编写,李增刚、王增、董辉立编著。由于受作者水平与时间的限制,书中疏漏在所难免,敬请广大读者批评指正。在使用本书的过程中,如有问题可通过邮箱forengineer@***与笔者联系。

编著者

目录

第1章 Python编程基础
1.1 Python编程环境 001
1.1.1 Python语言简介 001
1.1.2 Python编程环境的建立 002
1.1.3 Python自带集成开发环境 004
1.1.4 PyCharm集成开发环境 005
1.2 变量与赋值语句 006
1.2.1 变量和赋值的意义 006
1.2.2 变量的定义 008
1.2.3 赋值语句 009
1.3 Python中的数据类型 010
1.3.1 数据类型 010
1.3.2 数据类型的转换 012
1.3.3 字符串中的转义符 015
1.4 表达式 016
1.4.1 数值表达式 016
1.4.2 逻辑表达式 018
1.4.3 运算符的优先级 019
1.5 Python编程的注意事项 020
1.5.1 空行与注释 020
1.5.2 缩进 021
1.5.3 续行 021
1.6 Python中常用的一些函数 021
1.6.1 输入函数和输出函数 021
1.6.2 range()函数 023
1.6.3 随机函数 023
1.7 分支结构 024
1.7.1 if分支结构 024
1.7.2 if分支语句的嵌套 027
1.7.3 match分支结构 028
1.8 循环结构 030
1.8.1 for循环结构 030
1.8.2 while循环结构 031
1.8.3 循环体的嵌套 032
1.8.4 continue和break语句 033

第2章 Python的数据结构
2.1 列表 035
2.1.1 创建列表 035
2.1.2 列表元素的索引和输出 038
2.1.3 列表的编辑 039
2.2 元组 042
2.2.1 创建元组 042
2.2.2 元组元素的索引和输出 043
2.3 字典 044
2.3.1 创建字典 045
2.3.2 字典的编辑 047
2.4 字符串 049
2.4.1 字符串的索引和输出 049
2.4.2 字符串的处理 050
2.4.3 格式化字符串 057

第3章 自定义函数、类和模块
3.1 自定义函数 062
3.1.1 自定义函数的格式 063
3.1.2 函数参数 065
3.1.3 函数的返回值 069
3.1.4 函数的局部变量 069
3.1.5 匿名函数lambda 070
3.1.6 函数的递归调用 071
3.2 类和对象 071
3.2.1 类和对象介绍 071
3.2.2 类的定义和实例 073
3.2.3 实例属性和类属性 074
3.2.4 类中的函数 076
3.2.5 属性和方法的私密性 078
3.2.6 类的继承 080
3.2.7 类的其他操作 083
3.3 模块和包 086
3.3.1 模块的使用 086
3.3.2 模块空间与主程序 089
3.3.3 包的使用 090
3.3.4 枚举模块enum 091
3.3.5 系统模块sys 092
3.3.6 日期时间模块datetime 094

第4章 异常处理和文件操作
4.1 异常信息和异常处理 099
4.1.1 异常信息 099
4.1.2 被动异常的处理 101
4.1.3 异常的嵌套 104
4.2 文件的读写 105
4.2.1 文件的打开与关闭 105
4.2.2 读取数据 107
4.2.3 写入数据 109
4.3 文件和路径操作 112
4.4 py文件的编译 116

第5章 NumPy数组运算
5.1 创建数组 117
5.1.1 数组的基本概念 117
5.1.2 NumPy的数据类型 118
5.1.3 创建数组的方法 122
5.1.4 数组的属性 130
5.1.5 NumPy中的常量 130
5.1.6 数组的切片 132
5.1.7 数组的保存与读取 134
5.2 数组操作 137
5.2.1 基本运算 138
5.2.2 调整数组的形状 141
5.2.3 数组的重新组合 143
5.2.4 数组的分解 145
5.2.5 数组的重复复制 146
5.2.6 类型转换 146
5.2.7 数组排序 147
5.2.8 数组查询 149
5.2.9 数据统计 151
5.2.10 数据的添加和删除 155
5.2.11 数组元素的随机打乱 156
5.2.12 数组元素的颠倒 157
5.3 随机数组 157
5.3.1 随机生成器 158
5.3.2 随机函数 159
5.4 通用函数 161
5.4.1 数组基本运算函数 161
5.4.2 数组逻辑运算函数 164
5.4.3 数组三角函数 164
5.5 线性代数运算 165
5.5.1 矩阵对角线 165
5.5.2 数组乘积 166
5.5.3 数组的行列式 168
5.5.4 数组的秩和逆矩阵 169
5.5.5 特征值和特征向量 170
5.5.6 SVD分解 171
5.5.7 Cholesky分解 172
5.5.8 QR分解 173
5.5.9 范数和条件数 174
5.5.10 线性方程组的解 176

第6章 Matplotlib数据可视化
6.1 二维绘图 177
6.1.1 折线图 177
6.1.2 对数折线图 180
6.1.3 堆叠图 181
6.1.4 时间折线图 182
6.1.5 带误差的折线图 183
6.1.6 填充图 184
6.1.7 阶梯图 185
6.1.8 极坐标图 185
6.1.9 火柴棍图 186
6.1.10 散点图 187
6.1.11 柱状图 189
6.1.12 饼图 191
6.1.13 直方图 192
6.1.14 六边形图 194
6.1.15 箱线图 195
6.1.16 小提琴图 197
6.1.17 等值线图 198
6.1.18 四边形网格颜色图 200
6.1.19 三角形图 201
6.1.20 箭头矢量图 205
6.1.21 流线图 207
6.1.22 矩阵图 208
6.1.23 稀疏矩阵图 209
6.1.24 风羽图 210
6.1.25 事件图 211
6.1.26 自相关函数图 212
6.1.27 互相关函数图 213
6.1.28 幅值谱图和相位谱图 214
6.1.29 时频图 215
6.1.30 功率谱密度图 216
6.1.31 绘制图像 218
6.2 图像、子图和图例 219
6.2.1 图像对象 220
6.2.2 子图对象 223
6.2.3 图例对象 231
6.3 图像的辅助功能 232
6.3.1 添加注释 232
6.3.2 添加颜色条 234
6.3.3 添加文字 235
6.3.4 添加箭头 236
6.3.5 添加网格线 236
6.3.6 添加水平、竖直和倾斜线 238
6.3.7 添加表格 240
6.4 三维绘图 241
6.4.1 三维子图对象 241
6.4.2 三维折线图 242
6.4.3 三维散点图 242
6.4.4 三维柱状图 243
6.4.5 三维曲面图 244
6.4.6 三维等值线图 245
6.4.7 三维三角形网格图 246
6.4.8 三维箭头矢量图 248

第7章 Pandas数据处理
7.1 Pandas的数据结构 252
7.1.1 Series的创建方法 253
7.1.2 Series的属性 256
7.1.3 Series数据的获取和编辑 257
7.1.4 DataFrame的创建方法 260
7.1.5 DataFrame的属性 264
7.1.6 DataFrame数据的获取和编辑 265
7.1.7 标签 267
7.2 数据运算 272
7.2.1 基本运算 272
7.2.2 统计函数 276
7.2.3 方程应用 278
7.3 标签操作 282
7.3.1 标签添加前后缀 282
7.3.2 替换和重置标签 282
7.3.3 标签重命名 284
7.3.4 重建标签 285
7.4 数据操作 286
7.4.1 获取数据 286
7.4.2 迭代输出 288
7.4.3 添加列和行 288
7.4.4 数据排序 290
7.4.5 标签对齐 292
7.4.6 数据比较 294
7.4.7 数据连接 295
7.4.8 数据合并 297
7.4.9 重复行的处理 299
7.4.10 缺失数据的处理 300
7.4.11 替换数据 306
7.4.12 形状调整 307
7.4.13 分组统计 313
7.4.14 标签重采样 315
7.4.15 数据移动 317
7.5 数据读写 318
7.5.1 pickle文件的读写 319
7.5.2 Excel文件读写 320
7.5.3 csv文件的读写 322
7.6 数据可视化 324
7.6.1 用plot()方法绘图 324
7.6.2 用plot的子方法绘图 326
7.6.3 特殊绘图 327

第8章 SciPy数据计算方法
8.1 物理常数和单位换算 332
8.1.1 数学和物理常量 333
8.1.2 单位换算系数 333
8.2 插值计算 337
8.2.1 一维样条插值 338
8.2.2 一维多项式插值 339
8.2.3 二维样条插值 340
8.2.4 根据FFT插值 341
8.3 聚类算法 342
8.3.1 k-平均聚类法 342
8.3.2 矢量量化 344
8.3.3 层次聚类法 345
8.4 数值积分和微分 348
8.4.1 一重定积分 348
8.4.2 二重定积分 353
8.4.3 三重定积分 354
8.4.4 n重定积分 355
8.4.5 给定离散数据的积分 355
8.4.6 数值微分 357
8.5 傅里叶变换 357
8.5.1 傅里叶变换公式 358
8.5.2 离散傅里叶变换 359
8.5.3 傅里叶变换的辅助工具 361
8.5.4 离散余弦和正弦变换 362
8.5.5 窗函数 364
8.5.6 短时傅里叶变换 370
8.5.7 小波分析 371
8.6 数字信号处理 373
8.6.1 信号的卷积和相关计算 373
8.6.2 二维图像的卷积计算 375
8.6.3 FIR与IIR滤波器 376
8.6.4 FIR与IIR滤波器的设计 381
8.6.5 滤波器的频率响应 385
8.6.6 其他滤波器 386
8.7 多项式运算 389
8.7.1 多项式的定义及属性 389
8.7.2 多项式的四则运算 391
8.7.3 多项式的微分和积分 391
8.7.4 多项式拟合 392
8.8 曲线拟合与正交距离回归 393
8.8.1 曲线拟合 393
8.8.2 正交距离回归流程 395
8.8.3 简易模型 399

第9章 读写Excel文档
9.1 Excel工作簿和工作表格 401
9.1.1 openpyxl的基本结构 401
9.1.2 工作簿Workbook 403
9.1.3 工作表格Worksheet 406
9.2 绘制数据图表 415

第10章 读写Word文档
10.1 文档Document 430
10.1.1 新建和打开文档 431
10.1.2 Document的方法和属性 431
10.2 段落Paragraph 434
10.2.1 Paragraph的方法和属性 434
10.2.2 段落格式Paragraph-Fromat 434
10.2.3 字体Font 437
10.3 文本块Run 439
10.4 表格Table和单元格_Cell 441
10.5 节Section 444
10.6 页脚_Footer和页眉_Header 446

第11章 读写PowerPoint文档
11.1 母版SlideMaster和版式SlideLayout 448
11.1.1 演示Presentation 449
11.1.2 母版SlideMaster和版式SlideLayout的属性 451
11.1.3 母版和版式中的占位符Placeholder 451
11.1.4 母版和版式中的形状Shape 453
11.1.5 母版和版式的背景和文本框的颜色填充 456
11.2 幻灯片Slide及其形状Shape 457
11.2.1 幻灯片Slide 457
11.2.2 幻灯片中的文本操作 459
11.2.3 幻灯片中添加形状Shape 463

第12章 读写PDF文档
12.1 PDF文档和页面PageObject 478
12.1.1 读取PDF文档PdfReader 478
12.1.2 页面PageObject 479
12.1.3 坐标变换 481
12.1.4 添加水印 482
12.2 写PDF文档PdfWriter 483
12.2.1 合并PDF文档 484
12.2.2 拆分PDF文档 485
12.2.3 加密PDF文档 485

发送电子邮件联系我们