您的浏览器不支持JavaScript,请开启后继续
微生物扩增子高通量测序数据分析

微生物扩增子高通量测序数据分析

  • 作者
  • 许继飞 主编

本书详细介绍了微生物扩增子高通量测序数据格式和数据质控、扩增子高通量数据分析方法、微生物多样性分析、微生物群落结构及差异分析、基因功能预测、微生物与环境因子关联分析及相关可视化等内容,兼具分析理论和方法实操。从实验设计、质量控制、数据分析到可视化图表,由浅入深,循序渐进,是一本系统的微生物扩增子高通量测序数据分析的实战工具书。 本书适合广大生物信息学、生物...


  • ¥88.00

ISBN: 978-7-122-43528-6

版次: 1

出版时间: 2023-09-01

图书介绍

ISBN:978-7-122-43528-6

语种:汉文

开本:16

出版时间:2023-09-01

装帧:平

页数:208

编辑推荐

(1)内容新颖系统:本书重点介绍了微生物扩增子高通量测序数据格式和数据质控、扩增子高通量数据分析方法、微生物多样性分析、微生物群落结构及差异分析、基因功能预测、微生物与环境因子关联分析及相关可视化等内容。 (2)入门易:遵循学习规律,入门实战相结合。适用于零基础的读者,无需R、Python等编程基础,理论+实战案例,内容由浅入深,循序渐进,从入门中学习实战应用,从实战应用中激发学习兴趣。引导零生信基础读者快速掌握微生物扩增子分析技术。 (3)实操性强:入门进阶实战,一步一图易学,全程一个案例贯穿始终,从软件安装到数据处理绘图一次搞定。内容所涉源文件和运行文件,可直接获取、查看和对比学习,效率更高。

图书前言

微生物扩增子高通量测序以成本低、鉴定效率高和灵敏度高等优点成为环境微生物群落分析的主流研究手段之一,它既能对微生物进行定性定量研究,又规避了传统方法中绝大部分微生物不能培养的缺陷。近年来,高通量测序技术的快速发展催生出了一系列微生物组研究的技术手段,同时也积累了海量数据。
高通量测序数据的分析涉及生物学和计算机科学的相关知识,但是同时具有生物学与计算机科学背景的研究者并不多,因此测序数据的分析是很多研究者开展研究时面对的首要难题。如果想要挖掘测序数据中的生物学意义,研究者需熟练掌握扩增子分析的相关方法与技术,但繁杂的数据处理过程与晦涩难懂的分析原理极大地限制了相关研究者的工作。基于此,本书编者团队总结了微生物扩增子高通量测序数据分析实战过程中的所疑所学所知,编写了本书。
如何用好本书呢?如果是扩增子分析零基础的读者,可以先使用本书提供的示例数据,根据书中的实操步骤逐步练习,成功获得正确的结果后再进行个人数据的分析;如果是基础较好的读者,可以直接根据个人所需查阅对应板块进行学习。在Linux以及R下使用的代码均可直接按书中提供的代码输入运行。书中部分图片以彩图形式放于二维码中,读者扫码即可参阅。
为了让读者更好地分析数据,避免遇见硬件和软件上的问题,推荐计算机的配置为操作系统Windows10或Windows11,4+核心CPU,16GB+内存,100GB+可用储存空间。常用开源软件包括QIIME2、Past4、STAMP、R、Gephi等,部分流程提供了编者计算机的运行时间供参考,以便读者对分析时间做好把握。本书使用的示例数据可通过微信公众号“环微分析”获取或访问NCBI进行下载。
本书由许继飞(第1章、第2章和第3章)、徐林芳(第4章、第5章5.1和5.2内容)、柳兰洲(第5章5.3、5.4和5.5内容、第6章6.1和6.2内容)、梁珊珊(第6章6.3和6.4内容)编写。全书由许继飞统稿,由许继飞、徐林芳、柳兰洲、梁珊珊和张沐阳校阅。
由于编者的水平所限,本书难免存在疏漏和不当之处,恳请广大读者批评指正。

许继飞
2023年1月

精彩书摘

本书详细介绍了微生物扩增子高通量测序数据格式和数据质控、扩增子高通量数据分析方法、微生物多样性分析、微生物群落结构及差异分析、基因功能预测、微生物与环境因子关联分析及相关可视化等内容,兼具分析理论和方法实操。从实验设计、质量控制、数据分析到可视化图表,由浅入深,循序渐进,是一本系统的微生物扩增子高通量测序数据分析的实战工具书。
本书适合广大生物信息学、生物技术、生态、环境、食品、医学等相关领域的科研人员和相关专业师生阅读。

目录

第1章 测序数据001
1.1 示例数据 001
1.1.1 分析目标 002
1.1.2 采样点概况 002
1.1.3 理化数据 003
1.1.4 扩增子高通量测序数据 004
1.2 文件类型 007
1.3 文件内容 008
1.3.1 FASTQ存储格式特点 009
1.3.2 碱基质量 010
1.4 质量评估 012
1.4.1 评估方法 012
1.4.2 分析结果 013
1.4.3 总体样本质量 023

第2章 扩增子高通量数据分析026
2.1 分析平台 026
2.1.1 平台介绍 027
2.1.2 平台搭建 029
2.1.3 Ubuntu系统 032
2.2 构建特征表 036
2.2.1 数据导入 036
2.2.2 去噪 041
2.2.3 导出特征表 052
2.2.4 BIOM文件 053
2.3 物种注释 055
2.3.1 参考数据库 055
2.3.2 训练分类器 056
2.3.3 物种组成 065
2.4 小结 069

第3章 微生物多样性分析070
3.1 PAST软件 070
3.2 Alpha多样性 071
3.2.1 数据导入 072
3.2.2 计算多样性指数 072
3.2.3 Alpha多样性指数 075
3.3 稀释曲线 077
3.4 Beta多样性 079
3.4.1 数据导入 079
3.4.2 距离矩阵 080
3.4.3 UPGMA聚类分析 081
3.4.4 群落差异检验 083
3.4.5 排序分析 087

第4章 微生物群落结构及差异分析099
4.1 群落结构 099
4.1.1 百分比堆积柱状图 100
4.1.2 热图 104
4.1.3 韦恩图 112
4.1.4 样本–物种丰度关联Circos弦装图 116
4.1.5 小结 119
4.2 差异分析 119
4.2.1 统计检验 119
4.2.2 LEfSe在线分析 124

第5章 基因功能预测131
5.1 PICRUSt2 131
5.1.1 配置环境 132
5.1.2 标准分步流程 133
5.1.3 KEGG通路层级汇总 145
5.2 Tax4Fun2 146
5.2.1 配置环境 147
5.2.2 运行分析 147
5.3 FAPROTAX 151
5.3.1 配置环境 152
5.3.2 数据准备 152
5.3.3 功能预测 153
5.4 代谢通路丰度柱状图 154
5.4.1 基于PICRUSt2输出数据绘图 154
5.4.2 基于Tax4Fun2输出数据绘图 156
5.4.3 基于FAPROTAX输出数据绘图 157
5.5 STAMP软件 159
5.5.1 导入数据 159
5.5.2 假设检验 161
5.5.3 分析可视化 165
5.5.4 注意事项 168

第6章 微生物与环境因子关联分析169
6.1 环境因子分析 169
6.2 冗余分析 170
6.2.1 分析原理 171
6.2.2 分析步骤 171
6.2.3 导出图形 182
6.3 网络分析 183
6.3.1 分析原理 184
6.3.2 Cytoscape 186
6.3.3 Gephi 192
6.4 随机森林模型分析 199
6.4.1 分析原理 199
6.4.2 分析内容 200

参考文献207


发送电子邮件联系我们