您的浏览器不支持JavaScript,请开启后继续
基于机器学习的数据分析方法

基于机器学习的数据分析方法

  • 作者
  • 苏美红 著

作为人工智能的核心技术,机器学习在数据分析中具有举足轻重的地位。本书在介绍机器学习相关知识的基础上,主要介绍了如何对有噪声的数据进行鲁棒回归分析。全书共6章,除第1章外,各章对异常点或重尾分布数据中的具体问题进行了详细分析与建模,所涉及的问题包括权值选择问题、变量相关性问题以及网络数据问题等。 本书对于构建具有鲁棒性的机器学习模型具有很好的参考性,适用于含噪...


  • ¥89.00

ISBN: 978-7-122-43989-5

版次: 1

出版时间: 2024-03-01

图书介绍

ISBN:978-7-122-43989-5

语种:汉文

开本:16

出版时间:2024-03-01

装帧:平

页数:144

编辑推荐

本书在介绍机器学习相关知识的基础上,主要介绍了基于机器学习的特殊数据模型的建立和分析的方法,尤其是含有异常点或服从重尾分布的数据,包括基于正则化方法的回归模型、 自加权鲁棒正则化方法、基于自变量相关的鲁棒回归模型、 基于因变量相关的Lasso回归模型、 基于变量相关的岭回归模型。本书内容对于统计机器学习相关专业师生及技术人员有很好的参考性。

图书前言

作为人工智能的核心技术方法,机器学习已经成为了一种重要且有效的数据分析工具,并且已经取得了令人惊叹的成就。本书主要针对数据中含有异常点或数据服从重尾分布的问题,基于机器学习三要素,从模型构建、理论分析、算法求解及实验验证等方面对机器学习方法进行研究和介绍。
全书共6章。第1章为机器学习基础知识,主要包括两大部分的内容,第一部分介绍了机器学习的基本问题、基本概念以及基本类型等,第二部分介绍了机器学习基本模型——回归模型的发展现状,方便读者理解本书撰写的目的和动机。
第2章是对基于正则化方法的回归模型的介绍,主要介绍了多种广泛使用的正则化方法,并详细分析了各种方法的优缺点。
第3章主要介绍自加权鲁棒正则化方法。通过机器学习模型自加权,有效提高了模型的鲁棒性,为含噪声数据分析提供了高效的学习方法。
第4章针对重尾分布数据中的自变量相关性问题,从问题分析、模型构建、理论分析以及求解算法等方面进行了详细介绍,为此类型数据的分析提供了有效的方法和相应的理论支撑。
第5章介绍了数据中因变量相关性问题的机器学习分析方法,构建了具有邻近样本信息的回归模型,给出相应的回归系数估计方法,并给出了所提估计的误差界证明,从回归建模的角度为网络数据的分析奠定了基础。
第6章针对网络数据中变量相关性问题,取得基于Elastic Net回归,构建了适用于网络数据的Elastic Net回归模型,同时给出了相应的求解算法,为应用于实际问题提供了指导。
本书主要介绍了如何利用机器学习方法对数据进行有效分析,具体来说,旨在针对复杂或含噪声数据中所存在的问题,研究能够保证学习模型鲁棒性和泛化性的技术或方法,从而能够有效应用于实际问题。因此本书既可供数据分析、人工智能相关专业师生阅读,也可供相关领域的工程技术人员、研究人员参考。
本书是笔者在博士期间所做研究工作的基础上修订而成的,因此对导师王文剑教授以及母校山西大学多位教授的指导表示感谢。
此外,本书受国家自然科学基金面上项目(No.61673249)、山西省基础研究计划项目(202103021223295)、大数据分析与并行计算山西省重点实验室开放课题(编号:BDPC-23-002)、山西省高等学校科技创新计划项目(2021L323)、太原科技大学科研启动金项目(20212054)、智能信息处理山西省重点实验室开放课题基金资助项目(编号:CICIP2023007)、来晋工作优秀博士奖励基金(20232062)项目资助,在此深表感谢!
由于笔者水平、时间和精力所限,书中难免有不足,希望读者批评指正。

著者  

精彩书摘

作为人工智能的核心技术,机器学习在数据分析中具有举足轻重的地位。本书在介绍机器学习相关知识的基础上,主要介绍了如何对有噪声的数据进行鲁棒回归分析。全书共6章,除第1章外,各章对异常点或重尾分布数据中的具体问题进行了详细分析与建模,所涉及的问题包括权值选择问题、变量相关性问题以及网络数据问题等。
本书对于构建具有鲁棒性的机器学习模型具有很好的参考性,适用于含噪声的数据分析与应用,可供数据分析、人工智能等相关专业师生及行业技术人员参考阅读。

目录

第1章 机器学习基础	001
1.1 机器学习及基本概念	002
1.1.1 什么是机器学习	002
1.1.2 机器学习中的一些基本概念	003
1.2 机器学习三要素	005
1.2.1 模型	005
1.2.2 策略	006
1.2.3 算法	009
1.3 机器学习分类	009
1.3.1 监督学习	010
1.3.2 无监督学习	013
1.3.3 半监督学习	013
1.3.4 强化学习	013
1.4 回归模型发展现状	014
1.4.1 线性回归	014
1.4.2 基于邻近信息的回归模型	018
1.4.3 鲁棒回归模型	020

第2章 基于正则化方法的回归模型	023
2.1 正则化方法	024
2.2 基于最小二乘估计的正则化方法	025
2.2.1 最小二乘估计	025
2.2.2 岭回归	026
2.2.3 Lasso估计	027
2.2.4 自适应Lasso	027
2.2.5 SCAD估计	028
2.2.6 弹性网络回归	029
2.3 鲁棒(稳健)正则化方法	029

第3章 自加权鲁棒正则化方法	033
3.1 自加权鲁棒方法	034
3.2 L0正则项	035
3.3 基于SELO惩罚项的自加权估计方法	037
3.3.1 自适应正则项	037
3.3.2 RSWSELO估计	038
3.3.3 理论性质及证明	039
3.4 实验验证与分析	044
3.4.1 模拟实验结果与分析	044
3.4.2 标准数据集上的实验	049

第4章 基于自变量相关的鲁棒回归模型	055
4.1 自变量相关性问题	056
4.2 基于Elastic Net罚的鲁棒估计方法	058
4.2.1 模型构建	058
4.2.2 理论性质分析及证明	059
4.2.3 求解算法	066
4.3 实验验证与分析	068
4.3.1 模拟实验结果与分析	068
4.3.2 真实数据集上的实验	080

第5章 基于因变量相关的Lasso回归模型	083
5.1 因变量相关性问题	084
5.2 Network Lasso估计及其性质	085
5.2.1 模型的构建	085
5.2.2 误差界估计	087
5.3 实验结果与分析	097
5.3.1 人工数据集上的实验	097
5.3.2 真实数据集上的实验	109

第6章 面向网络数据的Elastic Net回归模型	111
6.1 网络数据问题	112
6.2 面向网络数据的回归模型	112
6.3 Network Elastic Net 模型构建	114
6.3.1 模型构建	114
6.3.2 求解算法	115
6.4 实验结果与分析	117
6.4.1 人工数据集上的实验	117
6.4.2 实际数据分析	126

附录	131

参考文献	140

发送电子邮件联系我们