【荐书】提升机器学习数学基础,这7本书一定要读(附pdf资源) 2019-04-17




  新智元报道  

来源:KDnuggets

编辑:大明

【新智元导读】机器学习和数据科学离不开数学,本文从数学基础的角度入手,推荐了数据科学和机器学习方面的七本参考书以及两本补充读物。相信对打好数学基础的相关人士会有所帮助。

大多数人学习数据科学的人都会把重点放在编程上,实际上编程能力确实是机器学习和数据科学领域的重要技能。但是,要真正精通数据科学和机器学习,必然不能忽视的数据科学背后的数学基础。


出于这个目的,本文介绍了七本在注重打好数据科学的数学基础上的技术读物。当然,涉及到数学,往往阅读体验可能不会很舒服,但要搞好机器学习,数学基础是必须要打牢的,所以努力读书吧!

 

先说一说为什么在数据科学学习时打好数学基础。

 

以下是我总结的几个原因:

 

AI领域无时无刻不在迅速变化。Hinton认为,我们也许应该重新思考反向传播。掌握牢固的数学知识有助于更好地理解AI的演变。一个数学基础深厚的人,对AI的理解和认识与其他仅从表面认识AI的人有很大的区别。此外,掌握数学知识还能更好地了解AI技术带来知识产权的潜力。最后,了解数据科学背后的数学知识,也可以让人更容易获得AI和数据科学的高端职位。

 

此外,作者推荐这几本书,还有两点个人原因:

 

1.作者在牛津大学教授物联网数据科学的课程,也包括一些AI技术应用方面的教学事务,在教学过程中涉及到数学基础知识和课程。

 

2.其次,作者在写一本书来简述人工智能,从数学的角度入手,目标读者是14到18岁的少年。要深入了解数学科学和人工智能数学的数学基础,你需要了解四个方面知识:线性代数,概率论,多元微积分和优化。目前在高中阶段至少会教授这些课程的一部分内容。因此,我试图将高中数学与人工智能和数据科学联系起来,重点是数学建模。


下面进入正题:


(1) The Nature Of Statistical Learning Theory 《统计学习理论的本质》

作者:Vladimir Vapnik


PDF资源:

https://statisticalsupportandresearch.files.wordpress.com/2017/05/vladimir-vapnik-the-nature-of-statistical-learning-springer-2010.pdf


如果说要列一份关于数学的书单,这本书是绕不过去的。本书单中排名第一的就是俄罗斯著名数学家Vladimir Vapnik的《统计学习理论的本质》。在这份清单中的所有书籍中,Vapnik这本是最不好找的。Vladimir Vapnik是支持向量机(SVM)的创始人。他的维基百科页面中提供了更多关于他研究成果的介绍。


 

(2) Pattern Classification (2007-12-24)《模式分类》

作者:Richard O Duda


PDF资源:

https://cds.cern.ch/record/683166/files/0471056693_TOC.pdf


就像Vapnik的著作一样,Duda的著作时另一个时代的另一部经典。本书初版于1973年,在二十多年后的2000年才推出第二版,此后一直未再版。时隔近二十年,本书仍然是一个重要资源。本书采用模式识别方法,并涵盖了广泛的算法。


(3)

Machine Learning: An Algorithmic Perspective,Second Edition (Chapman & Hall/Crc Machine Learning & Pattern Recognition)

《机器学习:算法视角》


PDF资源:

https://doc.lagout.org/science/Artificial%20Intelligence/Machine%20learning/Machine%20Learning_%20An%20Algorithmic%20Perspective%20%282nd%20ed.%29%20%5BMarsland%202014-10-08%5D.pdf


这本书现在已经出版了第二版。此书第一版是我读过的最早的书关于机器学习和算法的著作之一,第二版增加了更多Python代码。与前两本书一样,本书也非常强调算法。

 

(4)

The Elements of Statistical Learning: DataMining, Inference, and Prediction, Second Edition

《统计学习基础:数据挖掘、推理和预测》(第二版)

作者:Trevor Hastie,Robert Tibshirani,Jerome Friedman


PDF资源:https://web.stanford.edu/~hastie/Papers/ESLII.pdf


另一本经典之作,可以作为参考书。

 

(5)Pattern Recognition and Machine Learning (Information Science and Statistics)

《模式识别与机器学习(信息科学与统计)》

作者:Christopher M. Bishop


PDF资源:http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf


Christopher M.Bishop的模式识别和机器学习(信息科学和统计学)也是一本深入而精心设计的参考书。

 

(6)

Machine Learning: The Art and Science ofAlgorithms that Make Sense of Data

作者:Peter Flach


PDF资源:http://www.cs.put.poznan.pl/tpawlak/files/ZMIO/W02.pdf

 

我喜欢Peter Flach的书,尽管亚马逊网站上的一些评论说这书写得太罗嗦,而且代码量显得不足。我特别喜欢这本书中的算法分组(逻辑模型,线性模型,概率模型)章节以及这些主题的整体讲述方式。

 

最后,是我最推荐的一本书:


(7) Deep Learning 《深度学习》

作者:Goodfellow、Bengio、Corville


相关资源:https://www.deeplearningbook.org/


如果你在找一本值得逐页读完的书,就是它了!这本书既详细,又有现代感,书中内容几乎涵盖了你能想到的关于深度学习的一切知识。

 

补充两本书:

 

A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition) by Simon Rogers, Mark Girolami 

 

作者:Simon Rogers,Mark Girolami


我觉得这本书并不太适合初学者,但它仍然是一本好书(特别是第二版)

 

Machine Learning: A Probabilistic Perspective

作者:Kevin Murphy 


这本书中评价也很高,但我个人没有读过(因此没有收集)。

 

写在最后:

 

除了最后一本《深度学习》之外,我建议其他书不必逐页阅读,而是将其作为参考书,根据需要按相应主题阅读相应的书籍。这些书教会了我时刻保持谦逊。无论我们现在知道了多少,掌握了多少知识,都总能在阅读过程中发现,这个领域原来是如此的庞大和复杂。

 

这些书已经超越了时间。Vladimir Vapnik现年已经81岁。Duda的著作初版于1973年。我预计50年以后,这个行业里的人们仍然会阅读这些著作。就像与那些经历了时间考验的老朋友们重逢一样。多年之后,也许你会发现,在眼花缭乱的技术、模型和框架背后,数学是永恒的。

 

原文链接:

https://www.kdnuggets.com/2018/04/7-books-mathematical-foundations-data-science.html


新智元春季招聘开启,一起弄潮AI之巅!

岗位详情请戳:


【加入社群】


新智元AI技术+产业社群招募中,欢迎对AI技术+产业落地感兴趣的同学,加小助手微信号:aiera2015_2   入群;通过审核后我们将邀请进群,加入社群后务必修改群备注(姓名 – 公司 – 职位;专业群审核较严,敬请谅解)。

文章已于修改

    已同步到看一看

    发送中