《精通数据科学:从线性回归到深度学习》是一本由唐亘著作,人民邮电出版社出版的平装图书,本书定价:99.00元,页数:432,特精心从网络上整理的一些读者的读后感,希望对大家能有帮助。
《精通数据科学:从线性回归到深度学习》精选点评:
可以作为仅仅概念上的入门,但说不上精通,在实操上没什么帮助。
这本书对细节的解释很清楚,由简至难层层递进,让你不会突然涉及难懂的知识点而一头雾水
真的狗屎,打基础阶段看这个简直痛苦,书开头还好意思讲啥深入浅出。一些基本的术语一句话不说,甚至监督,非监督,分类回归的基本实现逻辑都不说,上来就代码了,表达能力真的不行。要是这样还不如写的真的专业一点,何必装友好。我一个没学过高数的,同济的线代都自学完了,都没这个痛苦
在新媒体盛行的时代中 数据可视化已经成为各行业中最为重要的一步 让机器 软件 交互数据可视化所需要的是科学的思维逻辑。此书正好!
非常不错的书,有很多在工作中忽视的东西,这本书都有提到,很实用。不过有个缺点,我觉得太数学了,就是公式很多的意思。
懂的看了没用——水分太大,不懂的看了也没用——浮沙筑塔。
深入浅出的讲解,作者功力力透纸背,必须五星
很好,很有启发性,专业而又不乏味。
作者热爱这个领域,不然不会主动写这本书。
读过David Dietrich 的数据科学与大数据分析,这本书更多是在讲数据分析生命周期的各个阶段,使用R语言进行基本的数据分析,李国杰院士推荐的这本 《精通数据科学》-从线性回归到深度,更多是在深入探讨模型的可用性,并结合大量的实际案例和代码帮助我们实际学习应用,全是干货,很好,值得推荐。
《精通数据科学:从线性回归到深度学习》读后感(一):直接贴一下李国杰院士为这本书做的序吧
完爆西瓜书和统计学习方法
我与本书作者素不相识,读完作者寄来的电子书稿后,感到读技术类书籍从未有过的惊喜。国内已有不少介绍大数据和机器学习的教科书、参考书,但这本书与众不同,重点不是传统教科书式的概念导入和各种机器学习算法的罗列,而是强调统计学、机器学习和计算机科学三门学科的融会贯通,试图给读者关于数据科学较全面的知识体系。特别是对常用的统计和机器学习软件有详细的说明,对提高在校大学生、研究生的动手能力和企业科技人员解决实际问题的内功大有裨益。 中国科学院院士,第三世界科学院院士 李国杰这本书是我看到目前为准,最好的一本书。甚至可以这样说:完爆西瓜书和统计学习方法
如果能静下心来好好读一下这本书,帮助会很大的,不管是从理论上还是从代码上。
《精通数据科学:从线性回归到深度学习》读后感(二):一本广度够广,但深度稍微欠缺的好书
我与作者曾在线下有一面之缘,听说他出新书之后,就立马买了一本来看。阅读之后,有不少新鲜的感受,所以将自己的豆瓣处女文献给这本书。
整体来说,这本书介绍的内容还是蛮全面的,广度很够,比较经典的模型、算法都有涉及。这一点上来讲是对得起书的名字“从线性回归到深度学习”。对于初学者来说,通过这本书,可以比较清晰地了解所谓数据科学包含的内容。另外,这本书的文笔算是好的,相比于其他技术类书籍,读起来的体验还是不错的,套用序言中李国杰院士的话,这本书能称得上是一个惊喜。
这本书比较出彩的一点是,作者将统计中有关模型稳定性、真实性的思考贯穿到模型细节的讲解中。这样的文字对于有机器学习经验的我还是很新鲜和受用的,比如读完这本书,我算是终于明白了,为啥实际工作中,大家都那么喜欢用逻辑回归模型。
当然这本书的缺点也是比较明显的,就是有些模型的讲解深度不够,特别是最后两章对神经网络和深度学习的介绍,明显有点浅尝则止。
最后吐槽一下,书中作者的头像跟本人好像差距有点大,真人好像有点胖~~(这样说,会不会被打呢)
《精通数据科学:从线性回归到深度学习》读后感(三):本书的配套代码、数据以及其他说明
本书的配套代码和训练模型的数据有两个下载地址,分别是:
1. https://github.com/GenTang/intro_ds
2. http://box.ptpress.com.cn/y/978-7-115-47910-5。
另外对于Python的版本,需要注意的是:为了节省篇幅、突出重点,本书正文中所展示的代码是基于Linux系统下的Python 2.7,而网上可以下载的配套代码则兼容Python 3和Windows系统。其实对于机器学习的实现,两个Python版本的代码实现是几乎一模一样的,所以只看正文应该也不影响的。
《精通数据科学:从线性回归到深度学习》读后感(四):要我说嘛,这本书确实是有刷分。。。
数学不好的,看不懂。数学好的,不屑看。。。另外有些错别字,太离谱了。。。
如果你已经会机器学习,也有数据基础。这本书,读起来就很通畅,可惜,这种读者,大概不会买这本书。。。因为这本书的主打卖点,就是由浅入深,融会贯通、串起机器学习中涉及的方方面面数学知识。。。但如果连一些数学概念,都解释不够清晰流畅,那就是本末倒置了。
但是作者显然经验不足,他可能身边人群都是数学底子不错的人群。
换而言之,他没有办法把自己的知识降维,用生动活泼的文笔、娓娓道来,揭示数学的本质。总之,这本书写的不是很成功,各类数学专业词,说来就来、气势汹汹、铺垫不足,杀的我猝不及防,。。
其实大部分人在大学学的统计、线代都是水过去的,除了那些考研的,其他人的数学一般考完就扔掉了。。。还有些产品经理、测试人员压根就不是理工科毕业。要转机器学习是很难的。
对于这类读者而言,用词精准、一针见血就很重要了,你跟他讲了很多,往往起重要作用的只有一句话,就一句话关键点醒了他,他才理解过来,跟上你的思维。
比如正态分布的适应场景,你上来就跟他讲 ”若随机变量x服从正态分布,则它是一个连续型随机变量,函数如下:xxxx“ ,他真会抓狂的,正态分布你都没讲是什么???
这是作者思路不清晰的缘故,他没有设身处地的站在读者立场去降维思考,不管是写小说、写教材,脑海中都有一个虚拟的读者形象,作者在写书的时候,他思维会不断的跟这个虚拟读者接触、沟通、交流。而作者显然是没有把我们这类型数学底子很差的读者,揉捏到这个虚拟读者的角色中。。。
其实,这个问题也好解决,写书的时候,盯着章节小标题多看两眼,提醒自己,是不是至少把标题给讲清楚了。。。比如正态分布,告诉读者 ”一般般很多,极端的很少“,平日观察马路上的来来往往、川流不息的车子,高档小轿车、农民拖拉机很少,普通中档车最多,这就是正态分布。。。有这么一个开场,接下来就会顺利很多。
不要遇到那种连作者自己都觉得解释费劲的概念,才肯好好对读者说明。。。尽量做到,哪怕是自己很熟悉、非常懂的数学概念,只要出现在章节标题中,就要思考如何讲解它。需知,若它真的十分简单、无足轻重,你又怎会拿它做标题呢?
另外,个人觉得本书确实如大家所说有刷分嫌疑 。。。
2018年6月1日出版的,今天才6约21日,不过才上架不到一个月,京东热击榜已经刷到第一位,把《数学之美》、《深度学习》、《机器学习实战》这些论坛、知乎推荐的经典书籍都给顶下去了。。。
书的热度高,并不是因为这本书真的阐理浅显。。。而是因为人工智能的书籍市场,真的是非常、非常缺少深入浅出的数学书啊!赶上618,这本书就只要30多块钱,消费欲望完全被激发。。。
可惜便宜是便宜,,,我无法从这本书汲取到什么有用的东西,它对我而言,就是不值得。
《精通数据科学:从线性回归到深度学习》读后感(五):要么学术要么科普,中间路线似乎是走不通的
我承认对于边缘学科来说,斜杠永远都是不可或缺的,正如书中所引用的这句话:
A data scientist is someone who is better at statistics than any software engineer and better at software engineering than any statistician.然而这种斜杠并不意味着其交叉和渗透的学科在边缘学科中被弱化,相反,应该更为强化才符合逻辑。
本书试图向我们介绍“数据科学”这门交叉了统计学、机器学习及计算机科学这3门学科(其实后两门学科本身也是边缘学科)的学科,并期望我们能精通。可是作者似乎也意识到这是一个多么宏大的命题以至于“本书并不试图成为机器学习或统计学的参考书”,而作为此书的目的之一是希望弥补计算机编程和数学建模之间的鸿沟,期许读者们成为两者兼备的人才。似乎正是为了这个目的,本书假设你具有丰富的数学知识以至于可以自行修正书中不知所谓的数学知识,又认为你具有丰富的编程水平可以自由翱翔在python的世界。
先来看看数学部分,无疑我认为应当是数据科学类书籍不可避免涉及并且应当是最精彩的部分,然而请看如下的文字:
既然行向量可以被看作三维空间里的一个点,那么n✖️3的矩阵X可以被看作三维空间里点的集合。现在我们想在这个空间里找到一条直线,使得矩阵中的点在这条直线的投影之和最长。首先,都说了是行向量,那它为什么又能被看作一个点?向量具有方向和长度,点有什么?接着,点在直线上的投影又是什么?我觉得它还是个点。点有长度么?可能三维空间没有,要不我问问《平面国》的居民们?估计他们要去问点点国的人了。如果换一种表达呢:
既然行向量可以被看作三维空间里从原点O出发指向某一点的有向线段,那么n✖️3的矩阵X可以被看作三维空间里有向线段的集合。现在我们想在这个空间里找到一条直线,使得矩阵中的有向线段在这条直线的投影之和最长。为了找到这条直线,本书突兀的给出了一个不知所云的公式,为了解决这个公式又给出了另”两“个”很复杂“的概念:特征向量和特征值,接着通过豆瓣学不学都成大学糊弄学的专业知识,告诉你这个公式就是”最大特征值对应的特征向量“。要么允许我重修空间解析几何,要么允许我好好学一下糊弄学,然后再战本章!
代码部分,且不说各种各样的python库拿来便用完全不做介绍(反正都假设你是python高手了,还需要介绍吗?);也不说书中的代码基于(Linux下的)python2.7,提供的配套代码兼容(windows的)python3(还是说一说吧,反正我觉得就本书的内容,python2和python3没什么太大的区别,更何况印一套代码,写另一套代码不累么?)作者是觉得我们找配套代码的时候可以顺便在互联网上最大的非直男交友平台上做些符合该平台定位的工作么?书中的代码编号跟配套代码通过什么进行关联?程序清单编号?函数名?靠念力猜?可能最后一个是正确答案!
最后,有一说一有二说二,本书确实达到了如书中所说的三个目的,但是为了达到目的也不折手段、一地鸡毛,所以并不适合初学者、入门者,而更适合有一定实践经验想了解一下理论(当然只是入门的理论名称而已,还需要另外的专业书籍进行补充)或者有一定的理论想实际操作一下(当然需要一定水平的编程知识)的读者吧。
本文作者的文集给他/她留言我也要发表文章