我们经常可以看到关于推荐书单的文章,但好像每篇文章差不多都是把领域内的书籍罗列了个遍,生怕漏掉一本就显得自身不专业了。
其实在互联网时代,我们所需要的,经常只是一本通识导读类书籍就够了。这本书用来让我们了解全貌,形成所谓的道。至于具体的术,差不多都可通过网络搜索解决。本文就结合数据分析体系,推荐几本不错的书籍。
数据分析体系
先介绍一下数据分析体系,具体如下图,详细可看前面的系列文章《数据分析完整体系,一图胜千言,一文盖千篇 》
思维与方法篇
这两篇我只推荐一本书《西方文化中的数学》,这本书是数学科普书,作者用深入浅出的语言将西方文化历史和数学历史有机融为一体,深刻说明了数学在文化发展中扮演的重要作用。这本书通俗易懂,没有高深的数学理论,看完既可以大致了解西方历史,也会让你对数学有一个新的认识,并深深领会到“万物皆数”的理念。
可以说,如果数据分析师不能领会到数学的重要性,那肯定是不称职的数据分析师。
至于网上经常推荐的一些思维类书籍,个人不推荐,偶尔看看文章就够了。这方面最主要的是需要自身经常思考,看书作用不大。
在前面的系列文章《一文读透数据分析思维、方法、流程与痛点,看完你的思路就清晰了 》中对各类思维和方法有一个系统的介绍,可以参考看下,仍有不懂的地方就通过百度解决。
工具篇
(1)Excel
这个就完全没必要买书了,百度解决。
(2)SQL
如果只是想学习SQL查询,那也没必要买书。但如果是想对数据库原理有全面的了解,那推荐《深入浅出MYSQL:数据库开发、优化与管理维护》。
这本书对于数据库的整体知识点都有介绍,可以帮助你了解数据库原理,让你心中有个全貌。对于SQL查询与优化也有涉及到,可以满足基本的术。至于书中没有深入涉及到的知识点,也无需再去买书,百度就可以。
(3)Python
推荐两本书,首先是《利用Python进行数据分析》,这本书可以让你了解到用Python做数据分析大概会涉及到哪些知识。但如果已经对Pandas、Numpy等库有所了解的话,这本书也没有买的必要。
另外推荐《Python学习手册》,这本书是部大头书,可让你快速了解Python在更方面的基础。Python应用很广泛,对它的广度有个清晰认识是非常有必要的。
(4)FineBI
类似的BI软件就都不用买书了,官网教程和百度足够解决。
理论篇
(1)概率统计
推荐高等教育出版社茆诗松版的《概率论与数理统计》,这本书一般都是数学系本科生的教材,它直接涵盖了概率论和统计学的入门知识。如果是要加强这两方面基础知识的话,这本书是首选。
(2)线性代数
推荐高等教育出版社版《高等代数》,这本书也是数学系本科生的教材。对于数据分析师来说,如果想要重温线性代数知识,那肯定是在学习机器学习。既然选择机器学习,那就首先要把线性代数知识掌握好,这本书值得细品!
(3)机器学习
李航的《统计学习方法》和周志华的《机器学习》二选一吧,这两本书都很经典,不用多说,全部买也可以。
至于机器学习实战类的书籍就没有买了,上scikit-learn官网好好学习学习。
结语
本文倾向于每个领域都只是推荐一本经典的通识类书籍,至于实战的部分就依靠网络搜索解决,其实这样是非常有作用的。
首先,书不能多买,否则会在看哪本书上犹豫不决而导致最后都不怎么看,一本经典的书籍是足够我们消化一辈子的;
其次,我们通过阅读通识类书籍建立的抽象知识网络,通过搜索更能完善成具体的知识网络。
最后,这也能给我们省不少买书钱,虽然我们可能不在意这个。