《Streaming Systems》
当之无愧的2018第一神书,虽然出版时间略晚,后发亦可先制。读此书之前可以先读《Streaming 101》和《Streaming 102》预热。《Streaming Systems》沉淀了谷歌过去十多年对流、批计算的思考,前半部分主要阐述了Dataflow模型,提出流计算不确定性和可靠性的有效解决方案,把批处理统一吸纳进同一套框架,后半部分叙述了Streaming SQL的可行性。这本书的也是大热的 Flink 和Structural Streaming 的理论基础。
《Spark: The Definitive Guide 》
大热的Spark一直都没有一本类似于《Hadoop 权威指南》的书籍震慑四方,知道2018年Databrick出了这本书,无愧权威二字。此书的Streaming章节配合《Streaming Systems》食用更佳。
《NoSQL distilled》
这本书也是年尾才读到的,虽然不是2018年的新书,但是值得搞大数据的认真一读。在13年的时候,NoSQL能做的基本上都做了,剩下的大多是修修补补的活。这本书类似于总结和概括,第一遍读的时候十有八九是似懂非懂,不太清楚为什么要这么设计,这是可以去读《DDIA》(2017年第一神书)了解数据系统整个理论框架,然后再读此书,会有种不同的感觉。
《Scala 编程》
2018年认真学习了Scala ,并以浅薄的笔力简单的对比了Scala和Python。不同于大部分编程语言书,这本书不光光是语法层面的讲解,更是语言设计者对编程语言本身的思考以及如何Scala复杂的特性是加进来和思量。
《Python3 学习笔记》
讲真,读Python的相关中文书籍已经没有当初的惊喜了,大多索然无味,学习不到新的技术和思路,随意翻翻就知道是新瓶装旧酒,学习来源一直是各种Weekly和博客。但是读了《Python3学习笔记》,依然感觉到这是一本诚意满满的书,“talk is cheap, show me the code“。