于算是简单把这本书的英文啃完了一遍,对于自己当前的英文阅读能力,还是略微有点吃力的。
这本书的核心其实是讲了流式系统的演进。其中,我觉得全书最精彩的地方就是关于mapreduce和table与stream的转换的部分。
关于系统的演进,streamsql这一章节更多地谈及了在流式场景下已成为关系型数据库标准的SQL所面临的问题和解决方案。SQL是声明式编程,底层实现则是各家数据引擎的事情。
目前我只是会使用到mapreduce和spark的一些功能,并没有在这些基础上进行二次开发,所以我对它们的理解并不算深入。但是关于工程演进的一些思想,实际上是通用的。如果我以后要基于这些工具进行二次开发,就需要进一步深入学习这方面的理论基础。
相关推荐
© 2023-2025 百科书库. All Rights Reserved.
发表评价