我对python的了解还停留在调用turtle库来进行绘图的阶段。实际上,在我之前参加的北理工的python入门mooc课程中,也是从turtle开始学习,然后就没有继续了。
本书主要介绍了概率、统计和机器学习的相关概念,以及其在python中的实现和相关编程技巧。本书主要使用了Numpy、Matplotlib和Pandas这三个基本库,以及Scipy和sympy这两个模块。每当看到Matplotlib,我总是忍不住去猜它是否与matlab有些关系。matlab也是一个常用的建模软件,我猜它可能在工科领域更常见。我只学过如何调用matlab的计算器,没有继续学下去。我觉得matlab的调色不太好,给我一种固定印象中工科领域的配色方案,高饱和度,不够和谐。
除了介绍python的入门知识之外,本书还从几何角度讲述了概率论和线性代数,填补了一些数理基础。实际上,本书的目标读者是那些在本科阶段接触过概率论、统计学或机器学习,并掌握了Python编程基础知识的人。我想,像我们这种只学过医学统计学的人,并不是本书的目标读者。我们在医学统计学中通常更注重哪种统计方法适合解决临床问题,而忽略了具体的统计过程。
后两章主要通过python的统计工具来介绍统计知识,并探讨机器学习的关键思想。对于我们来说,我们更习惯使用R语言进行统计分析,因为流行病学和统计学的专家们为我们开发了相关的包。但对于数据科学家来说,他们通常习惯使用python进行统计分析。
在本书中,我还发现了一个有趣的点,就是在第三章统计中的3.9节中,写到了鲁棒统计。鲁棒性这个词被许多工科学生嫌弃为过于音译,以至于无法记住鲁棒性具体意味着什么。在我看来,像经济学一样使用稳健性这个词不好吗?
相关推荐
© 2023-2025 百科书库. All Rights Reserved.
发表评价