前段时间,我去面试了一家杭州的公司,应聘AIGC负责人的职位。在面试过程中,我一边回答面试题,一边看着别人引用我的推荐系统论文。是的,我没有作弊,我只是看了一下别人如何引用我的零样本学习论文,这篇论文是印度人写的。我觉得这个面试过程很有趣,因为我是在家里进行的电话面试。对方说,如果我通过了初步面试,我就需要从北京到杭州参加现场面试,而且他们不会报销差旅费。
现在,让我解释一下AIGC目前最流行的算法——StableDiffusion。首先,我输入了一段文字描述我想要生成的图片。然后,电脑根据这段文字从图片库中搜索出一张照片。接下来,电脑会给这张照片添加一些噪声,并利用算法去除噪声。然而,这个去噪算法并不是完全精确的,所以最终生成的图片会与原始搜索出的图片略有不同。这张新生成的图片就是所谓的人工智能AIGC生成的图片。StableDiffusion的基本原理就是这样简单。没想到噪声和艺术还有关联吧?
我读这本书的时候速度很快,因为我对这本书有很高的期望,希望它能够成为一本惊世骇俗的著作。我觉得其中有几点给我留下了深刻的印象。首先,X光照片中光子的噪声是泊松分布的,这对于我来说并不意外,但还是让我感到惊喜。并不是所有的噪声都是高斯分布或者是白噪声,是吧?其次,Python中已经有现成的工具包可以处理X光照片,这再次证明了众人的力量。Python社区发展了这么多年,在高端技术领域稳步发展,甚至取代了C++和Java这样的老牌编程语言。最后,经典算法在X光照片处理领域得到了广泛应用,经典算法的魅力无处不在,具体如何应用还需要我们自己去思考。
我给这本书打4分,因为其中很多内容我都比较熟悉,比如第6章的经典浅层学习算法和第7章的经典深度学习算法,所以我阅读起来很快。而这两章内容又是全书的重点之一。
这本书是2020年出版的,应该是适合中国高等院校本科高年级学生和硕士/博士生使用的优秀教材。当然了,如果你正在攻读硕士或博士学位,就需要更多地阅读研究资料,与他人交流思想,多思考问题。毕竟,在硕士和博士阶段,研究和创新的比重非常高。
顺便提一下,EpipolarGeometry这部分知识,我还需要再仔细研究一下。因为在计算机视觉领域,它是必不可少的基础知识。没有对这部分知识的掌握,是无法胜任的……
相关推荐
© 2023-2025 百科书库. All Rights Reserved.
发表评价