本书首先介绍了开发环境的配置。接着讨论了Web网站的构成和页面渲染。还探讨了动态网页和静态网页对爬虫造成的影响。紧接着详细介绍了信息校验型反爬虫、动态渲染反爬虫、文本混淆反爬虫知识、特征识别反爬虫的原理、实现和绕过。然后概览了App数据爬取的关键和常用的反爬虫手段。最后介绍了常见的编码和加密原理、JavaScript代码混淆知识、前端禁止事件以及与爬虫相关的法律知识和风险点。
韦世东,资深爬虫工程师,2019年华为云·云享专家,掘金社区优秀作者,GitChat认证作者,夜幕团队(NightTeam)成员。拥有七年互联网从业经验,擅长反爬虫的设计和绕过技巧。
相关推荐
© 2023-2025 百科书库. All Rights Reserved.
发表评价