Python爬虫入门教程64100反爬教科书级别的网站汽车之家，字体反爬之二梦想橡皮擦|汽车之家面试好进去不_汽车

汽车之家，反爬神一般的存在，字体反爬的鼻祖网站，这个网站的开发团队，一定擅长前端吧，2019年4月19日开始写这篇博客，不保证这个代码可以存活到月底，希望后来爬虫coder，继续和汽车之间对抗。

源文件数据

我们要把源代码中的关键信息先获取到，即使他数据是存在反爬的。获取数据是非常简单的。通过request模块即可

这些内容你找到之后，你下手就用重点了，他们是什么？数据啊，通过简单的正则表达式就可以获取到了

defget_detail(html):config=re.search("varconfig=(.*)};",html,re.S)option=re.search("varoption=(.*)};",html,re.S)print(config,option)输出结果

hs_kw数字_configfH是一个span的class

.hs_kw28_configfH::before全局搜索一下

接下来，我们进行替换操作，这部流程需要用到selenium进行替换

核心代码如下，主要的注释，我写在了代码内部，希望能帮助你看懂

剩下的步骤就是数据持久化了，数据拿到之后，其他的都是比较简单的，希望你可以直接搞定。

碰到这种JS，直接找到格式化工具处理它

格式完成之后，代码具备一定的阅读能力

汽车之家用CSS隐藏了部分真实的字体，在解决的过程中，需要首先针对class去查找，当找到JS位置的时候，必须要搞定它的加密规则，顺着规则之后，只需要完成基本的key、value替换就可以拿到真实的数据了。

THE END

Python爬虫入门教程64100反爬教科书级别的网站汽车之家，字体反爬之二梦想橡皮擦