另外,在PC端的展示数据是通过CSS来控制的,从网页上看不出来太大的区别,但是用普通的脚本取获取时,会发现数据是获取不到的,具体的源代码是下面这样的:
但是,在搜资料的时候,你会发现,很多教程都是用的selenium之类的方法,效率太低,没有啥技术含量。
跟着我,绝不会让你失望。
相信搞过大众点评网站的同学都应该知道上面的这种是一个css反爬的方法,具体的解析操作,即将开始。
当我们的鼠标在上面框框内的span上面点击时,会发现右边部分会相应的发生变化:
这张图片很重要,很重要,很重要,我们要的值,几乎都从这里匹配出来。
这里我们看到了“vxt20”这个变量对应的两个像素值,前面的是控制用哪个数字,后面的是控制用哪一段的数字集合,先记下,后面要用,同时这里的值应该是6;
这里其实就是整个破解流程最关键的一步了。在这里我们看到了一个链接。
瞎猫当死耗子吧,点进去看看。
现在直接看源代码:
可以看到这里面的几个关键数字:
font-size:字体大小;几个y的值,我到后面才知道原来这个y是个阈值,起的是个控制的作用。
现在我们就要用到上面的像素值了。
1.把所有的值取绝对值;2.用后面的值来选择用哪个段的数字,这里的值是103,所以使用第三个段的数字集合;3.因为每个字体是12个像素,所以用163/12=13.58,约等于14,那么我们数一下第14个数字是啥,没错,是6,和预期一样。你可以多试验几次。
以上,就是整个破解的逻辑过程。
画个流程图,装个逼:
下面开始晒代码,俗话说得好,天下代码一大抄(公众号实在不好看代码,可以点击原文看网页版的,更清楚一点)。
THE END