前言:今天要总结的是如何用程序来实现短信发送功能。但是呢,可能需要我们调用一些api接口,我会详细介绍。都是自己学到的,害怕忘记,所以要总结一下,让写博客成为一种坚持的信仰。废话不多说,我们开始吧!
网络爬虫实现发送短信验证码
在实现我们目标的功能之前,我们要有自己的思路,否则你没有方向,又如何实现自己的代码功能呢?
我们要发送短信,那么我们其实是需要分析的。我们可以去分析一个可以发送短信的网站页面。
我们来到这里如下:
可以看到这是一个注册界面,我们在注册时会被要求需要填写手机号码的·,其实还有一栏验证码识别,像这里打开没有,那你就填写几个号码,发送,多刷新几次,就可以了。
不为别人添麻烦,我填写自己的号码。多次刷新会出现,不过要填写不同的手机号码。你们懂的,我们要看到这个有验证码的界面。
我们打开chrome谷歌抓包工具,也就是邮件检查即可。我们点击network直接进行抓包,记得在抓包前最好清除下面出现的一切包。我们要点击验证码,让网页做出反应,然后同步一下,进行抓包。
当我们填写手机号以后,我们只要点击那个验证码,然后进行抓包如下
看到没有,其实点击同步瞬间只有一个数据包的,在你做其他的动作时,可能会出现其他的数据包,但是与此无关。
我们直接点进去看
我们看这个url
我们打开这个url看看庐山真面目
python中有一个time库,我们导入,来看如何使用。
下面展示一些内联代码片。
我们目前可以这样去做
我们点入那个蓝色的链接,来看有没有获取到这个验证码图片。测试证明我们完全是对的。
下一步我们要做的是实现代码的访问,获取并保存这个验证码。为什么保存,我们应该知道这点知识。
看这三个提交栏,很明显是一个要提交表单的。提交那就需要post,而post请求呢,就是要提交我们的数据,及手机号码和图形验证码。
当我们把数据提交上去以后,我们在手机上就会收到短信验证码。我们以此来实现发送短信验证码的功能。
我们来保存图片验证码下面展示一些内联代码片。
可以看到在代码编辑器右边已经出现了保存的图片。
下一步我们继续来分析这个手机号码的数据和图片验证码的数据在哪里传入,又是如何实现。
我们输入一个手机号码,然后输入图片验证码,然后点击免费获取。此时再次进行抓包,抓包的方法与上文的第一次抓包方法相同。
我们来看会出现什么样的包。
蓝色部分的就是我们寻找的目标包。然后我们如何去做?点击打开查看相应的代码。
看到没有post请求,是因该提交表单数据的。我们看看下面的表单数据
超级鹰,是用来识别验证码的,其实我们还是调用这个接口。
我们点击开发文档,我们是用Python写的代码。所以我们点击python的图标,来这里来查看我们需要的。
在下面找到超级鹰图像识别,然后点击下载。把里面的api接口的py文件导入到你的python编辑器。我这里是用Pycharm写的。所以直接将解压出来的Python文件拖入pycharm。
下面是里面的部分代码。
这里面做了小小的修改。我们直接来看这段代码写了什么。我来告诉大家原始的代码有问题,很低级的问题。
def__init__(self,username,password,soft_id):self.username=usernamepassword=password.encode('utf8')#没有缩进self.password=md5(password).hexdigest()self.soft_id=soft_id..............这块的错误在哪呢?我这里特意表明突出,上面的原始代码直接沾到这里并不突出,但是你用编辑器打开会有问题的。
if__name__=='__main__':chaojiying=Chaojiying_Client('超级鹰用户名','超级鹰用户名的密码','96001')#用户中心>>软件ID生成一个替换96001im=open('a.jpg','rb').read()#本地图片文件路径来替换a.jpg有时WIN系统须要//printchaojiying.PostPic(im,1902)#print没有加()#1902验证码类型官方网站>>价格体系3.#4+版print后要加()还有一处,在这里,代码格式都没有写对,我这里指出,读者应该可以发现。这里介意读者可以去平台下载这个接口,自己去修改。
好,且不在谈这些,我们继续。我们还是修改部分代码。
注意我们在类里面添加这样一部分代码,就是写一个方法
defrun(self):chaojiying=Chaojiying_Client(constant.USER_NAME,constant.PASSWORD,913137)#用户中心>>软件ID生成一个替换96001im=open('yzm.jpg','rb').read()#本地图片文件路径来替换a.jpg有时WIN系统须要//result=chaojiying.PostPic(im,1004)#1902验证码类型官方网站>>价格体系3.4+版print后要加()returnresult['pic_str']注意分析这个接口代码,里面chaojiying=Chaojiying_Client(constant.USER_NAME,constant.PASSWORD,913137)
在注释里面其实说的已经很清楚了,这里的constant代表我们要导入的py文件,里面包含你的用户名,密码,以及软件id。
im=open(‘yzm.jpg',‘rb').read()打开你保存的验证码文件,上面我们已经保存过。result=chaojiying.PostPic(im,1004)1004代表你的验证码类型。
用户名和密码你需要注册一下。那么软件id和验证码类型你该如何确定呢?这是主页,请点击价格体系
在下面你可以来判断你的验证码类型了
进入如下界面
往下拉进入软件id
进入后点击生成一个软件id,软件名称和软件说明可以随便填写
这样我们就可以获得一个软件id。
这个constant如何编写,很简单,建立一个py文件,里面写入
USER_NAME='…'PASSWORD='…'然后保存即可。导入py文件到当前路劲,然后import即可。
现在我们来看完整的代码接口完整修改后的代码
ok,短信发送成功需要注意的是,如果你发送多次的话,那么会出现提醒你短信发送频率过高的提示。这是服务器的响应。
我们总结一下该程序实现了发送验证码的功能,如果你需要实现发送你想要的文本,那么你需要调用其它的接口。别的就不多说了,毕竟爬虫也需要讲武德。