这两天有一个业务需求,需要登陆不同的携程账号获取订单信息,但是由于携程有验证码检测机制,而且是个中文验证码比较难识别,试了几家人工打码平台,要么贵,要么延时高,要么没办法24小时运行。最后总算让我找到一个可以通过机器识别出来的api接口,准确率超级高而且延迟只有0.03s左右。(不算上传图片的时间)
首先看一下携程验证码长啥样。。。
携程验证码分为小图和大图部分,小图部分如下:



大图部分的样子如下:

原理是要先识别小图的文字,然后点击到大图对应文字的正确位置。
这里借助了图灵验证码识别平台,不是人工打码的,所以识别很快,准确率也挺高:
在线图片验证码识别平台-图像验证码识别打码平台-图片验证码打码平台-图灵
官网网址:http://fdyscloud.com.cn
进入图灵验证码识别平台,点击中文类型:

可以看到图灵识别平台提供的几个中文识别模型。我们这里需要用到的就是 中文通用类型 和 图片识别类型9。分别点进去,会告诉你对应的模型id和接口的调用方式。
我们也可以直接在网站上先上传图片测试一下该模型的识别效果,如下图:

可以看到效果是很好的,所有的字和位置都识别得相当准确!牛!
废话不多说,直接发调用的python代码吧,其实网站上也写得很详细了。
小图部分识别:
import base64
import json
import requests
# 复制以下代码,只需填入自己的账号密码、待识别的图片路径即可。
# 关于id:选做识别的模型id,会自动生成,无需修改。
def b64_api(username, password, img_path, id):
with open(img_path, 'rb') as f:
b64_data = base64.b64encode(f.read())
b64 = b64_data.decode()
data = {"username": username, "password": password, "id": id, "b64": b64}
data_json = json.dumps(data)
result = json.loads(requests.post("http://www.tulingtech.xyz/tuling/predict", data=data_json).text)
return result
if __name__ == "__main__":
img_path = "c:/users/administrator/desktop/file.jpg"
result = b64_api(username="你的账号", password="你的密码", img_path=img_path, id="82927344")
print(result)大图部分识别:
import base64
import json
import requests
# 复制以下代码,只需填入自己的账号密码、待识别的图片路径即可。
# 关于id:选做识别的模型id,会自动生成,无需修改。
def b64_api(username, password, img_path, id):
with open(img_path, 'rb') as f:
b64_data = base64.b64encode(f.read())
b64 = b64_data.decode()
data = {"username": username, "password": password, "id": id, "b64": b64}
data_json = json.dumps(data)
result = json.loads(requests.post("http://www.tulingtech.xyz/tuling/predict", data=data_json).text)
return result
if __name__ == "__main__":
img_path = "c:/users/administrator/desktop/file.jpg"
result = b64_api(username="你的账号", password="你的密码", img_path=img_path, id="09322322")
print(result)两者除了post data里面的模型id值不一样,其他部分都是一样的。
至此彻底解决了携程中文点选验证码的识别问题!!!
到此这篇关于使用python高效解决携程中文点选验证码识别并自动登陆的方法的文章就介绍到这了,更多相关python解决携程中文点选验证码内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论