百度手写识别
来自CloudWiki
功能描述
支持对各类名片的9个关键字段进行结构化识别,包括姓名、公司、职位、邮编、邮箱、电话、网址、地址、手机号。
准备工作
访问官网
访问官网,点击立即使用:
https://ai.baidu.com/tech/ocr_others/handwriting
创建百度AI应用
检查一下已有的同类百度AI应用中是否有名片识别的API ,如果有直接用以前的百度的AI应用就行,
如果没有,在此网页中创建一个新的百度AI应用,
https://console.bce.baidu.com/ai/?fromai=1#/ai/ocr/overview/index
百度会为你的应用生成对应的参数值,如下图:
生成许可Token
利用如下代码可生成Token:
import requests url = "https://aip.baidubce.com/oauth/2.0/token" data = { 'grant_type':'client_credentials', 'client_id':API Key, 'client_secret':Secret Key, } response = requests.post(url=url,data=data) print(response.text)
操作步骤
# encoding:utf-8 import requests import base64 ''' 手写文字识别 ''' request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting" # 二进制方式打开图片文件 f = open('[本地文件]', 'rb') img = base64.b64encode(f.read()) params = {"image":img} access_token = '[调用鉴权接口获取的token]' request_url = request_url + "?access_token=" + access_token headers = {'content-type': 'application/x-www-form-urlencoded'} response = requests.post(request_url, data=params, headers=headers) if response: print (response.json())