RecognizeEduQuestionOcr_文字识别_API文档

插件下载了解更多
VS Code 插件
安装插件之前,确保已安装 VS Code安装插件之前,确保已安装 VS Code
Alibaba Cloud Developer Toolkit is a collection of extensions that can help access Alibaba Cloud services in Visual Studio Code.
JetBrains 插件
安装插件之前,确保已安装 JetBrains IDE安装插件之前,确保已安装 JetBrains IDE
The Alibaba Cloud Developer Toolkit for JetBrains makes it easier to access Alibaba Cloud services.

接口说明

本接口适用场景

  • 阿里云题目识别,是阿里云官方自研 OCR 文字识别产品,适用于扫描、拍照场景的单题题目识别,适用于智能批改等场景的题目内容识别。
  • 阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作简易、实时性高、能力全面等几大优势。
  • 本接口图片示例

本接口核心能力

分类概述
多文本格式支持印刷体文本以及公式的 OCR 识别。
图像增强默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。
多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。
返回坐标可实现对题目中的配图位置进行检测并返回坐标位置。

如何使用本接口

步骤概述
1开通 教育场景识别 服务。开通服务前后,您可以通过体验馆免费体验本功能识别效果。
2购买题目识别资源包。本 API 会赠送免费额度,可使用免费额度测试。
3可以参照调试页面提供的代码示例完成 API 接入开发。接入完成后,调用 API 获取识别结果。如果使用子账号调用接口,需要阿里云账号(主账号)对 RAM 账号进行授权。创建 RAM 用户的具体操作,请参考:创建 RAM 用户。文字识别服务提供一种系统授权策略,即 AliyunOCRFullAccess。具体授权操作,请参见在用户页面为 RAM 用户授权。

重要提示

类型概述
图片格式
  • 本接口支持:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式。
图片尺寸
  • 图片长宽需要大于 15 像素,小于 8192 像素。
  • 长宽比需要小于 50。
  • 如需达到较好识别效果,建议长宽均大于 500px。
图片大小
  • 图片二进制文件不能超过 10MB。
  • 图片过大会影响接口响应速度,建议使用小于 1.5M 图片进行识别,且通过传图片 URL 的方式调用接口。
其他提示
  • 接口响应速度和图片中的文字数量有关,如果图片中文字数量越多,接口响应可能越慢。
  • 接口会自动处理反光、扭曲等干扰信息,但会影响精度。请尽量选择清晰度高、无反光、无扭曲的图片。

流控信息

当前云产品API请求速率暂未透出。

授权信息

如下是此API对应的授权信息,用于RAM权限策略语句的Action元素中,为RAM用户或RAM角色授予调用此API的权限。请通过 RAM 访问控制设置,使用方法可参考访问控制帮助文档

具体说明如下:展开详情

操作访问级别资源类型条件关键字关联操作
ocr:RecognizeEduQuestionOcr
Write
全部资源
*

请求参数

字段名称字段详情
Urlstring
  • 本字段和 BODY 字段二选一,不可同时透传或同时为空。展开详情
示例值:https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20241223/yyrzrb/%E9%A2%98%E7%9B%AE%E8%AF%86%E5%88%AB.png字符长度 <= 2048
bodystring<binary>
  • 本字段和 URL 字段二选一,不可同时透传或同时为空。展开详情
示例值:图片二进制文件
NeedRotateboolean
  • 是否需要自动旋转功能,默认不需要。展开详情
示例值:false

返回参数

字段名称字段详情
RequestIdstring

请求唯一 ID

示例值:43A29C77-405E-4CC0-BC55-EE694AD00655
Datastring

返回数据

示例值:{ "content": "√技能提升练 √拓展创新练 12.对于同一平面内的三条直线,给出下列5个论断:15.「2018春·如皋期末]在一个三角形中,如果一个角 ①a//b;②b∥c;③a⊥b;④a∥c;⑤a⊥c ,以其中两是另一个角的3倍,这样的三角形我们称之为“智个论断为条件,一个论断为结论,组成一个你认为慧三角形”.如三个内角分别为 1 2 0 ^ { \\circ } , 4 0 ^ { \\circ } , 2 0 ^ { \\circ } 的三角正确的命题. 形是“智慧三角形”. 已知:,结论: 如图 1 - 2 - 2 , \\angle M O N = 6 0 ^ { \\circ } , 在射线OM上找一点 13.指出命题“同旁内角互补”的条件和结论,并说明这 A,过点A作 AB⊥OM 交ON于点B,以A为端点个命题是正确的命题还是错误的命题. 作射线AD 交射线OB于点C(点C不与点O重合). M A B N 图 1- -2一2 14.如图 1-2-1, 点B,A,E在同一条直线上,已知①AD (1) ∠ABC 的度数为°, △AOB ∥BC,②∠B=∠C,③AD 平分 ∠EAC. 请你用其中两(填“是”或“不是”)智慧三角形; 个作为条件,另一个作为结论,构造命题,并说明你构 (2)若 \\angle O A C = 2 0 ^ { \\circ } ,试说明::△AOC 为"智慧三角形的命题是正确的命题还是错误的命题. 形”; E D B C 图 1-2-1 (3)当 △ABC 为“智慧三角形”时,求 ∠OAC 的度数. 第1章三角形的初步知识A5 ", "figure": [ { "type": "subject_pattern", "x": 1605, "y": 3087, "w": 645, "h": 804, "box": { "x": 0, "y": 0, "w": 0, "h": 0, "angle": 0 }, "points": [ { "x": 1605, "y": 3087 }, { "x": 2250, "y": 3087 }, { "x": 2250, "y": 3891 }, { "x": 1605, "y": 3891 } ] } ], "height": 7000, "orgHeight": 7000, "orgWidth": 4716, "prism_version": "1.0.9", "prism_wnum": 64, "prism_wordsInfo": [ { "angle": 0, "direction": 0, "height": 85, "pos": [ { "x": 207, "y": 508 }, { "x": 826, "y": 506 }, { "x": 826, "y": 592 }, { "x": 208, "y": 594 } ], "prob": 96, "recClassify": 0, "width": 618, "word": "√技能提升练", "x": 207, "y": 506 } ], "width": 4716 }
Codestring

错误码(如果识别成功,不会返回此字段)

示例值:noPermission
Messagestring

错误提示(如果识别成功,不会返回此字段)

示例值:You are not authorized to perform this operation.

返回说明

返回参数说明


字段类型说明
contentstring识别出图片的文字块汇总。
figurelist图片中的图案信息。
prism_wordsInfolist文字块信息。
prism_wnumint识别的文字块的数量,prism_wordsInfo 数组的大小。
heightint算法矫正图片后的高度。
widthint算法矫正图片后的宽度。
orgHeightint原图的高度。
orgWidthint原图的宽度。

文字块信息(prism_wordsInfo 字段)

字段类型说明
angleint文字块的角度。
heightint文字块的高度(需考虑文字块的角度)
widthint文字块的宽度(需考虑文字块的角度)
poslist文字块的外矩形四个点的坐标按顺时针排列(左上、右上、右下、左下)。
wordstring文字块的文字内容。
charInfolist单字信息。
recClassifyint文字属性分类。(0:“中文印刷”,1:“拉丁语种”,2:“手写体”,3:“韩语”,4:“泰文”,51:“公式”)。

单字信息(charInfo 字段)

字段类型说明
wordstring单字文字。
probint置信度。
xint单字左上角横坐标。
yint单字左上角纵坐标。
wint单字宽度。
hint单字高度。

图案位置信息(figure 字段)

字段类型说明
typestring图案类型。
xint图案左上角横坐标。
yint图案左上角纵坐标。
wint图案宽度。
hint图案高度。
boxobject图案坐标信息:中心横纵坐标,长宽,顺时针旋转角度。定义同 OpenCV 中 RotatedRect,请参见 OpenCV 文档
pointslist图案四个点坐标(左上、右上、右下、左下)。

返回示例

变更历史

变更时间变更内容概要操作
2022-11-25
变更请求参数Url
2021-08-17
变更请求参数Url
新增请求参数body

相关示例