找不到 API ? 点击 反馈吧
- OCR统一识别
- 通用文字识别
- 个人证照识别
- 票据凭证识别
- 企业资质识别
- 车辆物流识别
- 教育场景识别
- 小语种文字识别
- 医疗场景识别
- 票证核验
RecognizeGeneral
支持返回文字内容和位置坐标信息
服务地址:
华东1(杭州)
参数配置
高级配置
输入参数
只看必填
注意事项
Url* 本字段和body字段二选一
body* 本字段和URL字段二选一
文档
调用结果
SDK 示例
CLI示例
相关示例
调用历史
错误码
流控
插件下载了解更多
Alibaba Cloud Developer ToolkitbetaAlibaba Cloud OpenAPI
Alibaba Cloud Developer Toolkit is a collection of extensions that can help access Alibaba Cloud services in Visual Studio Code.
安装插件之前,确保已安装 JetBrains IDE安装插件之前,确保已安装 JetBrains IDE
Alibaba Cloud Developer ToolkitbetaAlibaba Cloud OpenAPI
The Alibaba Cloud Developer Toolkit for JetBrains makes it easier to access Alibaba Cloud services.
接口说明
本接口适用场景
- 阿里云通用文字识别,是阿里云官方自研 OCR 文字识别产品,适用于各类常见文档图片或文档扫描件中的文字信息按照文档原有的格式智能识别文字并结构化输出识别结果。
- 阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作简易、实时性高、能力全面等几大优势。
- 本接口图片示例
本接口核心能力
分类 | 概述 |
---|---|
多类型覆盖 | 支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。 |
全字段识别 | 结构化识别图片上所包含的全字段,并返回 JSON。 |
图像增强 | 默认支持图像增强,包括图像畸变自动矫正、模糊图片自动增强等能力。 |
高精度高性能 | 超高精度及性能;识别准确率位于行业前列,识别速度显著高于国内其他 OCR 云服务。 |
如何使用本接口
步骤 | 概述 |
---|---|
1 | 开通 通用文字识别 服务。开通服务前后,您可以通过体验馆免费体验本功能识别效果。 |
2 | 购买通用文字识别资源包。本 API 会赠送免费额度,可使用免费额度测试。 |
3 | 可以参照调试页面提供的代码示例完成 API 接入开发。接入完成后,调用 API 获取识别结果。如果使用子账号调用接口,需要阿里云账号(主账号)对 RAM 账号进行授权。创建 RAM 用户的具体操作,请参考:创建 RAM 用户。文字识别服务提供一种系统授权策略,即 AliyunOCRFullAccess。具体授权操作,请参见在用户页面为 RAM 用户授权。 |
重要提示
类型 | 概述 |
---|---|
图片格式 |
|
图片尺寸 |
|
图片大小 |
|
其他提示 |
|
请求参数
返回参数
字段名称 | 字段详情 |
---|---|
RequestIdstring | 请求唯一 ID 示例值:43A29C77-405E-4CC0-BC55-EE694AD00655 |
Datastring | 返回数据 示例值:本示例将会返回图片上的文字信息以及对应点位:
{"content":"iPhone 12 升维大提速。 RMB 229/月或RMB 5499起, 还可折抵换购1。 进一步了解 > 你可以立即在线购买并享受免费送货服务,也可以预约到附近的 Apple Store零售店购买+。 如果你已加入iPhone年年焕新计划, 请先查询你的升级换购资格, 然后预约前往Apple Store零售店换购新款iPhone。 查询升级换购资格> in ","height":655,"orgHeight":655,"orgWidth":805,"prism_version":"1.0.9","prism_wnum":11,"prism_wordsInfo":[{"angle":-88,"direction":0,"height":111,"pos":[{"x":351,"y":45},{"x":461,"y":46},{"x":461,"y":67},{"x":351,"y":66}],"prob":99,"width":20,"word":"iPhone 12","x":396,"y":0}],"width":805} |
Codestring | 错误码(如果识别成功,不会返回此字段) 示例值:noPermission |
Messagestring | 错误提示(如果识别成功,不会返回此字段) 示例值:You are not authorized to perform this operation. |
返回说明
返回参数说明
字段 | 类型 | 说明 |
---|---|---|
content | string | 识别出图片的文字块汇总。 |
prism_wordsInfo | list | 文字块信息。 |
prism_wnum | int | 识别的文字块的数量,prism_wordsInfo 数组的大小。 |
height | int | 算法矫正图片后的高度。 |
width | int | 算法矫正图片后的宽度。 |
orgHeight | int | 原图的高度。 |
orgWidth | int | 原图的宽度。 |
文字块信息(prism_wordsInfo 字段)
字段 | 类型 | 说明 |
---|---|---|
angle | int | 文字块的角度。 |
height | int | 文字块的高度(需考虑文字块的角度) |
width | int | 文字块的宽度(需考虑文字块的角度) |
pos | list | 文字块的外矩形四个点的坐标按顺时针排列(左上、右上、右下、左下)。 |
word | string | 文字块的文字内容。 |
变更历史
变更时间 | 变更内容概要 | 操作 | |
---|---|---|---|
2022-11-25 | 变更请求参数Url | ||
2021-08-17 | 变更请求参数Url 新增请求参数body |