RecognizeGeneralStructure
通用票证抽取结合读光OCR和通义千问大模型的能力,能够自动抽取非标准、非高频的长尾票证关键信息,适用于票据、合同等场景
服务地址:
华东1(杭州)
输入参数
只看必填
Url* 本字段和 body 字段二选一
body* 本字段和 URL 字段二选一
Keys* 需要抽取的所有Key(字符串数组)
0* 需要抽取的Key
插件下载了解更多
VS Code 插件
安装插件之前,确保已安装 VS Code安装插件之前,确保已安装 VS Code
Alibaba Cloud Developer Toolkit is a collection of extensions that can help access Alibaba Cloud services in Visual Studio Code.
JetBrains 插件
安装插件之前,确保已安装 JetBrains IDE安装插件之前,确保已安装 JetBrains IDE
The Alibaba Cloud Developer Toolkit for JetBrains makes it easier to access Alibaba Cloud services.

接口说明

如何使用本接口

步骤概述
1开通 OCR 统一识别 服务。本接口在公测阶段,是免费接口,开通后即可调用。
3可以参照调试页面 提供的代码示例完成 API 接入开发。接入完成后,调用 API 获取识别结果。如果使用子账号调用接口,需要阿里云账号(主账号)对 RAM 账号进行授权。创建 RAM 用户的具体操作,请参考:创建 RAM 用户。文字识别服务提供一种系统授权策略,即 AliyunOCRFullAccess。具体授权操作,请参见在用户页面为 RAM 用户授权。

重要提示

类型概述
图片格式
  • 本接口支持:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。
图片尺寸
  • 图片长宽需要大于 15 像素,小于 8192 像素。
  • 长宽比需要小于 50。
  • 如需达到较好识别效果,建议长宽均大于 500px。
图片大小
  • 图片二进制文件不能超过 10MB。
  • 图片过大会影响接口响应速度,建议使用小于 1.5M 图片进行识别,且通过传图片 URL 的方式调用接口。
其他提示
  • 请保证整张图片内容及其边缘包含在图像内。
  • 本能力会自动处理反光、扭曲等干扰信息,但会影响精度。请尽量选择清晰度高、无反光、无扭曲的图片。

请求参数

字段名称字段详情
Urlstring
  • 本字段和 body 字段二选一,不可同时透传或同时为空。展开详情
示例值:https://example.png字符长度 <= 2048
bodystring<binary>
  • 本字段和 URL 字段二选一,不可同时透传或同时为空。展开详情
示例值:图片二进制文件
Keysarray<string>
  • 需要抽取的所有 Key(字符串数组)。展开详情
子级条数 <= 31

请求说明

请求注意事项

  1. 此接口 30 秒超时。
  2. 如果通过 OCR SDK 调用接口,SDK 默认的 socketTimeout10 秒。请注意通过适当增加 RuntimeOptionssocketTimeout 参数的值。
  3. 如果传入的 Key 数量过多,可能会返回 LLMTimeout 错误码。建议减少 Key 的数量后重试。

返回参数

字段名称字段详情
RequestIdstring

请求唯一 ID。

示例值:2F86F9B6-CF68-1574-860C-7CC5E46F14BC
Dataobject

识别结果。

Codestring

错误码(当识别成功时不会返回)。

示例值:LLMTimeout
Messagestring

错误信息(当识别成功时不会返回)。

示例值:Large language model timeout, please try again with fewer keys.
变更历史
变更时间变更内容概要操作
2024-07-10
变更错误码400