RecognizePdf_视觉智能开放平台-文字识别_API文档

插件下载了解更多
VS Code 插件
安装插件之前,确保已安装 VS Code安装插件之前,确保已安装 VS Code
Alibaba Cloud Developer Toolkit is a collection of extensions that can help access Alibaba Cloud services in Visual Studio Code.
JetBrains 插件
安装插件之前,确保已安装 JetBrains IDE安装插件之前,确保已安装 JetBrains IDE
The Alibaba Cloud Developer Toolkit for JetBrains makes it easier to access Alibaba Cloud services.

接口说明

功能描述

PDF 识别能力可以对 PDF 上的文字进行结构化识别。

说明
  • 您可以进入在线咨询获取在线人工帮助。
    • 当前能力可在视觉智能开放平台有完整的免费产品体验,您可以单击立即试用对该能力进行更直观试用以及在线购买。
    • 阿里云视觉智能开放平台视觉 AI 能力 API 接入、接口使用或问题咨询等,请通过钉钉群(23109592)加入阿里云视觉智能开放平台咨询群联系我们。

    应用场景

    • 内容审核:可以结合内容审核能力对识别结果进行审核,检测文档中是否存在违规信息。
    • 企业报销: 可以对 PDF 格式的增值税发票结构化识别处理后实现报销场景下的自动化。

    特色优势

    • 精准识别:智能算法升级,精准识别文件内容,保留原始排版。
    • 多语种识别:可识别中、英、中英混合等多语种内容。

    接入指引

    1. 注册阿里云账号:打开阿里云官网,在阿里云官网右上角,单击立即注册,按照操作提示完成账号注册。
    2. 开通能力:请确保您已开通文字识别服务,若未开通服务请立即开通
    3. 创建 AccessKey:请确保您已创建 AccessKey,如果您使用的是子账号 AccessKey,您需要给子账号赋予 AliyunVIAPIFullAccess 权限,具体操作,请参见 RAM 授权
    4. 在线调试(可选):您可以通过OpenAPI Explorer在线调试能力,查看完整的调用示例代码及 SDK 依赖信息,也可以下载完整的工程。
    5. 开发接入步骤:
    • SDK 总览中选择您要接入使用的 SDK 语言。
    • 在对应语言的 SDK 文档中找到 AI 类目为文字识别(ocr)的 SDK 包进行安装。
    • 参考文档中提供的示例代码进行适当修改后调用。
    1. 示例代码:该能力常用语言的示例代码,请参见 PDF 识别示例代码

    2. 客户端直接调用:该能力常用的客户端调用方式包括以下几种。

    输入限制

    • 文件格式:PDF。
    • 文件大小:不超过 10 MB。
    • 文档篇幅:PDF 不超过 5 页。
    • URL 地址中不能包含中文字符。

    计费说明

    关于 PDF 识别的计费方式及报价,请参见计费介绍

    说明 下方调试接口为付费接口,如需免费体验调试请前往体验中心

    流控信息

    当前云产品API请求速率暂未透出。

    授权信息

    当前云产品暂无权限信息透出。

    请求参数

    字段名称字段详情
    FileURLstring

    文件 URL 地址。推荐使用上海地域的 OSS 链接,对于文件在本地或者非上海地域 OSS 链接的情况,请参见文件 URL 处理

    示例值:https://viapi-test.oss-cn-shanghai.aliyuncs.com/ocr/xxxx.pdf

    返回参数

    字段名称字段详情
    RequestIdstring

    请求 ID。

    示例值:CD9A9659-ABEE-4A7D-837F-9FDF40879A97
    Dataobject

    返回的结果数据内容。

    返回说明

    SDK 参考

    阿里云视觉 AI 文字识别类目下的 PDF 识别能力推荐使用 SDK 调用,支持多种编程语言,调用时请选择 AI 类目为文字识别(ocr)的 SDK 包,文件参数通过 SDK 调用可支持本地文件及任意 URL,具体可参见 SDK 总览

    示例代码

    该能力常用语言的示例代码,请参见 PDF 识别示例代码

    返回示例

    错误码

    全局错误码
    HTTP 状态码错误码错误信息操作
    400
    ParameterError
    The parameter is invalid. Please check again.诊断
    403
    AuthFailed
    An error occurred while performing authorization. Please check your RAM configuration.诊断
    408
    Timeout
    The request has timed out.诊断
    503
    ServiceUnavailable
    The service is unavailable.诊断

    变更历史

    变更时间变更内容概要操作
    2022-09-27
    变更返回参数
    2021-07-01
    新增OpenAPI,PDF识别

    相关示例