ExtractDocumentText_智能媒体管理_API文档

插件下载了解更多
VS Code 插件
安装插件之前,确保已安装 VS Code安装插件之前,确保已安装 VS Code
Alibaba Cloud Developer Toolkit is a collection of extensions that can help access Alibaba Cloud services in Visual Studio Code.
JetBrains 插件
安装插件之前,确保已安装 JetBrains IDE安装插件之前,确保已安装 JetBrains IDE
The Alibaba Cloud Developer Toolkit for JetBrains makes it easier to access Alibaba Cloud services.

接口说明

  • 请确保在使用该接口前,已充分了解智能媒体管理产品的收费方式和价格

  • 调用该接口前,请确保当前 Region 已经存在可用的项目( Project ),详见项目管理

  • 支持常见的 Word、Excel、PPT、PDF、TXT 文档。

  • 文件大小最大不超过 200 MB。提取后的纯文本文件大小不超过 2 MB(约合 60 万中文字)。

注意 当文档格式较为复杂,或正文量过大时,可能出现超时错误。在此类场景建议使用 CreateOfficeConversionTask 接口,并将输出格式指定为 txt 来实现类似功能。

流控信息

当前云产品API请求速率暂未透出。

授权信息

如下是此API对应的授权信息,用于RAM权限策略语句的Action元素中,为RAM用户或RAM角色授予调用此API的权限。请通过 RAM 访问控制设置,使用方法可参考访问控制帮助文档

具体说明如下:展开详情

操作访问级别资源类型条件关键字关联操作
imm:ExtractDocumentText
None
Project
acs:imm:{#regionId}:{#accountId}:project/{#ProjectName}

请求参数

字段名称字段详情
ProjectNamestring

项目名称,获取方式请参见创建项目

示例值:immtest参考取值来源:
    CreateProject
    UpdateProject
    ListProjects
SourceURIstring

源数据的存储地址。展开详情

示例值:oss://test-bucket/test-object
SourceTypestring

源数据的后缀类型。默认根据输入对象的后缀名确定源数据的类型。当输入对象没有后缀名时,可以设置此参数,可选值如下。展开详情

示例值:docx
CredentialConfigCredentialConfig

链式授权配置对象,一般留空即可。展开详情

返回参数

字段名称字段详情
RequestIdstring

请求 ID。

示例值:94D6F994-E298-037E-8E8B-0090F27*****
DocumentTextstring

文档的文本正文内容。

示例值:测试内容。

返回示例

变更历史

变更时间变更内容概要操作
2023-12-13
变更请求参数SourceURI
新增请求参数SourceType

相关示例