找不到 API ? 点击 反馈吧
- OCR统一识别
- 通用文字识别
- 个人证照识别
- 票据凭证识别
- 企业资质识别
- 车辆物流识别
- 教育场景识别
- 小语种文字识别
- 医疗场景识别
- 票证核验
RecognizeJanpanese
针对全日文图片文档场景下日文印刷体高效检测和识别,支持旋转、表格、文字坐标等多项基础功能
服务地址:
华东1(杭州)
参数配置
高级配置
输入参数
只看必填
Url图片链接(长度不超2048字节
body图片二进制文件
OutputCharInfo是否输出单字识别结果
请选择布尔值
NeedRotate是否需要自动旋转功能(结构化检测、混贴...
请选择布尔值
OutputTable是否输出表格识别结果
请选择布尔值
文档
调用结果
SDK 示例
CLI示例
相关示例
调用历史
错误码
流控
插件下载了解更多
Alibaba Cloud Developer ToolkitbetaAlibaba Cloud OpenAPI
Alibaba Cloud Developer Toolkit is a collection of extensions that can help access Alibaba Cloud services in Visual Studio Code.
安装插件之前,确保已安装 JetBrains IDE安装插件之前,确保已安装 JetBrains IDE
Alibaba Cloud Developer ToolkitbetaAlibaba Cloud OpenAPI
The Alibaba Cloud Developer Toolkit for JetBrains makes it easier to access Alibaba Cloud services.
请求参数
字段名称 | 字段详情 |
---|---|
Urlstring | 图片链接(长度不超 2048 字节,不支持 base64) 示例值:https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20241223/igoptb/%E6%97%A5%E8%AF%AD%E8%AF%86%E5%88%AB.png |
bodystring<binary> | 图片二进制文件,最大 10MB,与 URL 二选一。 使用 HTTP 方式调用,把图片二进制文件放到 HTTP body 中上传即可。 使用 SDK 的方式调用,把图片放到 SDK 的 body 中即可 示例值:图片二进制文件 |
OutputCharInfoboolean | 是否输出单字识别结果 示例值:false |
NeedRotateboolean | 是否需要自动旋转功能(结构化检测、混贴场景、教育相关场景会自动做旋转,无需设置),返回角度信息 示例值:false |
OutputTableboolean | 是否输出表格识别结果,包含单元格信息 示例值:false |
请求说明
支持的图片格式
- PNG、JPG、JPEG、BMP、GIF、TIFF、WebP
返回参数
字段名称 | 字段详情 |
---|---|
RequestIdstring | 请求唯一 ID 示例值:43A29C77-405E-4CC0-BC55-EE694AD00655 |
Datastring | 返回数据 示例值:{"content":"いくら飞すか (多少钱?) ","height":384,"orgHeight":384,"orgWidth":512,"prism_version":"1.0.9","prism_wnum":2,"prism_wordsInfo":[{"angle":-89,"direction":0,"height":508,"pos":[{"x":2,"y":85},{"x":509,"y":85},{"x":509,"y":170},{"x":2,"y":170}],"prob":99,"width":84,"word":"いくら飞すか","x":213,"y":-126}],"width":512} |
Codestring | 错误码(如果识别成功,不会返回此字段) 示例值:noPermission |
Messagestring | 错误提示(如果识别成功,不会返回此字段) 示例值:You are not authorized to perform this operation. |
返回说明
返回数据说明
angle 图片的角度,0 表示正向,90 表示图片朝右,180 朝下,270 朝左</br>
content 识别出图片的文字块汇总</br>
height 算法矫正图片后的高度</br>
width 算法矫正图片后的宽度</br>
orgHeight 原图的高度</br>
orgWidth 原图的宽度</br>
prism_wnum 识别的文字块的数量,prism_wordsInfo 数组的大小</br>
-------------------------prism-wordsInfo 文字块数组内的字段说明-------------------------</br>
angle 文字块的角度,这个角度只影响 width 和 height,当角度为-90、90、-270、270,width 和 height 的值需要自行互换</br>
height 文字块的高度</br>
width 文字块的宽度</br>
pos 文字块的外矩形四个点的坐标按顺时针排列,左上、右上、右下、左下,当 NeedRotate 为 true 时,如果最外层的 angle 不为 0,需要按照 angle 矫正图片后,坐标才准确</br>
word 文字块的文字</br>
tableId 当 OutputTable 为 true 并且该文字块在表格内则存在该字段,tableId 表示表格的 id</br>
tableCellId 当 OutputTable 为 true 并且该文字块在表格内则存在该字段,表示表格中单元格的 id</br>
----------------------------------------charInfo 单字信息-----------------------------------------</br>
word 单字文字</br>
x 单字左上角横坐标</br>
y 单字左上角纵坐标</br>
w 单字宽度
<span>h 单字高度</span></br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>
---------------------------prism-tablesInfo 表格数组内的字段说明--------------------------</br>
tableId 表格 id,和 prism_wordsInfo 信息中的 tableId 对应</br>
xCellSize 表格中横坐标单元格的数量</br>
yCellSize 表格中纵坐标单元格的数量</br>
------------cellInfos 单元格信息,包含单元格在整个表格中的空间拓扑关系---------</br>
tableCellId 表格中单元格 id,和 prism_wordsInfo 信息中的 tableCellId 对应</br>
word 单元格中的文字</br>
xsc xStartCell 缩写,表示横轴方向该单元格起始在第几个单元格,第一个单元格值为 0</br>
xec xEndCell 缩写,表示横轴方向该单元格结束在第几个单元格,第一个单元格值为 0,如果 xsc 和 xec 都为 0 说明该文字在横轴方向占据了一个单元格并且在第一个单元格内</br>
ysc yStartCell 缩写,表示纵轴方向该单元格起始在第几个单元格,第一个单元格值为 0</br>
yec yEndCell 缩写,表示纵轴方向该单元格结束在第几个单元格,第一个单元格值为 0</br>
pos 单元格位置,按照单元格四个角的坐标顺时针排列,分别为左上 XY 坐标、右上 XY 坐标、右下 XY 坐标、左下 XY 坐标</br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>
变更历史
变更时间 | 变更内容概要 | 操作 | |
---|---|---|---|
2021-08-17 | 变更请求参数Url 新增请求参数body |