RecognizeDocumentStructure_文字识别_API文档

插件下载了解更多
VS Code 插件
安装插件之前,确保已安装 VS Code安装插件之前,确保已安装 VS Code
Alibaba Cloud Developer Toolkit is a collection of extensions that can help access Alibaba Cloud services in Visual Studio Code.
JetBrains 插件
安装插件之前,确保已安装 JetBrains IDE安装插件之前,确保已安装 JetBrains IDE
The Alibaba Cloud Developer Toolkit for JetBrains makes it easier to access Alibaba Cloud services.

流控信息

当前云产品API请求速率暂未透出。

授权信息

如下是此API对应的授权信息,用于RAM权限策略语句的Action元素中,为RAM用户或RAM角色授予调用此API的权限。请通过 RAM 访问控制设置,使用方法可参考访问控制帮助文档

具体说明如下:展开详情

操作访问级别资源类型条件关键字关联操作
ocr:RecognizeDocumentStructure
Write
全部资源
*

请求参数

字段名称字段详情
Urlstring

图片链接(长度不超 2048 字节,不支持 base64)。

示例值:https://img.alicdn.com/imgextra/i4/O1CN01amMFBF1GUki3NHNzI_!!6000000000626-2-tps-978-1346.png
bodystring<binary>

图片二进制文件,最大 10MB,与 URL 二选一。展开详情

示例值:图片二进制文件
NeedRotateboolean

是否需要自动旋转功能,返回角度信息。默认不需要。true:需要 false:不需要。

示例值:false
OutputCharInfoboolean

是否输出单字识别结果,默认不需要。true:需要 false:不需要。展开详情

示例值:false
OutputTableboolean

是否输出表格识别结果,包含单元格信息。默认不需要。true:需要 false:不需要。

示例值:false
NeedSortPageboolean

是否按顺序输出文字块,默认不需要。true:需要 false:不需要。false 表示从左往右,从上到下的顺序;true 表示从上到下,从左往右的顺序。展开详情

示例值:false
Pageboolean

是否需要分页功能,默认不需要。 true:需要 false:不需要。展开详情

示例值:false
NoStampboolean

是否需要去除印章功能,默认不需要。true:需要 false:不需要

示例值:false
Paragraphboolean

是否需要分段功能,默认不需要。true:需要 false:不需要。展开详情

示例值:false
Rowboolean

是否需要成行返回功能,默认不需要。true:需要 false:不需要。展开详情

示例值:false
UseNewStyleOutputboolean

是否返回新版格式输出,默认为 false

示例值:false

请求说明

支持的图片格式

  • PNG、JPG、JPEG、BMP、GIF、TIFF、WebP
  • PDF 文件格式的文档结构化解析请点击文档智能解析快速了解

返回参数

字段名称字段详情
RequestIdstring

请求唯一 ID

示例值:43A29C77-405E-4CC0-BC55-EE694AD00655
Datastring

返回数据

示例值:{"algo_version": "", "angle": 0, "content": "1.1技术方案设计贵公司进行防磨喷涂的锅炉均为循环流化床锅炉,作为一种新型燃烧技术,由于炉型结构和设计参数等特点,在环保性能、燃烧效率、燃料适应性、高效脱硫及灰渣综合利用等方法,具有很大的优越性。然而, CFB锅炉受热面的磨损问题十分严重,贵公司决定采用超音速电弧金属喷涂技术来解决锅炉受热面磨损问题,以减少锅炉的非计划停运。我公司技术服务组根据全国各电厂的防磨防护情况,针对锅炉运行的详细状况、工艺参数以及失效因素,并依据我公司多年来从事该行业的宝贵工程经验,经我公司技术服务组专业人员的认真分析研究,并对上述部位的防护1问题分析:锅炉卫燃带,炉膛出口处,焊缝处的磨损、减薄与气流中固体物料浓度、烟气速度、颗粒的特性硬度和流道几何形状等密切相关,而在CFB锅炉中,固体物料的浓度巨大,通常可达煤粉炉的几十倍到上百倍,并且烟气流速大,颗粒硬且棱角尖锐,因而在高速烟气的带动下,对CFB 锅炉水冷壁等受热面部位的冲刷磨损极为严重;尤其在护墙根部水冷壁部位,由于位处密相区边缘区,不但受到严重的高速高浓度含床料、燃料气流的强烈冲刷、磨损,而且存在严重的涡流效应、切割效应和离心作用。涡流效应在炉膛四角部位,由于该处形成边壁流,物料汇集此处较多,由于固体颗粒的惯性作用,局部磨损作用尤为明显,而切割效应体现在护墙根部水冷壁处,其原因是由于防护墙的顶部提供了一个平台,当焦渣以较高的速度下降到该平台时产生反弹,其中往水冷壁管侧反弹部分,对水冷壁管就产生了严重的切割效应,离心作用是由于颗粒运行时受到烟气离心作用而引起。其次还易受到高温氧化和硫酸盐及硫、硫化物的热腐蚀。水冷壁管具备了高温氧化和高温腐蚀条件,其烟气温度高,且是富氧燃烧,实践证明, 在300℃以上,管外表温度每升高50℃, 腐蚀速度增加1倍。锅炉在运行过程中受热面管表面首先发生高温氧化,表面生成Fe20s, 其次燃料灰中的Na20和K20与烟气中的SOs化合生成硫酸盐,其捕捉飞灰形成结渣和流渣,此时烟气中SOs与M2S04同管壁上的Fe20s反应生成复合硫酸盐MFe (S04) 2或MaFe (S04)3,此复合硫酸盐受高温又分解为疏松状氧化铁和硫酸盐沉积层,易被飞灰气流冲蚀带走,氧化腐蚀继续向管壁纵深进行;另外燃料中硫份,经燃烧生成的S和HeS也对管壁会产生强烈的腐蚀,与Fe反应生成FeS。", "figure": [], "height": 1128, "orgHeight": 1128, "orgWidth": 912, "prism_pagesInfo": [{"pageId": 0, "word": "1.1技术方案设计贵公司进行防磨喷涂的锅炉均为循环流化床锅炉,作为一种新型燃烧技术,由于炉型结构和设计参数等特点,在环保性能、燃烧效率、燃料适应性、高效脱硫及灰渣综合利用等方法,具有很大的优越性。然而, CFB锅炉受热面的磨损问题十分严重,贵公司决定采用超音速电弧金属喷涂技术来解决锅炉受热面磨损问题,以减少锅炉的非计划停运。我公司技术服务组根据全国各电厂的防磨防护情况,针对锅炉运行的详细状况、工艺参数以及失效因素,并依据我公司多年来从事该行业的宝贵工程经验,经我公司技术服务组专业人员的认真分析研究,并对上述部位的防护1问题分析:锅炉卫燃带,炉膛出口处,焊缝处的磨损、减薄与气流中固体物料浓度、烟气速度、颗粒的特性硬度和流道几何形状等密切相关,而在CFB锅炉中,固体物料的浓度巨大,通常可达煤粉炉的几十倍到上百倍,并且烟气流速大,颗粒硬且棱角尖锐,因而在高速烟气的带动下,对CFB 锅炉水冷壁等受热面部位的冲刷磨损极为严重;尤其在护墙根部水冷壁部位,由于位处密相区边缘区,不但受到严重的高速高浓度含床料、燃料气流的强烈冲刷、磨损,而且存在严重的涡流效应、切割效应和离心作用。涡流效应在炉膛四角部位,由于该处形成边壁流,物料汇集此处较多,由于固体颗粒的惯性作用,局部磨损作用尤为明显,而切割效应体现在护墙根部水冷壁处,其原因是由于防护墙的顶部提供了一个平台,当焦渣以较高的速度下降到该平台时产生反弹,其中往水冷壁管侧反弹部分,对水冷壁管就产生了严重的切割效应,离心作用是由于颗粒运行时受到烟气离心作用而引起。其次还易受到高温氧化和硫酸盐及硫、硫化物的热腐蚀。水冷壁管具备了高温氧化和高温腐蚀条件,其烟气温度高,且是富氧燃烧,实践证明, 在300℃以上,管外表温度每升高50℃, 腐蚀速度增加1倍。锅炉在运行过程中受热面管表面首先发生高温氧化,表面生成Fe20s, 其次燃料灰中的Na20和K20与烟气中的SOs化合生成硫酸盐,其捕捉飞灰形成结渣和流渣,此时烟气中SOs与M2S04同管壁上的Fe20s反应生成复合硫酸盐MFe (S04) 2或MaFe (S04)3,此复合硫酸盐受高温又分解为疏松状氧化铁和硫酸盐沉积层,易被飞灰气流冲蚀带走,氧化腐蚀继续向管壁纵深进行;另外燃料中硫份,经燃烧生成的S和HeS也对管壁会产生强烈的腐蚀,与Fe反应生成FeS。"}], "prism_paragraphsInfo": [{"paragraphId": 0, "word": "1.1技术方案设计"}, {"paragraphId": 1, "word": "贵公司进行防磨喷涂的锅炉均为循环流化床锅炉,作为一种新型燃烧技术,由于炉型结构和设计参数等特点,在环保性能、燃烧效率、燃料适应性、高效脱硫及灰渣综合利用等方法,具有很大的优越性。然而, CFB锅炉受热面的磨损问题十分严重,贵公司决定采用超音速电弧金属喷涂技术来解决锅炉受热面磨损问题,以减少锅炉的非计划停运。我公司技术服务组根据全国各电厂的防磨防护情况,针对锅炉运行的详细状况、工艺参数以及失效因素,并依据我公司多年来从事该行业的宝贵工程经验,经我公司技术服务组专业人员的认真分析研究,并对上述部位的防护"}, {"paragraphId": 2, "word": "1问题分析:"}, {"paragraphId": 3, "word": "锅炉卫燃带,炉膛出口处,焊缝处的磨损、减薄与气流中固体物料浓度、烟气速度、颗粒的特性硬度和流道几何形状等密切相关,而在CFB锅炉中,固体物料的浓度巨大,通常可达煤粉炉的几十倍到上百倍,并且烟气流速大,颗粒硬且棱角尖锐,因而在高速烟气的带动下,对CFB 锅炉水冷壁等受热面部位的冲刷磨损极为严重;尤其在护墙根部水冷壁部位,由于位处密相区边缘区,不但受到严重的高速高浓度含床料、燃料气流的强烈冲刷、磨损,而且存在严重的涡流效应、切割效应和离心作用。涡流效应在炉膛四角部位,由于该处形成边壁流,物料汇集此处较多,由于固体颗粒的惯性作用,局部磨损作用尤为明显,而切割效应体现在护墙根部水冷壁处,其原因是由于防护墙的顶部提供了一个平台,当焦渣以较高的速度下降到该平台时产生反弹,其中往水冷壁管侧反弹部分,对水冷壁管就产生了严重的切割效应,离心作用是由于颗粒运行时受到烟气离心作用而引起。"}, {"paragraphId": 4, "word": "其次还易受到高温氧化和硫酸盐及硫、硫化物的热腐蚀。水冷壁管具备了高温氧化和高温腐蚀条件, 其烟气温度高,且是富氧燃烧,实践证明, 在300℃以上,管外表温度每升高50℃, 腐蚀速度增加1倍。锅炉在运行过程中受热面管表面首先发生高温氧化,表面生成Fe20s, 其次燃料灰中的Na20和K20与烟气中的SOs化合生成硫酸盐,其捕捉飞灰形成结渣和流渣,此时烟气中SOs与M2S04同管壁上的Fe20s反应生成复合硫酸盐MFe (S04) 2或MaFe (S04)3,此复合硫酸盐受高温又分解为疏松状氧化铁和硫酸盐沉积层,易被飞灰气流冲蚀带走,氧化腐蚀继续向管壁纵深进行;另外燃料中硫份,经燃烧生成的S和HeS也对管壁会产生强烈的腐蚀,与Fe反应生成FeS。"}], "prism_rowsInfo": [{"rowId": 0, "word": "1.1技术方案设计"}, {"rowId": 1, "word": "贵公司进行防磨喷涂的锅炉均为循环流化床锅炉,作为一种新型燃烧技术,由于炉型结构和设计参"}, {"rowId": 2, "word": "数等特点,在环保性能、燃烧效率、燃料适应性、高效脱硫及灰渣综合利用等方法,具有很大"}, {"rowId": 3, "word": "的优越性。然而, CFB锅炉受热面的磨损问题十分严重,贵公司决定采用超音速电弧金属喷涂技"}, {"rowId": 4, "word": "术来解决锅炉受热面磨损问题,以减少锅炉的非计划停运。我公司技术服务组根据全国各电厂的"}, {"rowId": 5, "word": "防磨防护情况,针对锅炉运行的详细状况、工艺参数以及失效因素,并依据我公司多年来从事"}, {"rowId": 6, "word": "该行业的宝贵工程经验,经我公司技术服务组专业人员的认真分析研究,并对上述部位的防护"}, {"rowId": 7, "word": "1问题分析:"}, {"rowId": 8, "word": "锅炉卫燃带,炉膛出口处,焊缝处的磨损、减薄与气流中固体物料浓度、烟气速度、颗粒的特"}, {"rowId": 9, "word": "性硬度和流道几何形状等密切相关,而在CFB锅炉中,固体物料的浓度巨大,通常可达煤粉炉的"}, {"rowId": 10, "word": "几十倍到上百倍,并且烟气流速大,颗粒硬且棱角尖锐,因而在高速烟气的带动下,对CFB 锅"}, {"rowId": 11, "word": "炉水冷壁等受热面部位的冲刷磨损极为严重;尤其在护墙根部水冷壁部位,由于位处密相区边"}, {"rowId": 12, "word": "缘区,不但受到严重的高速高浓度含床料、燃料气流的强烈冲刷、磨损,而且存在严重的涡流"}, {"rowId": 13, "word": "效应、切割效应和离心作用。涡流效应在炉膛四角部位,由于该处形成边壁流,物料汇集此处"}, {"rowId": 14, "word": "较多,由于固体颗粒的惯性作用,局部磨损作用尤为明显,而切割效应体现在护墙根部水冷壁"}, {"rowId": 15, "word": "处,其原因是由于防护墙的顶部提供了一个平台,当焦渣以较高的速度下降到该平台时产生反"}, {"rowId": 16, "word": "弹,其中往水冷壁管侧反弹部分,对水冷壁管就产生了严重的切割效应,离心作用是由于颗粒"}, {"rowId": 17, "word": "运行时受到烟气离心作用而引起。"}, {"rowId": 18, "word": "其次还易受到高温氧化和硫酸盐及硫、硫化物的热腐蚀。水冷壁管具备了高温氧化和高温腐"}, {"rowId": 19, "word": "蚀条件,其烟气温度高,且是富氧燃烧,实践证明, 在300℃以上,管外表温度每升高50℃, 腐"}, {"rowId": 20, "word": "蚀速度增加1倍。锅炉在运行过程中受热面管表面首先发生高温氧化,表面生成Fe20s, 其次燃"}, {"rowId": 21, "word": "料灰中的Na20和K20与烟气中的SOs化合生成硫酸盐,其捕捉飞灰形成结渣和流渣,此时烟气中"}, {"rowId": 22, "word": "SOs与M2S04同管壁上的Fe20s反应生成复合硫酸盐MFe (S04) 2或MaFe (S04)3,此复合硫酸盐受"}, {"rowId": 23, "word": "高温又分解为疏松状氧化铁和硫酸盐沉积层,易被飞灰气流冲蚀带走,氧化腐蚀继续向管壁纵"}, {"rowId": 24, "word": "深进行;另外燃料中硫份,经燃烧生成的S和HeS也对管壁会产生强烈的腐蚀,与Fe反应生成"}, {"rowId": 25, "word": "FeS。"}], "prism_version": "1.0.9", "prism_wnum": 26, "prism_wordsInfo": [{"pageId": 0, "paragraphId": 0, "pos": [{"x": 384, "y": 116}, {"x": 538, "y": 116}, {"x": 538, "y": 137}, {"x": 384, "y": 137}], "prob": 100, "rowId": 0, "tableCellId": -1, "tableId": -1, "word": "1.1技术方案设计"}, {"pageId": 0, "paragraphId": 1, "pos": [{"x": 129, "y": 149}, {"x": 776, "y": 149}, {"x": 776, "y": 169}, {"x": 129, "y": 168}], "prob": 100, "rowId": 1, "tableCellId": -1, "tableId": -1, "word": "贵公司进行防磨喷涂的锅炉均为循环流化床锅炉,作为一种新型燃烧技术,由于炉型结构和设计参"}, {"pageId": 0, "paragraphId": 1, "pos": [{"x": 120, "y": 177}, {"x": 779, "y": 177}, {"x": 779, "y": 198}, {"x": 120, "y": 197}], "prob": 100, "rowId": 2, "tableCellId": -1, "tableId": -1, "word": "数等特点,在环保性能、燃烧效率、燃料适应性、高效脱硫及灰渣综合利用等方法,具有很大"}, {"pageId": 0, "paragraphId": 1, "pos": [{"x": 121, "y": 205}, {"x": 787, "y": 207}, {"x": 787, "y": 227}, {"x": 121, "y": 225}], "prob": 100, "rowId": 3, "tableCellId": -1, "tableId": -1, "word": "的优越性。然而, CFB锅炉受热面的磨损问题十分严重,贵公司决定采用超音速电弧金属喷涂技"}, {"pageId": 0, "para
Codestring

错误码(如果识别成功,不会返回此字段)

示例值:noPermission枚举值:成功失败
Messagestring

错误提示(如果识别成功,不会返回此字段)

示例值:You are not authorized to perform this operation.

返回说明

返回字段补充说明

第一种返回格式(UseNewStyleOutput=false)
angle    图片的角度,当 NeedRotate 为 true 时才会返回,0 表示正向,90 表示图片朝右,180 朝下,270 朝左
content    识别出图片的文字块汇总
height    算法矫正图片后的高度
width    算法矫正图片后的宽度
orgHeight    原图的高度
orgWidth    原图的宽度
prism_wnum    识别的文字块的数量,prism_wordsInfo 数组的大小
--------------------------prism-wordsInfo 文字块数组内的字段说明--------------------------
angle    文字块的角度,这个角度只影响 width 和 height,当角度为-90、90、-270、270,width 和 height 的值需要自行互换
height    文字块的高度
width    文字块的宽度
pos    文字块的外矩形四个点的坐标按顺时针排列,左上、右上、右下、左下
word    文字块内容
tableId    当 OutputTable 为 true 并且该文字块在表格内则存在该字段,tableId 表示表格的 id
tableCellId    当 OutputTable 为 true 并且该文字块在表格内则存在该字段,表示表格中单元格的 id
paragraphId    当 Paragraph 为 true 返回该字段,表示段落 id
-----------------------------------------charInfo 单字信息-------------------------------------------
word    单字文字
prob    置信度
x    单字左上角横坐标
y    单字左上角纵坐标
w    单字宽度
h    单字高度
-----------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------
----------------------------prism-tablesInfo 表格数组内的字段说明---------------------------
tableId    表格 id,和 prism_wordsInfo 信息中的 tableId 对应
xCellSize    表格中横坐标单元格的数量
yCellSize    表格中纵坐标单元格的数量
-------------cellInfos 单元格信息,包含单元格在整个表格中的空间拓扑关系-----------
tableCellId    表格中单元格 id,和 prism_wordsInfo 信息中的 tableCellId 对应
word    单元格中的文字
xsc    xStartCell 缩写,表示横轴方向该单元格起始在第几个单元格,第一个单元格值为 0
xec    xEndCell 缩写,表示横轴方向该单元格结束在第几个单元格,第一个单元格值为 0,如果 xsc 和 xec 都为 0 说明该文字在横轴方向占据了一个单元格并且在第一个单元格内
ysc    yStartCell 缩写,表示纵轴方向该单元格起始在第几个单元格,第一个单元格值为 0
yec    yEndCell 缩写,表示纵轴方向该单元格结束在第几个单元格,第一个单元格值为 0
pos    单元格位置,按照单元格四个角的坐标顺时针排列,分别为左上 XY 坐标、右上 XY 坐标、右下 XY 坐标、左下 XY 坐标

------------------------------------------------------------------------------------
第二种返回格式(UseNewStyleOutput=true)
docInfo    文档信息
layouts    版面信息列表
version    doc-json 版本信息
----------------------------------------docInfo 中的字段----------------------------------------
pages    文档页面列表
imageWidth    页面转图后的宽
imageHeight    页面转图后的高
pageIdAllDocs    页面在所有文档的页索引
pageIdCurDoc    页面在当前文档的页索引
----------------------------------------layouts 中的字段----------------------------------------
alignment    间距枚举(LEFT、CENTER、RIGHT、BOTH)
blocks    字块信息列表
text    文本内容
firstLinesChars    文字首行缩进
index    版面阅读顺序
lineHeight    行平均高度
pageNum    单元格所在页数
pos    文字块的外矩形四个点的坐标按顺时针排列,左上、右上、右下、左下
type    版面类型(title:标题、table:表格、table_name:表格名、table_note:表注、multicolumn:多栏文字、formula:公式、contents_title:目录标题、contents:目录主体、text:普通文字、figure:图表、foot:页脚、head:页眉、side:侧栏)
uniqueId    版面信息唯一 id
numCol    表格总列数
numRow    表格总行数
cells    单元格信息

返回示例

变更历史

变更时间变更内容概要操作
2022-08-17
新增OpenAPI,文档结构化识别

相关示例