复杂文档处理
# 复杂文档处理
如有不同功能定制化的需求或者疑问,直接联系QQ:1121225022
# 复杂文档
复杂文档是指:pdf、word、图片等文件中有文字、公式、表格、印章、二维码、化学结构图、流程图等
# 复杂文档处理示例
注意下面是针对PDF和word等文档中包含数学公式、表格、图片、印章、化学结构式等复杂内容的情况
此外,对某一具体功能(比如数学公式的检测与识别),其支持点和待支持点应该查看该具体功能的文档及API。
由于pdf格式输入文档会被自动转化为图片格式的文件,所以下面的说明同时适用于图片、word、PDF格式的输入。
# 可处理的复杂文档中的内容
注意:允许输入文档具有单一的内容,比如pdf或图片中只有单一的文字、单一的公式、单一的表格、单一的印章等
文档(pdf、图片、表格、word等)的文字提取
图片
表格。表格可以检测到,但只有固定格式的表格才可以正确识别。如果无法识别,会以图片的形式返回。
行内公式
行间公式
文本
印章
二维码
条形码
化学结构式
街景图片
手写文字可检测到,但识别不一定正确。
手写公式有较大局限性
# 可处理复杂的文字形式
复杂字体,艺术字体
中文和英文混合
支持复杂背景
支持街景
支持噪声、旋转、模糊、缺失等复杂情况
如果图片/pdf中仅有文字,没有公式和表格等,则支持图片/pdf倒置180°、90°、270°的情况
支持手写字体检测,但识别准确率较低
# 待支持的复杂的文字形式
特殊字体
其他语种
手写识别率低
# 文档形状和方向可旋转
# 支持
- 支持 [-10,10] 的角度旋转
- 支持90度,180度,270度的旋转
# 待支持
不能有仿射变换。
这部分将放在客户端进行
不能有透视变换。
这部分将放在客户端进行
不能3D扭曲。
这部分将放在客户端进行
皱褶也不可以。
这部分将放在客户端进行
# 文档颜色和背景
# 支持
支持街景图片。
支持简单的背景颜色,比如黄色,红色等,可行。
支持复杂背景,比如图片背景,渐变颜色背景等。
支持被污染的,比如油渍等等。
# 文档大小
# 支持
支持
多页
,如果是 pdf 文件,可以是多页普通的文档一页的大小,可以
普通的截图大小,也可以
图片大小最好不要超过屏幕一页的大小
# 待支持
不能是很长的图,很长的图会导致无法处理。
这部分将放在客户端进行
不能是宽图。
这部分将放在客户端进行
# 其他
# 待支持
马赛克。
这部分将放在客户端进行
模糊。
这部分将放在客户端进行