输入图片PDF格式说明
小艾同学 ... 大约 2 分钟
# 输入图片PDF格式说明
对输入的整体图片/文档(pdf),有如下支持和不支持的点,不支持的地方会导致解析失败,或者解析结果不是很好,这是用户需要注意的地方。
此外,对某一具体功能(比如数学公式的检测与识别),其支持点和不支持点应该查看该具体功能的文档。
由于pdf格式输入文档会被自动转化为图片格式的文件,所以下面的说明同时适用于图片和PDF格式的输入。
# 形状和方向
# 支持
- 已经支持 [-10,9] 的角度旋转。
# 不支持
方向 0,方向区别于角度。方向指90度,180度,270度的旋转。该功能虽然已经完成,但只完成了部分,不能对大图片整体识别方向。
不能有仿射变换
不能有透视变换。该功能在设计中。。。
不能3D扭曲
皱褶也不可以
# 颜色
# 支持
- 白底黑字。如果不是白色,则不可以使用角度方向功能,即要求输入图片无角度旋转,是直立的。也不可以使用表格解析功能。
# 不支持
不支持简单的背景颜色,比如黄色,红色等,不可行。但该功能基本已经完成,马上就能支持。
不支持复杂背景,比如图片背景,渐变颜色背景等。
不支持被污染的,比如油渍等等。
# 大小
# 支持
图片大小最好不要超过屏幕一页的大小
普普通通的截图大小就可以
# 不支持
不能是长图,长图会导致无法处理。
不能是宽图
不支持多页,如果是 pdf 文件,只可以处理第一页
# 文档内容
# 支持
能够检测并识别文档中的内容是如下的四种,如果文档中没有对应内容,会自动忽略。
图片
表格
公式
文本
# 不支持
印章
二维码
条形码
水印
emoji
乐谱
流程图
UML图
不支持街景,只适用于普通文档
# 文字
# 支持
中文英文
普通字体
# 不支持
字体
语种
手写
# 其他
# 不支持
马赛克
模糊
多栏/多列,图片中不能有多列,比如论文中的两列(双页面),这个是不可以的。但该功能基本已经完成,马上就能支持。