输入图片PDF格式说明

小艾同学 ... 大约 2 分钟

# 输入图片PDF格式说明

对输入的整体图片/文档（pdf），有如下支持和不支持的点，不支持的地方会导致解析失败，或者解析结果不是很好，这是用户需要注意的地方。

此外，对某一具体功能(比如数学公式的检测与识别)，其支持点和不支持点应该查看该具体功能的文档。

由于pdf格式输入文档会被自动转化为图片格式的文件，所以下面的说明同时适用于图片和PDF格式的输入。

# 形状和方向

# 支持

已经支持 [-10,9] 的角度旋转。

# 不支持

方向 0，方向区别于角度。方向指90度，180度，270度的旋转。该功能虽然已经完成，但只完成了部分，不能对大图片整体识别方向。
不能有仿射变换
不能有透视变换。该功能在设计中。。。
不能3D扭曲
皱褶也不可以

# 颜色

# 支持

白底黑字。如果不是白色，则不可以使用角度方向功能，即要求输入图片无角度旋转，是直立的。也不可以使用表格解析功能。

# 不支持

不支持简单的背景颜色，比如黄色，红色等，不可行。但该功能基本已经完成，马上就能支持。
不支持复杂背景，比如图片背景，渐变颜色背景等。
不支持被污染的，比如油渍等等。

# 大小

# 支持

图片大小最好不要超过屏幕一页的大小
普普通通的截图大小就可以

# 不支持

不能是长图，长图会导致无法处理。
不能是宽图
不支持多页，如果是 pdf 文件，只可以处理第一页

# 文档内容

# 支持

能够检测并识别文档中的内容是如下的四种，如果文档中没有对应内容，会自动忽略。

图片
表格
公式
文本

# 不支持

印章
二维码
条形码
水印
emoji
乐谱
流程图
UML图
不支持街景，只适用于普通文档

# 文字

# 支持

中文英文
普通字体

# 不支持

字体
语种
手写

# 其他

# 不支持

马赛克
模糊
多栏/多列，图片中不能有多列，比如论文中的两列（双页面），这个是不可以的。但该功能基本已经完成，马上就能支持。

🔱功能说明文字检测说明