输入图片PDF格式说明

小艾同学 ... 大约 2 分钟

# 输入图片PDF格式说明

对输入的整体图片/文档(pdf),有如下支持和不支持的点,不支持的地方会导致解析失败,或者解析结果不是很好,这是用户需要注意的地方。

此外,对某一具体功能(比如数学公式的检测与识别),其支持点和不支持点应该查看该具体功能的文档。

由于pdf格式输入文档会被自动转化为图片格式的文件,所以下面的说明同时适用于图片和PDF格式的输入。

# 形状和方向

# 支持

  • 已经支持 [-10,9] 的角度旋转。

# 不支持

  • 方向 0,方向区别于角度。方向指90度,180度,270度的旋转。该功能虽然已经完成,但只完成了部分,不能对大图片整体识别方向。

  • 不能有仿射变换

  • 不能有透视变换。该功能在设计中。。。

  • 不能3D扭曲

  • 皱褶也不可以

# 颜色

# 支持

  • 白底黑字。如果不是白色,则不可以使用角度方向功能,即要求输入图片无角度旋转,是直立的。也不可以使用表格解析功能。

# 不支持

  • 不支持简单的背景颜色,比如黄色,红色等,不可行。但该功能基本已经完成,马上就能支持。

  • 不支持复杂背景,比如图片背景,渐变颜色背景等。

  • 不支持被污染的,比如油渍等等。

# 大小

# 支持

  • 图片大小最好不要超过屏幕一页的大小

  • 普普通通的截图大小就可以

# 不支持

  • 不能是长图,长图会导致无法处理。

  • 不能是宽图

  • 不支持多页,如果是 pdf 文件,只可以处理第一页

# 文档内容

# 支持

能够检测并识别文档中的内容是如下的四种,如果文档中没有对应内容,会自动忽略。

  • 图片

  • 表格

  • 公式

  • 文本

# 不支持

  • 印章

  • 二维码

  • 条形码

  • 水印

  • emoji

  • 乐谱

  • 流程图

  • UML图

  • 不支持街景,只适用于普通文档

# 文字

# 支持

  • 中文英文

  • 普通字体

# 不支持

  • 字体

  • 语种

  • 手写

# 其他

# 不支持

  • 马赛克

  • 模糊

  • 多栏/多列,图片中不能有多列,比如论文中的两列(双页面),这个是不可以的。但该功能基本已经完成,马上就能支持。

上次编辑于: 2021年8月31日 22:57