复杂文档处理

小艾同学 ... 大约 3 分钟

# 复杂文档处理

如有不同功能定制化的需求或者疑问,直接联系QQ:1121225022

# 复杂文档

复杂文档是指:pdf、word、图片等文件中有文字、公式、表格、印章、二维码、化学结构图、流程图等

# 复杂文档处理示例

创建知识库

创建知识库

创建知识库

创建知识库

创建知识库

创建知识库

创建知识库

创建知识库

创建知识库

创建知识库

创建知识库

注意下面是针对PDF和word等文档中包含数学公式、表格、图片、印章、化学结构式等复杂内容的情况

此外,对某一具体功能(比如数学公式的检测与识别),其支持点和待支持点应该查看该具体功能的文档及API

由于pdf格式输入文档会被自动转化为图片格式的文件,所以下面的说明同时适用于图片、word、PDF格式的输入。

# 可处理的复杂文档中的内容

注意:允许输入文档具有单一的内容,比如pdf或图片中只有单一的文字、单一的公式、单一的表格、单一的印章等

  • 文档(pdf、图片、表格、word等)的文字提取

  • 图片

  • 表格。表格可以检测到,但只有固定格式的表格才可以正确识别。如果无法识别,会以图片的形式返回。

  • 行内公式

  • 行间公式

  • 文本

  • 印章

  • 二维码

  • 条形码

  • 化学结构式

  • 街景图片

  • 手写文字可检测到,但识别不一定正确。

  • 手写公式有较大局限性

# 可处理复杂的文字形式

  • 复杂字体,艺术字体

  • 中文和英文混合

  • 支持复杂背景

  • 支持街景

  • 支持噪声、旋转、模糊、缺失等复杂情况

  • 如果图片/pdf中仅有文字,没有公式和表格等,则支持图片/pdf倒置180°、90°、270°的情况

  • 支持手写字体检测,但识别准确率较低

# 待支持的复杂的文字形式

  • 特殊字体

  • 其他语种

  • 手写识别率低

# 文档形状和方向可旋转

# 支持

  • 支持 [-10,10] 的角度旋转
  • 支持90度,180度,270度的旋转

# 待支持

  • 不能有仿射变换。这部分将放在客户端进行

  • 不能有透视变换。这部分将放在客户端进行

  • 不能3D扭曲。这部分将放在客户端进行

  • 皱褶也不可以。这部分将放在客户端进行

# 文档颜色和背景

# 支持

  • 支持街景图片。

  • 支持简单的背景颜色,比如黄色,红色等,可行。

  • 支持复杂背景,比如图片背景,渐变颜色背景等。

  • 支持被污染的,比如油渍等等。

# 文档大小

# 支持

  • 支持多页,如果是 pdf 文件,可以是多页

  • 普通的文档一页的大小,可以

  • 普通的截图大小,也可以

  • 图片大小最好不要超过屏幕一页的大小

# 待支持

  • 不能是很长的图,很长的图会导致无法处理。这部分将放在客户端进行

  • 不能是宽图。这部分将放在客户端进行

# 其他

# 待支持

  • 马赛克。这部分将放在客户端进行

  • 模糊。这部分将放在客户端进行

上次编辑于: 2025年6月9日 18:00