本地知识库

小艾同学 ... 大约 24 分钟

# 本地知识库

# 什么是知识库

Image 2

知识库

知识库(Knowledge Base)主要用于🙈文件内容搜索、🙊文件知识问答

通俗来讲,可以搜索pdf内容🙉、搜索图片内容💌、搜索word内容💓、并依据文件内容进行回答💝

政企单位则主要用于👏智能客服系统🙌智能推荐👐企业知识管理系统

deepseek等大模型通常只依赖网络中的知识进行回答。如果要依据个人电脑企业服务器的文档知识进行回答,则需要使用知识库

知识库

1、🤠用户将个人电脑中文件或文件夹投影到本地知识库:如pdf、word、markdown、图片、excel表格、语音、视频内容等等

2、🤡知识库会深度解析文档中的内容

3、🤖用户可以直接搜索相关内容在哪些文件中。如:“发票”在哪些文件中出现、以及哪些文件与“发票”相似有关等。

4、😺用户也可以直接进行问答,依据知识库中的文件知识进行回答。如:“公司的规章2是什么?”

云知识库不同,本地知识库只存在于当前电脑的硬盘中,不依赖外部云服务。如果更换电脑,需要注意硬盘的更换

# 新建本地知识库

新建本地知识库

🤗新建本地知识库时,先点击知识库目录的下方空白处,将当前路径更改为根目录,再新建知识库

👁️‍🗨️默认预留的知识库功能最单一的知识库(仅能搜索包含型的文本)。💯更复杂的知识库功能,请新建知识库进行使用!!!

💥选中目录后,才能上传文件

Image 2

# 知识库上传文件操作指南

知识库上传文件

选中目标文件夹后,才能上传文件👍

支持丰富的文件格式

Image 2

访答知识库各种类型的文件内容都会被详细解析,并用于查询问答。例如:

  • 图片:图片中的文字、图片描述的内容
  • pdf:pdf文件 中的图片、公式、表格、印章等
  • word:word 中的图片、公式、表格、印章等
  • excel 表格 xls、xlsx、csv等
  • 视频:视频中的图片、视频的语音及文字、视频描述的内容等
  • 音频:音频的文字
  • markdown、txt、jupyter、html、htmls、tex 等文本文件
Image 2

访答知识库支持各种数据存储库,如:mongodb、sql、spark、hive 等数据存储框架。数据就是知识

# 知识库搜索与问答操作指南

知识库搜索与问答操作

Image 2

1、👋选择搜索引擎:云知识库搜索还是本地知识库搜索

2、🤚选择知识库

3、🖐选择搜索内容,可以是搜索所有只搜图片只搜视频只进行问答等等

访答知识库支持多种搜索和问答形式RAG

Image 2

访答知识库搜索提供如下搜索问答生成(RAG)

  • 混合搜索:多种搜索结果混合
  • 文本包含: 包含文本
  • 文本相似搜索: 相似文本搜索, 例如: 父亲 和 爸爸, 相似不相同
  • 图片相似搜索
  • 语音相似搜索
  • 视频相似搜索
  • 图片视频相似搜索: 视频包含该图片,视频与该图片相似
  • 文本搜索图片: 多模态
  • 文本搜索语音: 多模态
  • 文件文本相似搜索
  • 智能问答: qwen, deepseek 等
  • 图像生成:可配置
  • 语音生成:可配置
  • 视频生成:可配置

知识库注意事项

💫注意:本地知识库所有操作都在用户电脑上进行,不上传任何文件数据。所有AI模型都在用户电脑上

💫注意:云知识库跟随账户,用户在任意电脑上,登陆账户即可看到云知识库中的内容,并进行搜索和问答

访答本地知识库特性

1.本地私有化,离线可用

本地化部署:数据存储在自有服务器、NAS或终端设备上,不依赖公有云。

离线可用:无需联网即可访问,适合无网络或低带宽环境。

安全高隐私:文件始终在用户本地电脑中!与云知识库区别的是,本地知识库只在用户本地电脑上进行,不会将文件上传到云上。适合敏感数据(如企业机密、个人隐私),避免云端泄露风险。

文件监听: 文件或文件夹 增加,删除,修改,移动,重命名。实时监听本地文件或文件夹的变更,同步到知识库中, 在文件内容变更后, 知识库中的文件内容也会变更。

软硬件可维护:提供硬件建议及软件环境解决方案

2.深度解析文件,包括子文件

Image 2

深度解析各种文件的内容。如:图片的文本、图片的描述内容、表格、语音中的文本、视频中的图片和文本、pdf和word中的文本图片公式等。

文件中的子文件图片、视频以及视频中的图片等也会被再次解析,并作为该文件的一部分存在

将各种知识输送到搜索系统、问答系统、生成系统,从而可以进行搜索与问答

3.其他特性

模型自定义

知识库种所用的模型皆可用户自己进行配置,并可根据需求自由定制存储架构、检索逻辑和权限管理。

知识库独立

各个知识库之间互相独立, 每个知识库可以单独设置不同的人工智能模型, 而相同的 人工智能模型又会被共享, 从而节约用户电脑的资源

易用

用户可以在访答软件中新建本地知识库,就像新建文件夹一样简单。用户将本地文件或者文件夹投影到本地知识库后, 文件或文件夹下的文件内容就会在用户电脑上进行解析并建档。

# 访答知识库应用场景

一、AI智能客服问答

将企业商品完整信息(核心属性、描述文本及附属文档)沉淀入知识库,在用户进行询问时,搜索知识库中相关信息

然后,将相关商品信息送到问答大模型 deepseek 或 qwen 中,从而对用户的问题进行回答。

  1. 支持多模态问答:用户上传商品图片,然后询问商品的功能,以及是否有红色的外壳等等。

  2. 支持多级问答:第一表单问答,在第一表单完成后,才进行第二表单问答。例如:客户表单自动录入。

  3. 支持自助客服:用户通过知识库搜索直接解决常见问题(如产品使用指南)。

  4. 支持辅助客服:快速检索答案,并显示给内部客服员工,再由员工进行回答,提升员工响应效率。

  5. 企业内部问答:如员工询问:“公司2025年假期安排是什么?” 。RAG模型从云知识库检索最新公告,生成准确回答,而非依赖训练数据。

  6. 支持自定义问答模型:可自定义问答模型的类型 deepseek 或 qwen等,以及指定使用云上的模型或者本地模型

二、智能商品推荐

商品推荐是企业的核心!

企业将商品有关的所有信息,所有文件送到知识库,转换为特征向量。

依据用户总体点击的多少、用户搜索、以及用户点击浏览商品等相关信息,从知识库中搜索到相似的商品,然后推荐给用户

  1. 推荐的多样性:不单纯推荐相似的商品,还会依据总体点击量以及聚类进行多样性推荐。

  2. 支持冷启动:在用户初始使用时,进行商品推荐。

  3. 支持否推荐:不能推荐给用户的,不会被推荐。否推荐相当于检索中的not,A and B not C 的检索形式

  4. 时效性:实时流式推荐

三、企业知识管理以及数字化与智能化转型

用户问:“公司2023年销售数据如何?” - 本地部署的AI模型从内部知识库库检索,生成回答,避免数据上传云端。

打破各部门之间文件知识壁垒,方便各部门之间的沟通。

企业员工快速检索内部资料。

内部培训:存储员工手册、流程文档,方便新员工学习。

技术文档:开发团队的API文档、运维手册等集中管理。

# 访答知识库 - 财会垂直应用场景

财会垂直应用场景 -- 知识库应用

  1. 发票报销依据:

    员工发票是否满足公司报销的标准?财会人员可以快速从公司知识库中搜索到对应的报销标准。

    甚至财会人员可以直接问:“....是否满足报销标准”,系统会直接给出答案以及参考依据文档。

    财务人员直接上传发票单据,然后询问:“....是否满足报销标准”,系统会直接给出答案以及参考依据文档。

    ​价值:增加财会效率,减轻工作压力

  2. 政策变化更新日志与生效日期:

    快速查找最新会计准则(如中国会计准则CAS、国际会计准则IFRS)、税法条款(增值税、所得税)、审计规范、行业监管要求(如金融、上市公司)。

    ​价值:​确保业务处理合法合规,避免罚款和声誉风险,快速响应监管变化。

  3. 报表编制:

    编制月报、季报、年报时查询历史数据口径、指标定义、分析方法论。

    从知识库中直接查询​​历史数据口径、报表项目编制说明及勾稽关系。关键财务指标(KPI)的定义、计算方法和分析维度。预算与实际对比分析的框架。

    ​价值:​从而保证报告的准确性和一致性,提高分析效率和质量,支持管理层决策。

  4. 为销售、采购、生产等业务部门解答财务规则和流程问题(如价格审批、合同付款条款):

    面向业务部门的财务指引(如销售开票要求、采购付款流程)。

    业务合同财务审核要点有哪些。

    成本核算规则说明(供生产/项目经理参考)。

    预算申请和控制的业务视角指南等等。

    ​价值:​​促进业财沟通,减少摩擦,提高流程效率,赋能业务部门理解财务影响。

  5. 审计支持材料库​:应对内外部审计检查,快速搜索并提供所需文档和解释。

    审计调阅资料清单。

    重要会计政策备忘录、重大会计估计文档。

    合同、权证扫描件存档路径。

    审计常见问题及标准回复参考。 ​

    ​价值:​​ 缩短审计周期,提高审计响应效率,降低审计成本。

# 访答知识库 - 电子电商垂直应用场景

电子电商垂直应用场景 -- 知识库应用

  1. 客服人员通过知识库(通常集成到客服系统中)快速找到针对客户问题的标准答案

    ​订单状态查询:​​ 不同物流状态对应的处理时间和含义(比如"包裹已清关"意味着什么)。

    ​物流信息:​​ 各合作快递公司的时效范围、覆盖区域、特殊地区政策(如偏远乡镇)、常见异常情况处理流程(如包裹卡在中转站)。

    ​退换货政策:​​ 详细条款说明、时间限制、操作步骤(用户端如何提交申请)、各品类特殊政策(比如数码产品激活后是否可退)。

    ​支付问题:​​ 支持的支付方式详情(如分期选项)、失败原因(如银行卡额度不足)、到账时间说明。

    ​促销活动规则:​​ 双十一满减叠加规则、优惠券使用范围限制、预售定金退款规则。

    ​商品问题:​​ 尺寸对照表、安装/使用说明(如复杂家用电器的初次使用指南)、常见故障排查(如蓝牙耳机配对问题)。

    ​平台规则与政策:​​ 用户行为规范、禁售品说明、隐私政策重点解读。

    某电商公司使用知识库管理退货政策、物流信息,用户可直接搜索“如何退货”,系统返回最新流程,减少客服工单量。

  2. ​智能客服​​ 知识库为智能客服提供结构化、准确的知识源,让问答大模型deepseek或qwen等理解用户问题并提供正确回答。 ​

  3. ​多/全渠道一致体验:​​ 无论用户通过在线客服、电话、社交媒体还是APP内留言咨询,客服人员都能基于同一知识库提供一致的答案,避免不同客服给出矛盾信息。

  4. **​减少培训时间/降低出错率:**​​ 新客服人员可借助知识库快速上岗,资深客服也能避免记忆错误或凭经验判断导致的服务偏差。

  5. 商品信息管理与内容创作:​​

    ​标准化商品上架:​​ 新商品上架时,知识库提供品牌文案模板、规格参数标准(如颜色尺码命名规则)、常用描述语、合规性要求(如针对特定国家的标签要求)、主图/详情页设计规范等,确保信息的一致性和质量,避免重复劳动或合规风险。

    ​内容快速复用:​​ 针对季节性活动(如情人节礼盒)或促销品(如爆款手机),可直接复用往年的成功文案模板,避免每次从零开始。

    ​​品牌一致性维护:​​ 确保所有渠道(官网、APP、社交媒体、第三方平台店铺)的商品描述、品牌故事、卖点信息高度统一。

  6. 企业知识传承:避免因为人员流动带来的知识流失

    新员工入职手册:​​ 提供全面的公司文化介绍、组织架构、系统操作指南(如OMS使用教学)、岗位职责说明。

    ​岗位技能知识:​​ 例如客服岗位的沟通技巧、投诉处理SOP;运营岗位的数据分析入门指南;采销岗位的供应商谈判手册。 ​

    ​产品知识培训:​​ 集中各品类(如母婴、数码、宠物)的核心卖点对比、技术参数详解、竞品分析,方便新团队员工快速熟悉业务。 ​

    ​流程与制度文档:​​ 人事请假报销流程、财务审批流程、安全操作规程、信息安全规定等,所有员工都可随时查阅最新版本。

# 访答知识库 - 医药零售连锁行业垂直应用场景

医药零售连锁行业垂直应用场景 -- 知识库应用

  1. 在线咨询问答

    针对患者、药师、医生的电话/在线咨询,提供经过严格医学审核、符合药品说明书的标准用药指导、安全性信息解答(副作用如何处理、药物相互作用)、获取途径信息(如罕见病药)、患者援助项目信息等。

    详细说明书信息(成分、适应症、用法用量、禁忌、不良反应、相互作用、贮藏条件)

    不同厂家/规格/批号差异信息、国家/地方医保编码及类别(甲/乙类)、支付政策。

    处方药(Rx)与非处方药(OTC)标识及销售政策(尤其是“双轨制”处方药管理要求)

  2. 用药问答指南

    顾客常问问题回复(如:这个药能和XX一起吃吗?饭前吃还是饭后吃?吃了XX药拉肚子怎么办?)

    医生或药师输入用户症状,系统从云端医学知识库检索相似病例和治疗方案,辅助诊断。

    药品替代方案建议(缺货时,根据成分/功能推荐)

    副作用应对措施

    医疗器械使用指导(如血糖仪操作、胰岛素笔安装)

  3. 联合用药与健康指南:

    常见疾病(感冒、咳嗽、胃肠不适、高血压、糖尿病等)症状解析、推荐用药方案(组合)、关联销售建议

    保健品、医疗器械(如血糖仪、血压计)与药品的搭配使用指导

    中药饮片/滋补品的鉴别要点、性味功效、禁忌及配伍常识

    慢性病管理(如糖尿病饮食建议、血压监测要点)知识包

  4. 依据上传图片进行回答:

    用户直接上传药品外包装,并对其进行询问:“药品用量是多少?是否能治疗。。”

    多模态大模型依据:药品外观(图片)、相似药品区分(防混淆)以及检索到的知识,对用户的问题进行直接的回答

# 访答知识库 - 教育培训垂直应用场景

教育培训垂直应用场景 -- 知识库应用

  1. 教育:教学资源库、题库管理

    教学资源以及题库就是一个教育培训机构的核心资产。将这些核心知识存放到知识库后,可以依据学生错题情况,给学生进行个性化的题目推荐和知识点加强。

  2. ​知识检索与复用 ​​

    ​​研发负责人/讲师:​​ 登录知识库 -> 搜索类似主题的“课程蓝图”、“教学资源”、“成功案例” -> 复用可用的结构、模块、讲解方法、活动设计模板 -> 下载标准化素材(如开场动画、图表模板)。

  3. 销售定向问答

    销售顾问:​​ 接到客户咨询或拜访前 -> 登录知识库“销售中心” -> 输入客户行业/职位 -> 检索匹配的“客户画像”和“痛点库”了解背景和潜在需求 -> 搜索相关“解决方案模板”或“成功案例”用于个性化方案准备

    销售顾问:​​ 遇到客户具体疑问(如“你们的课程和XX比有什么优势?”)-> 在知识库中快速搜索“竞品分析库”和“FAQ” -> 找到精准应对话术和对比数据 -> 直接发送给客户或口头表述。

    ​​销售顾问:​​ 遇到客户异议(如“价格太高”)-> 搜索“抗拒点应对策略”库 -> 找到最佳实践话术。

  4. ​​服务请求问答

    ​​客服专员:​​ 接到学员/家长咨询(电话/在线客服系统)-> 在客服系统的集成知识库弹窗中输入关键词(如“登录不了”、“怎么请假”)-> 快速定位“解决指南”或“服务手册”链接 -> 按标准流程和话术解答/操作 -> 如属技术问题,按指南无法解决,转接技术同事,同时在工单系统记录(关联知识库条目)

    客服专员:​​ 接到投诉 -> 在知识库中搜索“投诉处理SOP”及对应类型话术 -> 安抚情绪,按流程进行初级处理(道歉、提出解决方案)-> 记录详细信息。

    ​​客户服务主管:​​ 对于升级投诉 -> 依据SOP联系相关部门(技术、教学、管理层)协调解决 -> 最终解决方案和补偿措施需符合知识库规定 -> 处理完成后,将典型案例(脱敏)及应对经验更新至知识库。

# 访答知识库 - 科研垂直应用场景

科研垂直应用场景 -- 知识库应用

科研人员在确定研究方向后,进行科研和论文成果的撰写

  1. 预参考论文汇总

    将相关研究方向的论文整理到同一个知识库下。以便后面进行参考和问答。

  2. 生成对应的引言和已有成果综述

    依据知识库中的参考文献,自动生成引言和已有成果综述。

  3. ​深度挖掘研究脉络与空白

    依靠知识库和大模型,为研究寻找尚未被充分探索的创新点和潜在研究空白。

  4. ​研究方向生成思路

    在确定自己的研究方向和创新点后,直接生成可行的研究思路和研究方案。进而来进行论文创作

  5. ​论文写作规范与术语自动优化

    初稿完成后,将初稿作为输入,使用知识库和大模型进行优化语言表达和学术规范。

  6. 论文重复查找,并优化

    使用知识库的文件搜文件功能,直接可视化的查看潜在的语义相似的片段,并进行优化,防止论文重复率高

  7. 查找合适的期刊投稿

    完成论文初稿后,需要确定与研究方向、影响因子匹配的投稿目标期刊。使用知识库中的问答模型,输入已经完成论文,问可以投哪些期刊。

  8. 参考目录一键生成

  9. ​知识管理与挖掘

    管理多年积累的海量阅读笔记、实验数据、项目文档和知识片段。​ 构建个性化、高度结构化的个人知识库,整合文献、代码、数据、笔记,实现高效检索、关联和知识重组,辅助创新思考。

# 访答知识库 - 法律垂直应用场景

法律垂直应用场景 -- 知识库应用

  1. 法规库、案例库供律师查询

    机密资料:法律合同、财务数据等敏感信息的本地归档。并供内部人员参考和搜索。

  2. ​合同起草与审查​

    为客户起草一份跨境技术许可协议,或审查一份供应商提供的格式合同。 ​ 调用知识库中的标准合同模板库(按行业、交易类型分类)。

    查询特定条款(如赔偿限制条款、知识产权归属条款、法律适用与争议解决条款)的范本、制定要点、常见陷阱及司法观点。

    进行“合同对比”功能,快速识别修订版本中的关键修改。

  3. 合同模板库与审核流程管理

    审核业务部门提交的大量日常采购合同。

    调用公司内部审核过的、针对不同业务场景的标准合同模板库。

    利用知识库中的“合同智能比对”和“风险点提示”功能,快速识别与标准文本的偏差及潜在风险。

    参考知识库中过往法务的审核意见积累,提高审核效率和一致性。

  4. 交易文件谈判支持

    参与重大商业谈判,需要对某个特定条款(如陈述与保证、交割条件)进行即时的法律分析和风险提示。

    通过会议系统快速接入知识库,查询标准谈判要点、最佳实践、行业惯例和司法实践中该条款的争议焦点及后果。

# 行业知识库

构建行业知识库 -- 求职应聘

该问题本质是一个搜索问题

  1. 构建企业岗位需求-职能知识库 - 数据采集、清洗并送入到知识库

  2. 求职者直接上传简历进行相关的岗位搜索。端对端的将岗位直接匹配到求职者

  3. 简历优化:对用户提供简历优化服务,优化简历中的术语以及关键词,从而与岗位之间更好的匹配。提高应聘就职率

知识库在此处的作用就相当于传统的数据库,不过替代传统数据库,可以直接搜索相关内容并进行问答

构建行业知识库 -- 学生错题练习

该问题本质是一个推荐问题

  1. 构建题目知识库 - 题目数据采集、清洗并送入到知识库。题目中的数学公式可以直接使用latex形式,方便相似公式查询

  2. 依据学生错题、整体难题、学生年级、做过的题目等诸多信息,给学生推荐新的题目

    精准推荐变式题:​​ 这是知识库最强大的应用。系统根据错题关联的核心知识点和错误类型,结合学生的掌握程度和历史表现,从题库中​​精准筛选变式题​​(同知识点不同背景/难度、相近知识点、易混淆概念辨析题、针对特定错误类型的强化题)进行推送。​​目标是针对性地“打击”弱点。​

    当学生尝试解决某个错题对应的变式题时,系统可智能推送知识库中相关的​​概念解释、定理公式、解题模板、微课视频、典型例题​​等学习资源,帮助学生在练习中即时回顾知识。

  3. 智能识别纸质录入:​​ 支持学生/家长拍照上传纸质试卷、练习册上的错题,结合OCR(文字识别)技术识别题目(可能需要人工复核)。

  4. 题目所属知识点,题目难易程度的判断

  5. 大模型生成解题答案和步骤等

构建行业知识库 -- 企业人才评估

发送问卷+问题,来评估一个企业内部,人员是否胜任某岗位

该问题本质是一个推荐+问答问题

  1. 企业人员私有知识库构建,人员的工作成果、上级的点评、绩效等等,录入到个人知识库

  2. 构建问卷上的题库,会依靠大模型来补充,生成一些题库中没有的题目,但大模型觉得重要的

  3. 构建问卷

    依据个人信息,推荐题目1

    依据问答情况,构建提示词,推荐题目2

    ...

    ...

    ...

  4. 将问卷题目及答案送到大模型中,让大模型给出评价,并生成报告

# 优势

  • 绝对数据控制:避免云服务商的数据泄露或合规风险。

  • 低延迟:本地网络访问速度更快(如大型文件检索)。

  • 合规性:满足GDPR等保2.0等严格数据驻留要求。

  • 可维护 :提供软硬件维护,降低企业运维支出

本地知识库是数据主权时代的刚需选择,尤其适合个人用户以及对隐私和安全性要求极高的领域。

上次编辑于: 2025年6月9日 18:00