本地知识库
# 本地知识库
# 什么是知识库

知识库
知识库(Knowledge Base)
主要用于🙈文件内容搜索
、🙊文件知识问答
。
通俗来讲,可以搜索pdf内容🙉、搜索图片内容💌、搜索word内容💓、并依据文件内容进行回答💝
政企单位则主要用于👏智能客服系统
、🙌智能推荐
、👐企业知识管理系统
deepseek
等大模型通常只依赖网络中的知识进行回答
。如果要依据个人电脑
或企业服务器
的文档知识进行回答,则需要使用知识库
知识库
1、🤠用户将个人电脑中文件或文件夹投影到本地知识库
:如pdf、word、markdown、图片、excel表格、语音、视频内容等等
2、🤡知识库会深度解析文档中的内容
3、🤖用户可以直接搜索相关内容在哪些文件中。如:“发票”在哪些文件中出现、以及哪些文件与“发票”相似有关等。
4、😺用户也可以直接进行问答,依据知识库中的文件知识进行回答。如:“公司的规章2是什么?”
与云知识库
不同,本地知识库只存在于当前电脑的硬盘
中,不依赖外部云服务。如果更换电脑,需要注意硬盘的更换
# 新建本地知识库
新建本地知识库
🤗新建本地知识库时,先点击知识库目录
的下方空白处
,将当前路径
更改为根目录
,再新建知识库
👁️🗨️默认预留的知识库
是功能最单一的知识库
(仅能搜索包含型的文本)。💯更复杂的知识库功能
,请新建知识库进行使用
!!!
💥选中目录后,才能上传文件

# 知识库上传文件操作指南
知识库上传文件
选中目标文件夹后,才能上传文件
👍
支持丰富的文件格式

访答知识库
中各种类型的文件内容都会被详细解析,并用于查询
和问答
。例如:
- 图片:图片中的文字、图片描述的内容
- pdf:pdf文件 中的图片、公式、表格、印章等
- word:word 中的图片、公式、表格、印章等
- excel 表格 xls、xlsx、csv等
- 视频:视频中的图片、视频的语音及文字、视频描述的内容等
- 音频:音频的文字
- markdown、txt、jupyter、html、htmls、tex 等文本文件

访答知识库支持各种数据存储库,如:mongodb、sql、spark、hive
等数据存储框架。数据就是知识
# 知识库搜索与问答操作指南
知识库搜索与问答操作

1、👋选择搜索引擎:云知识库搜索
还是本地知识库搜索
2、🤚选择知识库
3、🖐选择搜索内容,可以是搜索所有
、只搜图片
、只搜视频
、只进行问答
等等
访答知识库支持多种搜索和问答形式RAG

访答知识库搜索提供如下搜索
、问答
和生成(RAG)
:
混合搜索
:多种搜索结果混合文本包含
: 包含文本文本相似搜索
: 相似文本搜索, 例如: 父亲 和 爸爸, 相似不相同图片相似搜索
语音相似搜索
视频相似搜索
图片视频相似搜索
: 视频包含该图片,视频与该图片相似文本搜索图片
: 多模态文本搜索语音
: 多模态文件文本相似搜索
智能问答
: qwen, deepseek 等图像生成
:可配置语音生成
:可配置视频生成
:可配置
知识库注意事项
💫注意:本地知识库
中所有操作都在用户电脑
上进行,不上传任何文件数据
。所有AI模型都在用户电脑上
💫注意:云知识库
跟随账户,用户在任意电脑上,登陆账户即可看到云知识库中的内容
,并进行搜索和问答
访答本地知识库特性
1.本地私有化,离线可用
本地化部署:数据存储在自有服务器、NAS或终端设备上,不依赖公有云。
离线可用:无需联网即可访问,适合无网络或低带宽环境。
安全高隐私:文件始终在用户本地电脑中!与云知识库区别的是,本地知识库只在用户本地电脑上进行,不会将文件上传到云上。适合敏感数据(如企业机密、个人隐私),避免云端泄露风险。
文件监听: 文件或文件夹 增加,删除,修改,移动,重命名。实时监听本地文件或文件夹的变更,同步到知识库中, 在文件内容变更后, 知识库中的文件内容也会变更。
软硬件可维护:提供硬件建议及软件环境解决方案
2.深度解析文件,包括子文件

深度解析各种文件的内容。如:图片的文本、图片的描述内容、表格、语音中的文本、视频中的图片和文本、pdf和word中的文本图片公式等。
文件中的子文件图片、视频以及视频中的图片等也会被再次解析,并作为该文件的一部分存在
将各种知识输送到搜索系统、问答系统、生成系统,从而可以进行搜索与问答
3.其他特性
模型自定义
知识库种所用的模型皆可用户自己进行配置,并可根据需求自由定制存储架构、检索逻辑和权限管理。
知识库独立
各个知识库之间互相独立, 每个知识库可以单独设置不同的人工智能模型, 而相同的 人工智能模型又会被共享, 从而节约用户电脑的资源
易用
用户可以在访答
软件中新建本地知识库
,就像新建文件夹一样简单。用户将本地文件或者文件夹投影到本地知识库后, 文件或文件夹下的文件内容就会在用户电脑上进行解析并建档。
# 访答知识库应用场景
一、AI智能客服问答
将企业商品完整信息(核心属性、描述文本及附属文档)沉淀入知识库,在用户进行询问时,搜索知识库中相关信息
然后,将相关商品信息送到问答大模型 deepseek 或 qwen 中,从而对用户的问题进行回答。
支持
多模态问答
:用户上传商品图片,然后询问商品的功能,以及是否有红色的外壳等等。支持
多级问答
:第一表单问答,在第一表单完成后,才进行第二表单问答。例如:客户表单自动录入。支持
自助客服
:用户通过知识库搜索直接解决常见问题(如产品使用指南)。支持
辅助客服
:快速检索答案,并显示给内部客服员工,再由员工进行回答,提升员工响应效率。企业
内部问答
:如员工询问:“公司2025年假期安排是什么?” 。RAG模型从云知识库检索最新公告,生成准确回答,而非依赖训练数据。支持
自定义问答模型
:可自定义问答模型的类型 deepseek 或 qwen等,以及指定使用云上的模型或者本地模型
二、智能商品推荐
商品推荐是企业的核心!
企业将商品有关的所有信息,所有文件送到知识库,转换为特征向量。
依据用户总体点击的多少、用户搜索、以及用户点击浏览商品等相关信息,从知识库中搜索到相似的商品,然后推荐给用户
推荐的
多样性
:不单纯推荐相似的商品,还会依据总体点击量以及聚类进行多样性推荐。支持
冷启动
:在用户初始使用时,进行商品推荐。支持
否推荐
:不能推荐给用户的,不会被推荐。否推荐
相当于检索中的not
,A and B not C 的检索形式时效性
:实时流式推荐
三、企业知识管理以及数字化与智能化转型
用户问:“公司2023年销售数据如何?” - 本地部署的AI模型从内部知识库库检索,生成回答,避免数据上传云端。
打破各部门之间文件知识壁垒,方便各部门之间的沟通。
企业员工快速检索内部资料。
内部培训:存储员工手册、流程文档,方便新员工学习。
技术文档:开发团队的API文档、运维手册等集中管理。
# 访答知识库 - 财会垂直应用场景
财会垂直应用场景 -- 知识库应用
发票报销依据:
员工发票是否满足公司报销的标准?财会人员可以快速从公司知识库中搜索到对应的报销标准。
甚至财会人员可以直接问:“....是否满足报销标准”,系统会直接给出答案以及参考依据文档。
财务人员直接上传发票单据,然后询问:“....是否满足报销标准”,系统会直接给出答案以及参考依据文档。
价值:增加财会效率,减轻工作压力
政策变化更新日志与生效日期:
快速查找最新会计准则(如中国会计准则CAS、国际会计准则IFRS)、税法条款(增值税、所得税)、审计规范、行业监管要求(如金融、上市公司)。
价值:确保业务处理合法合规,避免罚款和声誉风险,快速响应监管变化。
报表编制:
编制月报、季报、年报时查询历史数据口径、指标定义、分析方法论。
从知识库中直接查询历史数据口径、报表项目编制说明及勾稽关系。关键财务指标(KPI)的定义、计算方法和分析维度。预算与实际对比分析的框架。
价值:从而保证报告的准确性和一致性,提高分析效率和质量,支持管理层决策。
为销售、采购、生产等业务部门解答财务规则和流程问题(如价格审批、合同付款条款):
面向业务部门的财务指引(如销售开票要求、采购付款流程)。
业务合同财务审核要点有哪些。
成本核算规则说明(供生产/项目经理参考)。
预算申请和控制的业务视角指南等等。
价值:促进业财沟通,减少摩擦,提高流程效率,赋能业务部门理解财务影响。
审计支持材料库:应对内外部审计检查,快速搜索并提供所需文档和解释。
审计调阅资料清单。
重要会计政策备忘录、重大会计估计文档。
合同、权证扫描件存档路径。
审计常见问题及标准回复参考。
价值: 缩短审计周期,提高审计响应效率,降低审计成本。
# 访答知识库 - 电子电商垂直应用场景
电子电商垂直应用场景 -- 知识库应用
客服人员通过知识库(通常集成到客服系统中)快速找到针对客户问题的标准答案
订单状态查询: 不同物流状态对应的处理时间和含义(比如"包裹已清关"意味着什么)。
物流信息: 各合作快递公司的时效范围、覆盖区域、特殊地区政策(如偏远乡镇)、常见异常情况处理流程(如包裹卡在中转站)。
退换货政策: 详细条款说明、时间限制、操作步骤(用户端如何提交申请)、各品类特殊政策(比如数码产品激活后是否可退)。
支付问题: 支持的支付方式详情(如分期选项)、失败原因(如银行卡额度不足)、到账时间说明。
促销活动规则: 双十一满减叠加规则、优惠券使用范围限制、预售定金退款规则。
商品问题: 尺寸对照表、安装/使用说明(如复杂家用电器的初次使用指南)、常见故障排查(如蓝牙耳机配对问题)。
平台规则与政策: 用户行为规范、禁售品说明、隐私政策重点解读。
某电商公司使用知识库管理退货政策、物流信息,用户可直接搜索“如何退货”,系统返回最新流程,减少客服工单量。
智能客服 知识库为智能客服提供结构化、准确的知识源,让问答大模型deepseek或qwen等理解用户问题并提供正确回答。
多/全渠道一致体验: 无论用户通过在线客服、电话、社交媒体还是APP内留言咨询,客服人员都能
基于同一知识库
提供一致的答案
,避免不同客服给出矛盾信息。**减少培训时间/降低出错率:** 新客服人员可借助知识库快速上岗,资深客服也能避免记忆错误或凭经验判断导致的服务偏差。
商品信息管理与内容创作:
标准化商品上架: 新商品上架时,知识库提供品牌文案模板、规格参数标准(如颜色尺码命名规则)、常用描述语、合规性要求(如针对特定国家的标签要求)、主图/详情页设计规范等,确保信息的一致性和质量,避免重复劳动或合规风险。
内容快速复用: 针对季节性活动(如情人节礼盒)或促销品(如爆款手机),可直接复用往年的成功文案模板,避免每次从零开始。
品牌一致性维护: 确保所有渠道(官网、APP、社交媒体、第三方平台店铺)的商品描述、品牌故事、卖点信息高度统一。
企业知识传承:避免因为人员流动带来的知识流失
新员工入职手册: 提供全面的公司文化介绍、组织架构、系统操作指南(如OMS使用教学)、岗位职责说明。
岗位技能知识: 例如客服岗位的沟通技巧、投诉处理SOP;运营岗位的数据分析入门指南;采销岗位的供应商谈判手册。
产品知识培训: 集中各品类(如母婴、数码、宠物)的核心卖点对比、技术参数详解、竞品分析,方便新团队员工快速熟悉业务。
流程与制度文档: 人事请假报销流程、财务审批流程、安全操作规程、信息安全规定等,所有员工都可随时查阅最新版本。
# 访答知识库 - 医药零售连锁行业垂直应用场景
医药零售连锁行业垂直应用场景 -- 知识库应用
在线咨询问答
针对患者、药师、医生的电话/在线咨询,提供经过严格医学审核、符合药品说明书的标准用药指导、安全性信息解答(副作用如何处理、药物相互作用)、获取途径信息(如罕见病药)、患者援助项目信息等。
详细说明书信息(成分、适应症、用法用量、禁忌、不良反应、相互作用、贮藏条件)
不同厂家/规格/批号差异信息、国家/地方医保编码及类别(甲/乙类)、支付政策。
处方药(Rx)与非处方药(OTC)标识及销售政策(尤其是“双轨制”处方药管理要求)
用药问答指南
顾客常问问题回复(如:这个药能和XX一起吃吗?饭前吃还是饭后吃?吃了XX药拉肚子怎么办?)
医生或药师输入用户症状,系统从云端医学知识库检索相似病例和治疗方案,辅助诊断。
药品替代方案建议(缺货时,根据成分/功能推荐)
副作用应对措施
医疗器械使用指导(如血糖仪操作、胰岛素笔安装)
联合用药与健康指南:
常见疾病(感冒、咳嗽、胃肠不适、高血压、糖尿病等)症状解析、推荐用药方案(组合)、关联销售建议
保健品、医疗器械(如血糖仪、血压计)与药品的搭配使用指导
中药饮片/滋补品的鉴别要点、性味功效、禁忌及配伍常识
慢性病管理(如糖尿病饮食建议、血压监测要点)知识包
依据上传图片进行回答:
用户直接上传药品外包装,并对其进行询问:“药品用量是多少?是否能治疗。。”
多模态大模型依据:药品外观(图片)、相似药品区分(防混淆)以及检索到的知识,对用户的问题进行直接的回答
# 访答知识库 - 教育培训垂直应用场景
教育培训垂直应用场景 -- 知识库应用
教育:教学资源库、题库管理
教学资源以及题库就是一个教育培训机构的核心资产。将这些核心知识存放到知识库后,可以依据学生错题情况,给学生进行个性化的题目推荐和知识点加强。
知识检索与复用
研发负责人/讲师: 登录知识库 -> 搜索类似主题的“课程蓝图”、“教学资源”、“成功案例” -> 复用可用的结构、模块、讲解方法、活动设计模板 -> 下载标准化素材(如开场动画、图表模板)。
销售定向问答
销售顾问: 接到客户咨询或拜访前 -> 登录知识库“销售中心” -> 输入客户行业/职位 -> 检索匹配的“客户画像”和“痛点库”了解背景和潜在需求 -> 搜索相关“解决方案模板”或“成功案例”用于个性化方案准备
销售顾问: 遇到客户具体疑问(如“你们的课程和XX比有什么优势?”)-> 在知识库中快速搜索“竞品分析库”和“FAQ” -> 找到精准应对话术和对比数据 -> 直接发送给客户或口头表述。
销售顾问: 遇到客户异议(如“价格太高”)-> 搜索“抗拒点应对策略”库 -> 找到最佳实践话术。
服务请求问答
客服专员: 接到学员/家长咨询(电话/在线客服系统)-> 在客服系统的集成知识库弹窗中输入关键词(如“登录不了”、“怎么请假”)-> 快速定位“解决指南”或“服务手册”链接 -> 按标准流程和话术解答/操作 -> 如属技术问题,按指南无法解决,转接技术同事,同时在工单系统记录(关联知识库条目)
客服专员: 接到投诉 -> 在知识库中搜索“投诉处理SOP”及对应类型话术 -> 安抚情绪,按流程进行初级处理(道歉、提出解决方案)-> 记录详细信息。
客户服务主管: 对于升级投诉 -> 依据SOP联系相关部门(技术、教学、管理层)协调解决 -> 最终解决方案和补偿措施需符合知识库规定 -> 处理完成后,将典型案例(脱敏)及应对经验更新至知识库。
# 访答知识库 - 科研垂直应用场景
科研垂直应用场景 -- 知识库应用
科研人员在确定研究方向后,进行科研和论文成果的撰写
预参考论文汇总
将相关研究方向的论文整理到同一个知识库下。以便后面进行参考和问答。
生成对应的引言和已有成果综述
依据知识库中的参考文献,自动生成引言和已有成果综述。
深度挖掘研究脉络与空白
依靠知识库和大模型,为研究寻找尚未被充分探索的创新点和潜在研究空白。
研究方向生成思路
在确定自己的研究方向和创新点后,直接生成可行的研究思路和研究方案。进而来进行论文创作
论文写作规范与术语自动优化
初稿完成后,将初稿作为输入,使用知识库和大模型进行优化语言表达和学术规范。
论文重复查找,并优化
使用知识库的文件搜文件功能,直接可视化的查看潜在的语义相似的片段,并进行优化,防止论文重复率高
查找合适的期刊投稿
完成论文初稿后,需要确定与研究方向、影响因子匹配的投稿目标期刊。使用知识库中的问答模型,输入已经完成论文,问可以投哪些期刊。
参考目录一键生成
知识管理与挖掘
管理多年积累的海量阅读笔记、实验数据、项目文档和知识片段。 构建个性化、高度结构化的个人知识库,整合文献、代码、数据、笔记,实现高效检索、关联和知识重组,辅助创新思考。
# 访答知识库 - 法律垂直应用场景
法律垂直应用场景 -- 知识库应用
法规库、案例库供律师查询
机密资料:法律合同、财务数据等敏感信息的本地归档。并供内部人员参考和搜索。
合同起草与审查
为客户起草一份跨境技术许可协议,或审查一份供应商提供的格式合同。 调用知识库中的标准合同模板库(按行业、交易类型分类)。
查询特定条款(如赔偿限制条款、知识产权归属条款、法律适用与争议解决条款)的范本、制定要点、常见陷阱及司法观点。
进行“合同对比”功能,快速识别修订版本中的关键修改。
合同模板库与审核流程管理
审核业务部门提交的大量日常采购合同。
调用公司内部审核过的、针对不同业务场景的标准合同模板库。
利用知识库中的“合同智能比对”和“风险点提示”功能,快速识别与标准文本的偏差及潜在风险。
参考知识库中过往法务的审核意见积累,提高审核效率和一致性。
交易文件谈判支持
参与重大商业谈判,需要对某个特定条款(如陈述与保证、交割条件)进行即时的法律分析和风险提示。
通过会议系统快速接入知识库,查询标准谈判要点、最佳实践、行业惯例和司法实践中该条款的争议焦点及后果。
# 行业知识库
构建行业知识库 -- 求职应聘
该问题本质是一个搜索问题
构建企业
岗位需求-职能
知识库 - 数据采集、清洗并送入到知识库求职者直接上传简历进行相关的岗位搜索。端对端的将岗位直接匹配到求职者
简历优化:对用户提供简历优化服务,优化简历中的术语以及关键词,从而与岗位之间更好的匹配。提高应聘就职率
知识库在此处的作用就相当于传统的数据库,不过替代传统数据库,可以直接搜索相关内容并进行问答
构建行业知识库 -- 学生错题练习
该问题本质是一个推荐问题
构建
题目
知识库 - 题目数据采集、清洗并送入到知识库。题目中的数学公式可以直接使用latex
形式,方便相似公式查询依据学生错题、整体难题、学生年级、做过的题目等诸多信息,给学生推荐新的题目
精准推荐变式题: 这是知识库最强大的应用。系统根据错题关联的核心知识点和错误类型,结合学生的掌握程度和历史表现,从题库中精准筛选变式题(同知识点不同背景/难度、相近知识点、易混淆概念辨析题、针对特定错误类型的强化题)进行推送。目标是针对性地“打击”弱点。
当学生尝试解决某个错题对应的变式题时,系统可智能推送知识库中相关的概念解释、定理公式、解题模板、微课视频、典型例题等学习资源,帮助学生在练习中即时回顾知识。
智能识别纸质录入: 支持学生/家长拍照上传纸质试卷、练习册上的错题,结合OCR(文字识别)技术识别题目(可能需要人工复核)。
题目所属知识点,题目难易程度的判断
大模型生成解题答案和步骤等
构建行业知识库 -- 企业人才评估
发送问卷+问题,来评估一个企业内部,人员是否胜任某岗位
该问题本质是一个推荐+问答问题
企业人员私有知识库构建,人员的工作成果、上级的点评、绩效等等,录入到个人知识库
构建问卷上的题库,会依靠大模型来补充,生成一些题库中没有的题目,但大模型觉得重要的
构建问卷
依据个人信息,推荐题目1
依据问答情况,构建提示词,推荐题目2
...
...
...
将问卷题目及答案送到大模型中,让大模型给出评价,并生成报告
# 优势
绝对数据控制:避免云服务商的数据泄露或合规风险。
低延迟:本地网络访问速度更快(如大型文件检索)。
合规性:满足GDPR等保2.0等严格数据驻留要求。
可维护 :提供软硬件维护,降低企业运维支出
本地知识库是数据主权时代的刚需选择,尤其适合个人用户以及对隐私和安全性要求极高的领域。