侧边栏壁纸
博主头像
晨的博客 博主等级

来去如一,真性湛然。风收云散,月在青天。

  • 累计撰写 14 篇文章
  • 累计创建 14 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

智能答疑机器人

野生数分狮 - 晨
2025-06-20 / 0 评论 / 5 点赞 / 42 阅读 / 0 字

项目详情描述

基于 大模型RAG 技术搭建了 智能答疑机器人,为 2000+ 学员提供 24 小时全天候智能学习辅导服务,实现了知识覆盖全面(1500+ 教学文档,12700+ 知识点)、答疑可参考率高(85.2%)、问答效率显著提升(20 秒内响应)。


★ 问题分析

(1)教培资料难管理:教培机构拥有大量课程资料、习题解析、知识点总结等学习资源,超过 1500 份教学文档的分类、标注和管理工作量巨大,传统人工整理方式效率低下,难以构建完整的知识体系供学员快速查询。

(2)学员提问参差不齐:学员原始问题往往表述模糊,传统问答系统难以准确理解学员意图,导致答复不精准,影响学习效果。

(3)讲师答疑效率低下:讲师答疑平均回复时长约 12 分钟,且无法提供 24 小时服务,面对复杂问题时需要查阅教学资料,响应效率有待提升,影响学员学习进度。


★ 解决过程

(1)模型选型与部署:使用阿里云 API 提供的 DeepSeek-R1Qwen3 等大模型;基于 Xinference 框架部署 Embedding 模型(bge-m3bge-large-zh-v1.5)和 Rerank 模型(bge-reranker-v2-m3)。

(2)多数据库联合:部署 MySQL 数据库存储知识点总结、知识体系等结构化数据;部署 Weaviate 向量数据库存储教学文档的向量和语义索引,实现高效的语义检索和知识匹配。

(3)RAG 平台集成:部署 Dify 平台构建 RAG 应用,实现 知识库管理提示词工程工作流编排 等功能;借助大模型基于教学内容结构和知识点对文档进行 智能分块,采用 父子分块 策略提升知识检索精度与召回率;采用 多路召回 策略,综合使用关键词检索和语义检索,通过 Rerank 重排序 进一步提升检索精度;设计 多层次提示词 模板,针对不同类型的学习问题定制专属优化提示词,通过 思维链 引导模型分步推理解题过程,采用 Few-Shot 帮助模型理解教学模式。

(4)智能体工作流开发:构建 批量生成扩展问 工作流,借助大模型批量生成高质量学习问答对,丰富知识库内容;开发 学员意图识别 智能体,对学员提问进行意图分析与学习疑问理解;构建 多轮交互问答 机制,通过追问、反问的方式引导学员提供更完整信息。

(5)MCP 服务器:自建 MCP 服务器,为大模型提供精准的 数据库查询 能力,支持复杂 SQL 查询,实现教学知识点的智能检索与精准答疑。


项目涉及技术

★ 大模型

(1)DeepSeek-R1:DeepSeek-R1 是基于强化学习优化的推理模型,采用思维链推理范式,能够进行多步骤逻辑推理。模型在数学、科学、编程等领域表现优异,特别适合教育场景中的复杂问题解答。支持长文本处理,上下文窗口达到 128K tokens,能够处理大篇幅的教学材料。

(2)Qwen3:Qwen3 是阿里云推出的多模态大模型,支持文本、图像、音频等多种输入格式。在项目中主要用于处理包含图表、公式的教学内容,通过视觉理解能力解析复杂的数学公式和图形题目。模型采用 MoE 架构,提高推理效率的同时保持高质量输出。


★ Embedding 模型与向量检索

(1)文本向量化:Embedding 技术将文本转换为高维向量表示,捕获语义信息。向量空间中语义相似的文本在几何距离上更接近。常用的距离度量包括余弦相似度、欧氏距离、曼哈顿距离等。向量维度通常为 512、768、1024 等,维度越高表达能力越强但计算成本也越高。

(2)bge-m3 多语言模型:BGE-M3 是智源研究院开发的多语言、多粒度、多功能向量模型。支持中英文等 100+ 种语言,在教育领域的中文文本处理上表现优异。模型采用对比学习训练,能够有效区分语义相似和不相似的文本对。支持不同长度文本的向量化,从短句到长文档都能获得高质量表示。

(3)bge-large-zh-v1.5 中文优化:专门针对中文优化的大规模向量模型,在中文语义理解任务上性能卓越。模型参数量达到 3.3 亿,向量维度为 1024,能够捕获更细粒度的语义信息。在教育领域的专业术语和学科知识表示上具有显著优势,特别适合处理数学、物理、化学等理科内容。

(4)向量相似度计算:采用余弦相似度计算向量间相似性:\text{cosine}(\mathbf{a}, \mathbf{b}) = \frac{\mathbf{a} \cdot \mathbf{b}}{||\mathbf{a}|| \cdot ||\mathbf{b}||}


★ 数据库架构

(1)MySQL 关系型数据库:采用 MySQL 8.0 存储结构化数据。知识点表存储教学知识点(知识点 ID、名称、分类、难度等级、关联文档);问答记录表存储历史对话(对话 ID、学员 ID、问题内容、答案内容、时间戳、满意度评分);文档管理表存储教学资料元信息(文档 ID、标题、类型、上传时间、文件路径)。

(2)Weaviate 向量数据库:Weaviate 是开源的向量数据库,用于存储和检索高维向量数据,支持复杂的语义关系建模,提供高效的相似性搜索能力,支持混合搜索,结合向量相似度和传统过滤条件进行查询。


★ 检索增强生成(RAG)

(1)RAG 原理:RAG 结合了检索系统和生成模型的优势,通过检索相关文档片段为生成模型提供外部知识支持。工作流程包括:文档预处理 → 向量化存储 → 查询检索 → 上下文增强 → 答案生成。这种架构有效解决了大模型知识截止时间限制和幻觉问题。

(2)文本分块:采用智能分块策略,根据文档结构(章节、段落、句子)进行层次化切分。采用父子分块策略,将长文档分为父块(较大粒度)和子块(较小粒度),父块保留完整语义上下文,子块提供精确匹配。检索时先匹配子块确定相关性,然后返回对应的父块内容,平衡检索精度和上下文完整性。父块大小 4000 tokens,子块大小 1024 tokens;

(3)多路召回关键词召回:基于 BM25 算法进行关键词检索;语义召回:基于 bge-m3 模型进行语义检索,将文本转换为 1024 维向量,通过余弦相似度进行检索;

(4)重排序 (Rerank) :使用 bge-reranker-v2-m3 重排序模型对初步检索结果进行精细排序,显著提升检索结果的准确性。


★ 提示词工程

(1)提示词模板设计:设计 多层次提示词 模板,包含系统提示(定义 AI 助手角色和行为准则)、任务描述(明确具体任务要求)、上下文信息(提供相关背景知识)、输出格式(规范回答结构)等,针对不同类型的学习问题定制专属优化提示词。提示词总长度控制在 4000 tokens 以内,确保模型理解准确性。

(2)Few-shot 学习策略:在提示词中包含 3-5 个高质量示例,展示期望的输入输出格式,帮助模型理解任务模式。

(3)思维链技术:引导模型进行逐步推理,提示词格式为:"让我们一步步思考:1. 分析问题类型;2. 识别关键信息;3. 查找相关知识;4. 推理得出结论"。CoT 提示能够显著提升复杂推理任务的准确率。


★ 智能体(Agent)与工作流

(1)智能体架构设计:智能体结合推理和行动能力,包含感知、推理、规划、执行四个核心模块,通过思维链进行复杂推理,能够根据环境反馈调整行为策略。

(2)意图识别智能体:基于大模型构建意图识别器,支持 10+ 种意图类型(知识查询、习题求解、考点分析等)。模型在自建意图数据集上的准确率达到 94.3%。

(3)多轮交互问答工作流:基于 Dify 平台搭建多轮交互问答工作流,通过多轮追问、反问的方式进行问题补全,引导用户提供所需信息,综合考虑多轮问答记录进行问题抽象概括,实现更全面、准确的问题解答。


5

评论区