科技 > 人工智能 > 车联网

MindMap:利用知识图谱中的精确、全面信息,并通过大模型进行有效的语义处理和推理

92人参与 2024-08-01 车联网

 


提出背景

论文:mindmap: knowledge graph prompting sparks graph of thoughts in large language models

代码:https://github.com/wyl-willing/mindmap

mindmap 通过结合知识图谱提供实时知识更新和透明的推理路径,相比传统llm在处理复杂查询时显著提升了准确性、透明度和解释能力。

1. 知识更新与整合

2. 信息准确性与幻觉问题

3. 推理透明度与解释性

4. 处理复杂查询的能力

5. 系统灵活性和扩展性

mindmap通过创新性地融合知识图谱和大型语言模型,克服了单纯依赖llm处理复杂查询时的多种限制,为用户提供了更精确、可靠、透明和解释性强的解决方案。

知识图谱和大模型联合推理

mindmap的优势在于可以利用自然语言处理能力,对于复杂的query(用户提问)和外在数据库联系起来。

工作流程涉及几个关键步骤,每一步都利用了llm和kg的特点,以确保生成的答案既准确又信息丰富。

预处理和输入理解

知识图谱检索

证据合成

输出和反馈

mindmap = 基于邻居的证据探索 + 基于路径的证据探索 + 证据整合 + 推理与生成

在这里插入图片描述
这张图展示了mindmap方法的整体架构,分为两个主要部分:证据图挖掘和证据图聚合,以及基于思维导图(树思维链)的llm推理。

左侧部分:证据图挖掘(evidence graph mining)

  1. 问题(question)
    • 示例问题:“医生,我最近感觉非常疲倦,腹部肿胀和触痛,并且眼睛有黄疸。这可能是肝脏问题吗?”
  2. 关键词(keywords)
    • 从问题中提取的关键词包括:肝脏问题(liver problem)、疲劳(fatigue)、腹部肿胀(abdominal swelling)、腹部触痛(abdominal tenderness)、黄疸(jaundice)。
  3. 实体识别(entity recognition)
    • 通过bert相似度匹配,从提取的关键词和外部知识图谱中找到相关实体,形成vq。
  4. 基于路径的证据图探索(path-based evidence graph exploration)
    • 详细展示了如何通过多跳路径探索找到相关实体和路径的过程。

假设症状是“疲劳”和“腹部肿胀”。

在多跳路径探索中,系统可能首先从疲劳这一症状出发,通过知识图谱探索与之直接相关的可能疾病,如“肝硬化”。

接着,系统进一步探索从“肝硬化”到其他相关症状和疾病的路径,比如“肝硬化”可能导致的“黄疸”。

这样一来,就形成了一个从“疲劳”出发,经过“肝硬化”,最终关联到“黄疸”的路径。

  1. 基于邻居的证据图探索(neighbor-based evidence graph exploration)
    • 通过一跳邻居探索找到相关实体和证据图的过程。

右侧部分:证据图聚合(evidence graph aggregation)

  1. 证据图聚合(evidence graph aggregation)
    • 将路径证据图和邻居证据图整合,形成推理图(reasoning graph)。

在上述例子中,我们已经通过路径证据图发现了“疲劳”与“黄疸”的关联路径。

同时,在邻居证据图中,系统可能发现“腹部肿胀”直接与“肝癌”关联。

通过整合这两个证据图,我们可以构建一个更全面的推理图。

这个推理图将包括从“疲劳”到“肝硬化”再到“黄疸”的路径,以及“腹部肿胀”直接与“肝癌”关联的信息。

这样的推理图帮助系统更全面地理解患者的症状可能指向的多种疾病。

  1. 推理图(reasoning graph)
    • 示例推理过程:疲劳可能是肝硬化的症状,肝硬化可能导致胃胀,胃胀也可能是肝癌的症状等。
  2. 输出(outputs)
    • output1:总结(summary):基于症状描述,患者可能患有肝硬化,需要进行血液测试,推荐使用抗病毒药物。
    • output2:推理过程(inference process):详细描述了推理的每一步,包括从症状到可能疾病的路径。
    • output3:决策树(decision tree):展示了患者症状到最终诊断结果的思维导图,清晰地展示了推理过程。

这张图提供了mindmap方法的概览,左侧部分展示了证据图挖掘的各个组件,右侧部分展示了证据图聚合和基于思维导图的llm推理。

基于思维导图的llm推理:

通过结合基于邻居和路径的证据探索,mindmap能够生成准确且有理由的答案,并通过图形化的推理过程提供透明的解释。

mindmap = 基于邻居 (关键实体识别+邻居节点扩展+相关节点筛选) + 基于路径 (关键路径识别+路径证据图构建+多跳信息整合)

邻居证据探索
路径证据探索
证据整合
推理与生成

mindmap通过结合这两种方法,能够充分利用它们各自的优势,达到更好的性能和鲁棒性:

基于邻居的方法,在提高事实准确性方面比基于路径的方法更有效。

对于涉及医学查询的任务,基于路径的方法在查找相关外部信息方面更好,但在处理诸如药物和测试推荐等多跳答案时表现不佳。

mindmap的优越表现主要来自于它能够灵活结合邻居和路径两种证据探索方法,从而在不同类型的任务中都能表现出色。

这种综合方法确保了系统在处理简单和复杂查询时都能提供准确且合理的答案。

 

假设有一个用户查询:“患者最近一直感到疲劳,并且腹部肿胀,可能是什么问题?”

邻居证据探索

路径证据探索

mindmap(结合邻居和路径)

推理过程

在这里插入图片描述

这张图片详细展示了mindmap框架在处理用户健康查询时的具体工作流程和推理过程。

1. 用户查询 (question query)
2. 首次llm处理(实体识别和初步推理)
3. 证据图聚合 (merged reasoning graph)
4. 第二次llm处理(生成输出)

在这里插入图片描述

 
mindmap分为三个主要部分。

3.1 步骤i:证据图挖掘

在这一阶段,我们需要从外部知识图谱(kg)中发现与问题相关的证据子图。具体步骤如下:

3.1.1 实体识别
3.1.2 证据子图探索

3.2 步骤ii:证据图聚合

在此阶段,llm需要将不同的证据子图(gq)整合为一个统一的推理图(gm)。

3.2.1 整合步骤

3.3 步骤iii:llm结合思维导图进行推理

在此步骤中,我们使用推理图(gpath m和gnei m)提示llm生成最终输出。

3.3.1 图推理提示
3.3.2 llm与kg知识的协同推理

逻辑关系拆解:

 

举个例子。

步骤一:证据图挖掘

步骤二:证据图聚合

步骤三:llm在思维图上的推理

mindmap 细节分析

为什么好于知识图谱+大模型

方式3代表了传统的知识图谱查询,这通常侧重于单一路径或直接关系的检索。

方式4 mindmap,它不仅依赖于知识图谱的结构化查询,还融合了多跳推理(长链条)和多路径探索。这意味着它能够通过多个节点和连接分析复杂的关系,从而提供更全面的问题解读。

在这种模式下,如图所示的路径和邻居方法被并用,使得系统能够通过探索症状与多种疾病间的潜在联系,如肝硬化、黄疸至胆结石等多个步骤的逻辑链路,进而提供更为全面的诊断视角。

在我觉得,医学诊断就是特征识别,之所以有xxx特征,是因为yyy病

知识图谱就是特征匹配的好工具。

mindmap比 知识图谱+大模型 更强,因为多链路推理使得知识图谱结构化推理。

知识图谱的单一路径推理相比于结构化推理,缺少了对多症状和多疾病间复杂关联的全面考量,限制了其在处理多因素交织的医疗诊断问题时的适应性和准确性。

mindmap结论:已经有了结构化推理 + 海量疾病模式识别库

比如一个问题,想通需要十步,而正常人或者大模型,ta最多只能推导三步,这意味着解决不了这种复杂关系问题。

而mindmap可以通过 知识图谱结构化 + 类似二级结论(不用推理直接走2步)的病症疾病识别 + 拼接每个逻辑短链 的方式,变成 3 + 3 + 3 + 1 再整合起来,就能做到十步的推理。

mindmap 查邻居、查关系、结合推理每步具体是什么?

在使用知识图谱进行医学分析时,查邻居和查路径是两种常见的查询方式,每种方式得到的结果都有其特定的用途和特点。

查邻居(neighbor lookup):

查路径(path finding):

结合查邻居和查路径:

怎么得到的一个症状的所有可能性?

如果要得到一个症状的所有可能性适用方法:为了得到一个症状的所有可能性,即所有可能的疾病和相关的症状,最有效的方法是结合查邻居和查路径。

通过这种结合,可以不仅查看与症状直接关联的疾病,还能探索通过不同路径连接的其他可能关联的症状和疾病,从而构建一个全面的症状-疾病网络

这种方法提供了从单一症状出发的最广泛的医学解释和联系,从而帮助医生或研究人员全面理解症状的潜在原因和复杂性。

这种综合查询策略能够极大地增强医学诊断的深度和准确性,为患者提供更为精确的诊断信息和治疗建议。

查邻居,查路径,再结合,和查邻居和邻居的邻居区别?

查邻居和查路径再结合的操作能够揭示节点之间复杂的直接和间接关系,而查邻居和邻居的邻居仅涉及到简单的、多一层的直接关系探索,缺乏深入的路径分析和复杂关系的整合。

应用可能的问题

思想实验,在实际场景可能遇到的问题:

可能问题

  1. 节点堆积
  2. 大量无用文本
  3. 推理速度变慢
  4. 大量相似度节点
  5. 提示词写死,无法适配环境
  6. 可靠性问题,没有机制,去复验生成结果的
解决节点堆积问题
减少无用文本
提高推理速度

知识图谱不用 neo4j,改成 nebula graph (开源分布式图数据库,千亿顶点和万亿边仅毫秒级查询延时)。

减少相似度节点
优化提示词设计
优化节点选择算法
可靠性问题,没有机制,去复验生成结果的

少了评估校准,这个工作流是很理想化。

到了真正工作的过程中,需要一个机制,去复验生成结果的。

作者想法:其实可以采用用知识图谱反验证的形式,对结果进行调控。输入的事实准确度还是会对最后结果影响挺大的,可以做一下噪声处理或者采用知识编辑的方式,交叉验证。

推理算法分析

证据图挖掘阶段,主要是知识图谱驱动的,侧重于从庞大的结构化数据中提取相关信息,知识图谱提供了结构化的数据支持,而大模型则辅助进行语义分析和实体识别。

证据图聚合阶段,则是大模型推理的,侧重于使用这些信息进行有效的逻辑推理和答案生成,目的是将挖掘阶段得到的多个子图合成一个统一的、能够支持答案生成的推理图。

阶段1: 证据图挖掘(数据输入 => 实体识别,实体 => 子图)

实体识别

子图探索

阶段2: 证据图聚合(子图 => 推理图)
阶段3: llm利用脑图推理(推理图 => 输出)

验证和优化

全流程问题分析

实体识别阶段问题

实体识别可能受限于上下文理解的精确性,尤其是在复杂或含糊的文本中,可能导致错误或遗漏关键实体。

子图探索阶段问题

子图探索可能无法有效捕捉复杂或间接的实体关系,导致推理图不完整或错误。

图神经网络优化:利用图神经网络(gnn)来识别和学习实体间的复杂关系模式。

证据图聚合阶段问题

据图聚合可能会因为信息过载导致重要信息丢失或推理路径不明确。

优化方案:

llm利用脑图推理阶段问题

llm可能在解释复杂推理图时出现理解偏差,或生成不准确的推理结果。

优化方案:

(0)
打赏 微信扫一扫 微信扫一扫

您想发表意见!!点此发布评论

推荐阅读

YOLOv8-ROS-noetic+USB-CAM目标检测

08-01

概念解析 | 利用MIMO雷达技术实现高性能目标检测的关键技术解析

08-01

目标检测——YOLOX算法解读

08-01

一文搞懂YOLO系列目标检测!万字长文(附YOLOv8实操教程)

08-01

从0开始yolov8模型目标检测训练 验证和测试

08-01

目标检测 - yolov8初体验+训练自定义数据集

08-01

猜你喜欢

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论