Welcome to Smart Agriculture 中文

ReG-RAG: A Large Language Model-based Question Answering Framework with Query Rewriting and Knowledge Graph Enhancement

  • LI Xiaoyu ,
  • ZHANG Jiayi ,
  • ZHANG Haitao ,
  • NIE Xiaoyi
Expand
  • College of Information and Intelligence, Hunan Agricultural University, Changsha Hunan 410128, China
NIE Xiaoyi, E-mail:

LI Xiaoyu, E-mail:

Received date: 2025-07-04

  Online published: 2025-10-16

Supported by

Hainan Provincial Sanya Yazhou Bay Science and Technology Innovation Joint Project(ZDYF2025GXJS154)

Copyright

copyright©2025 by the authors

Abstract

[Objective] With the rapid advancement of large language models (LLMs), intelligent question-answering (QA) systems have attracted widespread attention in specialized fields such as agriculture, medicine, and finance. However, existing systems often struggle with queries containing numerous technical terms and complex semantic expressions, frequently leading to unclear semantic comprehension, insufficient retrieval coverage, and low answer accuracy, thereby limiting their practical application. To address these challenges, a retrieval-augmented generation approach named ReG-RAG (Rewrite and Graph-enhanced Retrieval-Augmented Generation) is proposed, which integrates query rewriting and knowledge-graph enhancement to improve the accuracy and interpretability of complex QA tasks by optimizing query semantics and incorporating structured knowledge. Rapeseed cultivation was selected as a case study to demonstrate the framework's effectiveness and generalizability in a specialized domain. [Methods] The ReG-RAG framework comprised three hierarchical layers: query rewriting, dual-channel knowledge retrieval, and knowledge-aware generation. In the query rewriting layer, the system utilized the T5 model to semantically normalize the original query using a predefined set of prompts designed to standardize terminology and clarify user intent. The instruction set, covering five categories of rapeseed knowledge (varieties, breeding, cultivation management, pest and disease control, and nutrient regulation), was constructed from domain literature and expert contributions to enhance query clarity and matching accuracy. In the retrieval layer, the system performed text-vector retrieval and knowledge-graph subgraph retrieval in parallel. The text channel retrieved the top-k (k = 3) most relevant documents via cosine similarity, while the knowledge-graph channel extracted entities and relations using an LLM and, together with a structured metadata annotation system for graph construction, obtained relevant neighborhood subgraphs. The study adopted LightRAG's document segmentation and entity extraction methods to ensure knowledge integrity and traceability. In the generation layer, an attention-routing mechanism was designed to integrate textual and graph-based retrieval results into a multi-source knowledge base. The generation model then produced the final answers, with dynamic weight allocation emphasizing the most relevant knowledge nodes to ensure contextual coherence and factual accuracy. [Results and Discussions] Experiments were conducted on a rapeseed knowledge base (319 QA pairs) and the public WikiEval dataset, with comparative methods including RAG-Fusion, Decomposition, Step Back, HyDE, and Multi-Query. The results demonstrated that ReG-RAG outperformed all baseline methods across multiple evaluation metrics. On the rapeseed dataset, ReG-RAG achieved context precision of 0.904 2, context recall of 0.842 1, faithfulness of 0.988 6, and answer relevance of 0.986 9, significantly exceeding existing approaches. On the WikiEval dataset, it attained corresponding scores of 0.862 0, 0.838 7, 0.969 4, and 0.942 1, reflecting improvements of approximately 2.6%–4.7% over the best-performing baseline methods. Case analyses revealed that ReG-RAG produced logically consistent and complete answers by integrating graph-based reasoning for pest and disease control queries, whereas traditional methods often provided fragmented information. In variety-improvement tasks, responses from RAG-Fusion and LightRAG suffered from information gaps, while ReG-RAG, aided by query rewriting and knowledge Fusion, generated more professional and coherent answers. These findings indicated that ReG-RAG offered notable advantages in resolving query ambiguity, improving knowledge coverage, and enhancing answer faithfulness. [Conclusions] The proposed ReG-RAG framework effectively addressed semantic ambiguity, inadequate retrieval, and generation inaccuracies in domain-specific QA by integrating query rewriting and knowledge-graph enhancement. Experimental validation demonstrated that the method significantly outperformed mainstream baseline approaches on both specialized and general evaluation datasets, exhibiting strong adaptability and generalizability. Limitations of this study included the relatively small data scale and the need for further optimization in inference efficiency and deployment costs. Future work will extend the framework to additional crops such as wheat and rice, expand knowledge coverage, and investigate model compression and edge-deployment strategies to enhance practical applicability. Further optimization of the query-rewriting module's architecture and training procedure will also be pursued to strengthen robustness and generalization in complex semantic scenarios.

Cite this article

LI Xiaoyu , ZHANG Jiayi , ZHANG Haitao , NIE Xiaoyi . ReG-RAG: A Large Language Model-based Question Answering Framework with Query Rewriting and Knowledge Graph Enhancement[J]. Smart Agriculture, 2025 : 1 -11 . DOI: 10.12133/j.smartag.SA202507011

0 引 言

近年来,问答(Question Answering, QA)作为自然语言处理中的核心任务之一,广泛应用于开放领域与专业领域的信息服务系统中1。构建高效、智能的领域问答系统已成为大语言模型应用研究中的重要方向,尤其在农业、医疗、金融等知识密集型领域,对专业信息的获取存在显著需求。随着农业生产复杂性不断提升2,从业者在作物管理、病虫害防控、品种改良及产量提升等方面,亟需便捷、准确的智能问答支持服务。在开放领域知识问答研究中,已有多种技术路线被提出,包括基于规则、基于检索及基于生成的方法,不同方法依赖于多样化的背景知识资源。在此背景下,面向专业领域的问答系统逐渐成为连接人工智能与实际应用的重要桥梁。为进一步验证相关方法的有效性,本研究选取油菜种植作为典型实验场景,构建专业知识库,评估系统在真实农业场景中的应用能力3
随着人工智能领域的突破,有效推动了大语言模型(Large Language Model, LLM)的迅猛发展。以ChatGPT为代表的生成式对话模型引发广泛关注。Google PaLM4、Meta LLaMA5、百度文心一言等陆续推出,推动了LLM在各行业场景中的落地。随着GPT-46的发布,大语言模型的应用范围和实用性进一步提高,尽管大模型在通用任务上表现优异,但在专业领域仍存在理解浅显与“幻觉”频发的问题。
Lewis等7提出的检索增强生成(Retrieval-augmented Generation, RAG)是目前增强大语言模型生成更准确文本答案的主流技术,它通过将外部数据检索集成到生成过程中来提高生成输出的准确性和相关性8。RAG通过将外部知识文档与生成模型结合,在回答生成阶段有效缓解了“幻觉”问题并增强了语义支撑能力。例如,FiD9、REALM10等经典框架已在通用问答任务中获得良好表现。然而,在面对专业领域任务时仍存在显著不足。一方面,用户查询往往存在语义模糊与表达不完整的问题,导致检索召回率不足;另一方面,领域知识具有高度专业化与复杂性,仅依赖通用语料训练的模型难以避免“幻觉”现象,生成的答案在准确性和可解释性方面均存在欠缺。现有的检索增强生成技术通过引入外部知识库改善了部分问题,但仍在查询理解、知识覆盖和回答可靠性等方面面临局限。
研究者在大模型预训练阶段引入查询优化(Query Optimization)11,包括查询重写、查询扩展、多角度查询等,借助大语言模型针对用户的原始查询进一步的处理,来提升检索阶段的召回与精度12。除此之外,知识图谱因其结构化表达能力强、领域语义清晰,正逐步成为增强问答系统推理能力的关键手段13。例如,RAGFlow(https://github.com/infiniflow/RAGflow)、KAG(Knowledge Augmented Generation)知识增强生成14、Dify等多种大模型应用框架,通过引入图结构信息与多跳推理框架,在可控性与可解释性方面取得突破。
尽管这些方法在一定程度上改善了问答系统的性能,但仍存在以下不足:现有查询重写技术多停留在表层语义扩展,缺乏与领域知识深度结合的机制;基于知识图谱的增强方法在推理链条上具有优势,但往往难以与文本检索结果进行有效融合;多数现有工作未能系统性地将查询重写、知识图谱、向量检索三者进行有机结合。
针对上述问题,本研究提出的ReG-RAG框架以大语言模型为核心,将查询重写与知识图谱增强机制深度融合,形成查询、检索、生成的3级协同流程:在查询阶段通过语义重写和伪文档生成提升检索效果;在检索阶段利用向量检索与图谱检索双通道互补,提升知识覆盖率与语义一致性;在生成阶段设计知识感知注意力路由机制,实现多源知识的高效融合与高保真回答。与现有方法相比,ReG-RAG不仅系统性解决了查询模糊、知识覆盖不足与答案不可靠的问题,同时在通用任务与专业任务上均展现出更好的性能。
鉴于本研究所使用的知识库多为中文语料,本文采用智谱华章推出的ChatGLM模型15,其在超过4 000亿文本标识符上完成预训练,并基于GLM-4架构构建ReG-RAG系统,结合油菜知识库开展验证,为农业知识问答提供技术支撑。本研究的主要贡献体现在以下几个方面:在查询阶段引入伪文档生成与语义重写机制,以提升用户原始查询的清晰度与领域适配性;设计由文本向量检索与知识图谱子图检索组成的双通道检索机制,形成语义与实体互补的候选知识集;通过三元组抽取与知识图谱构建提升知识覆盖与语义推理能力;并在真实数据集上开展实验,系统验证了该方法在回答质量与性能方面的优势。

1 研究方法

本研究提出融合查询重写与知识图谱增强的检索增强生成框架ReG-RAG,通过构建3级递进式处理流程,以提升领域问答系统的查询理解能力、知识检索精准度及生成回答的专业性为目标,围绕查询优化、知识组织与语义检索展开设计与实现。

1.1 整体框架

ReG-RAG框架如图1所示,旨在提升问答系统在专业语义理解与知识覆盖方面的综合性能。该框架使用3级级联架构实现领域知识的融合与推理,分别包括查询重写层、双通道知识检索层与知识生成层。给定原始查询 q 0,系统首先通过查询重写层生成语义规范化的查询 q ',随后在双通道知识检索层获取多源数据,最终由知识生成层合成精确答案 a
图1 ReG-RAG框架的架构流程

Fig. 1 Architectural workflow of the ReG-RAG framework

设用户输入的原始查询为 q 0,ReG-RAG首先通过查询重写层对 q 0进行语义规范化,通过大语言模型结合领域提示指令集生成重写问句表示 q '。该过程如公式(1)所示。
q ' = R q 0
式中: R ( )表示基于监督微调优化的大语言模型函数,旨在提升查询的清晰度与领域相关性。
接着,在双通道知识检索层中,系统并行地进行文本向量检索与知识图谱子图检索。文本向量检索通道将 q '映射为向量 v q,然后在文档向量库中检索 T o p - k相关文档,设 k值为3,组成文档集合 D,如公式(2)所示。
D = T o p - k c o s v q , v d , d D
式中 : c o s ( )表示余弦相似度函数。 d表示文档向量库。 v d表示文档库 d的向量表示。
在知识图谱通道中,利用LLM和Light RAG框架从知识文档中识别和提取各种实体(例如,名称、日期、位置和事件)和它们之间的关系,构建三元组。同时,采用结构化元数据标注体系,保留文本来源、上下文位置与实体类别等信息。
基于上述三元组与元数据,构建领域知识图谱。然后,根据 q '从知识图谱中识别出实体集合 E q,以 E q中的实体为种子节点,获取邻域子图 G q,如公式(3)所示。
G q = v i , r i j , v j G v i , v j E q
式中: v i , v j表示知识图谱中的实体节点。 r i j表示实体 v i v j之间的语义关系。 G表示完整的领域知识图谱。
最后,在知识生成层设计注意力路由机制,将两通道检索结果进行融合,构建多源知识库 K q,如公式(4)所示。
K q = D G q
根据知识库 K q,实现问题推理。设生成模块为 G ( ),则最终回答 a ,公式(5)所示。
a = G q ' , K q
式中: q '表示语义规范化的查询。 K q表示由文本检索结果与知识图谱子图融合形成的多源知识库。 G ( )表示以GLM-4为基础的指令式大语言模型,通过融合编码结构与注意力路由机制,实现对文本数据 D与图谱子图 G q的上下文理解。
ReG-RAG框架通过动态查询优化、双通道知识检索与知识生成协同工作,显著提升了面向油菜领域问答任务中的检索精度与回答质量。

1.2 查询重写模块设计

查询重写模块是ReG-RAG框架的核心组件之一,其目标是将用户原始查询 q 0转换为语义规范且领域相关的查询 q ',以解决在油菜领域专业问答中,用户原始查询存在语义不清、表达不规范、领域术语使用混杂等问题。
若直接使用LLM进行查询重写,会产生一些问题,在进行专业领域知识的查询重写任务时,大语言模型易产生“机器幻觉”现象,导致对用户意图的误判,使重写后的查询偏离原始需求,从而加剧生成结果的偏差与错误。为此,本研究采用T5-large16为基础架构,结合领域特点进行监督微调。
由于T5模型并不具备针对农业专业语义的查询重写能力,首先通过提示大语言模型构建伪重写数据集。
1)伪文档生成。设定领域提示指令集 I,用于引导大模型在生成过程中实现术语标准化和语义澄清。该指令集主要涵盖3方面内容:一是领域约束指令,要求生成内容严格遵循相关领域学科规范,优先使用专业术语;二是任务导向指令,根据用户提问的意图调整生成重点;三是表达控制指令,强调文本逻辑清晰、结构合理,便于后续向量化表示与知识对齐。同时,本研究构建了油菜领域术语体系,其来源包括领域文献、相关书籍以及农业专家的研究成果,并在此基础上将术语体系划分为五大类:油菜品种、油菜育种、栽培管理、病虫害防控和营养调控。依托该术语体系,大模型能够在处理原始查询 q 0时有效避免歧义表达,提升伪重写样本 q ' p s e u d o的规范性与专业性,如公式(6)所示。
q ' p s e u d o = L L M q 0 , I
式中: q ' p s e u d o表示伪重写样本。 I表示领域提示指令集。
2)构建监督数据集。将伪重写样本( q 0 q ' p s e u d o)组成训练集,同时加入319条油菜领域的油菜病害、品种、栽培技术相关的问答对,形成高质量的监督数据集 D r e w r i t e
3)模型训练。采用标准的序列生成监督学习方式进行微调,优化目标为最小化查询重写模型对目标查询的自回归损失,如公式(7)所示。
r e w r i t e = - E ( q 0 , q p s e u d o ' ) D r e w r i t e t = 1 T l o g P ( q t ' | q 0 , q t ' )
式中 : q t '表示目标查询中的第 t个词; T为查询的总长度 ; P q t ' | q 0 , q t '表示在给定原始查询及前缀词的条件下生成第 t个词的概率。通过该训练过程,模型学习如何将混乱或模糊的用户表达转化为更具领域适应性的规范查询。
最后,重写模块定义为函数 R ( ),其输出形式同公式(1)所示,重写模块不仅起到“语义澄清器”的作用,也是ReG-RAG框架中保障知识精度的重要环节,为下游的多源知识融合与答案生成打下坚实基础。

1.3 双通道知识检索层设计

为了保证系统对油菜领域知识的高准确率回答,在查询重写后的语义规范化查询基础上,设计了融合式的双通道知识检索机制。该模块由文本向量检索通道与知识图谱子图检索通道组成,分别从文本语料与知识图谱中获取具有语义或实体关联的知识证据,形成内容互补的候选知识集。
图2所示,首先对知识文档进行预处理,采用LightRAG框架中的文本切分策略,将长文档按语义边界与段落逻辑进行切分,使得每个文本块在长度上适配向量化处理(200~500字)并在语义上保持完整性。随后,设置实体关系提取的提示词,如表1所示,然后使用LLM对每个文本块进行实体与关系的识别与抽取,主要包括作物品种、栽培方法、病虫害类型、营养要素等核心实体,以及“属于”“导致”“作用于”等关系类型17。在元数据标注环节,本研究采用结构化元数据标注体系,对每个文本块附加文档ID、段落位置、时间戳、来源文献、语义主题等信息,并保留与原始文本的溯源路径,以确保可追溯性与可验证性,最后利用这些数据构建成知识图谱18。同时,本研究采用Embedding模型BAAI/bge-m3,将文本块向量化,存入向量数据库中。
图2 知识图谱构建与文本向量化数据处理流程

Fig. 2 Data processing pipeline for knowledge graph construction and text vectorization

表1 油菜领域实体关系提取提示词设计

Table 1 Design of prompt words for entity-relation extraction in rapeseed domain

## 角色

你是知识图谱专家,可以根据用户输入提取三元组。

## 技能:三元组提取

根据用户输入的要求,结合知识库{油菜育种栽培学}中的文本信息,将知识库中存在的三元组信息全部抽取。三元组信息包括实体(例如:白菜型油菜、菜籽油、蚤跳甲等)、关系(例如:属于、来自、方法等),并严格按照样式输出。

输出结构如下:

{"实体":"油菜","关系":"发生病害","病害名称":"根肿病"}

{"实体":"油菜根肿病","关系":"防治方法","措施":"轮作"}

{"实体":"油菜","关系":"产量影响因素","因素":"土壤酸碱度"}

## 约束

1. 严格按照定义的本体结构抽取三元组

2. 你只负责信息抽取,不需要回答任何问题

在文本向量检索通道中,采用基于余弦相似度的检索方法,选取前 k个最相关文档构成候选文档集合 D,同公式(2)。该设计有效覆盖了油菜栽培技术、病虫害防治及品种选育等领域的文本知识,显著提升了查询语义的建模效果。
在知识图谱子图检索通道中,系统以 q '中识别出的实体集合 E q为起点,依据公式(3)从油菜领域知识图谱中提取关联子图 G q,该通道通过结构化表征能力,可准确呈现品种特性、病虫害关联及生育期关系等显隐性知识,有效弥补了文本检索在关系推理方面的局限性。两个通道的优势互补,共同构成了完整的知识检索体系。
最终,依据公式(4)双通道返回的文档集合 D和子图集合 G q被统一整合为多源知识库 K q,作为知识生成层的输入。这一融合机制显著提升了系统对复杂查询中隐含信息的响应能力。文本与图谱的协同检索不仅提高了知识覆盖的广度与深度,也为生成模块提供了更具信度与解释力的知识基础,尤其在处理多跳推理、实体消歧与逻辑一致性问题上表现优异。

1.4 知识生成层设计

在完成语义规范化与多源知识检索后,ReG-RAG 框架通过知识生成层整合知识证据,为用户生成最终答案。为适配中文油菜领域问答的语义复杂性与知识密集性,本研究在生成模块中引入由智谱华章推出的ChatGLM系列模型中的GLM-4作为主要生成引擎。GLM-4具备对中文语义深度理解能力,并支持对长上下文信息的有效记忆,显著提升了生成过程中的逻辑一致性与内容完整性。
在具体实现中,依据公式(5)知识生成过程以优化查询 q ',和融合后的知识库 K q为输入,调用生成函数 G ( ),得到最终答案 a。具体而言,先将双通道检索得到的文档集合 D与图谱子图 G q编码为上下文嵌入序列 { h D , h G }。随后,生成模块根据查询表示 q ' 计算两类信息的注意力权重,如公式(8)所示。
α D = s o f t m a x q ' K D T , α G = s o f t m a x q ' K G T
式中: K D   K G分别为文档与子图的键向量,通过注意力权重 α D α G模型能够根据当前生成语境自适应地选择信息来源。最终融合表示定义,如公式(9)所示。
K q = α D V D + α G V G
式中: V D V G分别为文档和子图的值向量。该设计保证了生成答案时既能利用非结构化文本的细节信息,又能依托知识图谱的结构化约束,实现语义的互补与强化。
知识生成层不仅是ReG-RAG框架中的核心输出模块,更是融合语义理解、知识选择与语言生成的关键桥梁。其借助ChatGLM(GLM-4)在中文语义建模方面的优势,结合上游动态查询与双通道知识构建,实现了针对复杂领域问题的可控、高质量回答生成,进一步提升了系统的整体鲁棒性与应用实效。

1.5 实验数据集

为了验证ReG-RAG 框架在问答任务的实际应用效果和领域的适应性,本研究以油菜为研究对象,构建两个不同来源的数据集:一个是基于油菜专业知识构建的问答语料库;另一个是评估框架Ragas使用的公开数据集WikiEval,以测试不同场景下的模型性能。
使用开源的数据集生成工具Easy Dataset(https://github.com/ConardLi/easy-dataset)对油菜文本数据进行处理,生成319条油菜领域问答对,包括油菜品种、油菜育种、栽培管理、病虫害防控、营养调控五大类,如表2所示。该语料库来自领域文献和相关专家的研究成果,采用人工标注方式完成分类与答案对齐,保证问答对的语义清晰、术语标准,以及知识准确19。这部分数据构成了ReG-RAG 框架在特定农业领域的主训练与评估语料,是衡量其专业语义解析与知识定位能力的基础。
表2 油菜知识问答对

Table 2 Rapeseed knowledge question and answer pair

问题 回答 备注
软腐病的主要病症是什么? 软腐病(Pectobacterium carotovorum)的主要病症是在油菜近地面的茎上呈现水渍状软腐,并伴有恶臭味。该病害主要由细菌通过虫口或植物孔口侵入传播,或由虫体带菌传染。防治措施包括使用药剂防治病昆虫、采用畦栽方式降低田间湿度,以及施用充分腐熟的肥料以避免带入病原体 草害
油菜病毒病的主要传染途径是什么? 油菜病毒病的主要传染途径是通过蚜虫传病。具体来说,蚜虫大发生往往会引起病毒的流行。此外,芜菁花叶病毒(Turnip mosaic virus, TuMV)是中国油菜区引起油菜病毒病的主要病毒类型,其传播主要依赖于蚜虫的媒介作用。因此,蚜虫是油菜病毒病传播的关键因素 草害
油菜在轮作复种中具有哪些重要作用? 根据参考内容,油菜在轮作复种中具有以下重要作用:1)培肥地力:油菜能够改善土壤肥力,有助于维持和提升土壤的养分含量;2)改善土壤微生物群落结构:油菜的种植可以促进土壤中有益微生物的生长和多样性,从而优化土壤的生态环境。这些作用使得油菜在农业轮作系统中具有重要的生态和经济价值 油菜栽培
近年来冬油菜种植区域北移的原因是什么? 近年来冬油菜种植区域北移的主要原因是强抗寒的白菜型冬油菜的选育成功。这一育种突破使得冬油菜能够适应更寒冷的气候条件,从而将其种植范围向北扩展至北纬48°地区。这一进展显著扩大了冬油菜的潜在种植区域,突破了以往的气候限制 种植制度
为了对模型的通用性和泛化能力进行评估,本研究引入了RAGas框架下的公开基准数据集WikiEval,该数据集选自50个维基百科页面内容,覆盖多个领域相关信息,包括其对应的问题与答案,以及相关上下文。该数据集有助于验证ReG-RAG在结构不一、内容复杂的文档环境下的鲁棒性与检索增强生成能力。

1.6 评估指标

为了全面衡量所提出的ReG-RAG框架在检索增强问答任务中的性能表现,本研究采用Shahul Es等20提出的自动化评估方法RAGAS(Retrieval Augmented Generation Assessment)。RAGAS是一种无需标注数据自动评估RAG系统的方法。该评估框架评估所需数据集包括用户查询、检索的相关上下文、RAG系统生成的答案,以及人工提出的标准答案这4项数据,针对以上数据设立多项评估指标进行多方面的评估,其中,上下文精度(Context_precision),衡量生成答案时所引用文档与答案之间的相关性程度,反映系统是否精准检索到有助于回答问题的知识片段,如公式(10)所示  
C o n t e x t _ p r e c i s i o n = T P K
式中: K 所有被检索出的文档数量; T P为LLM判断对用户查询有帮助的文档数量。计算出有帮助的文档数量与所有被检索出文档数量的比例。
召回率(Context_recall)是评估检索到的文档中包含标准答案所需要信息的程度,如公式(11)所示。
C o n t e x t _ r e c a l l = V t S t
式中:用LLM提取所有标准答案中的要点,设要点数量为 S t;用LLM判断在上下文中能找到对应信息的要点数量,记作 V t
答案忠实度(Faithfulness),评估的是答案忠实于上下文的程度。因为LLM有编造回答的现象,在理想的RAG系统中,答案应该全部由相关上下文推理而来,如公式(12)所示。
F = V a S a
式中:用LLM提取生成的答案中的要点,设要点的数量为 S a;用LLM检验这些要点是否可以从相关上下文中推理而来,设能够推理而来的要点数量为 V a
答案相关性(Answer_Relevancy),它体现的是生成的答案与用户查询之间的对齐程度,如公式(13)所示。
A n s w e r _ r e l e v a n c y = 1 n i = 1 n s i m q , q i
式中: n为生成的问题数量; q i为第i个生成问题; q为实际的问题。

1.7 实验设置与对比方法

1.7.1 实验环境

本研究实验主要是在配备两块NVIDA T4(16 GB)显卡的设备上进行,操作系统选择稳定的Ubuntu 18.04版本,环境配置为Python 3.10版本,PyTorch 1.10.2版本。知识库方面,采用了neo4j 5.23.0版本和FAISS(Facebook AI Similarity Search)向量数据库21。在最终评估阶段,本研究采用了RAGAS 0.1.18版本。该评估框架提供了多维度的性能指标,能够从多个层面对RAG系统的检索与生成能力进行系统而精准的分析。

1.7.2 基线方法对比分析

在模型配置方面,ReG-RAG采用由智谱华章推出的ChatGLM GLM-4作为底层语言模型,集成查询重写、双通道知识检索与融合生成机制,对油菜领域查询进行语义理解与精确应答。所有实验均在统一硬件环境及参数设置下运行,以确保实验的公平性和可重复性。
为验证本研究提出模型的有效性,本研究选取了5种具有代表性的检索增强生成方法,涵盖查询扩展、查询分解、多角度多路径等多种策略,具体包括:
RAG-Fusion22:通过生成多个用户查询并重新排序结果,然后利用逆向排名融合和自定义向量评分加权进行综合、准确的搜索。
Decomposition23:将复杂问题拆解成多个子问题,每个子问题独立查询并回答,再逐步构建完整答案。
StepBack24:将1个具体问题改写成更通用的问题,然后基于普通问题和改写后的问题检索相关信息,最后综合这些信息生成答案。
HyDE(Hypothetical Document Embeddings)25:使用LLM生成1个假设的文档,再用生成的文档作为查询,获取相关文档,最后利用检索到的文档回答原始问题。
Multi Query:对用户问题生成多个不同的改写版本,然后用改写后的问题去向量数据库查询,提高找到相关文档的概率。

2 实验结果与分析

为验证所提方法ReG-RAG的有效性,本研究在油菜领域问答数据集和通用WikiEval数据集上进行了系统评估,并与多种主流RAG改进方法进行了对比,包括RAG-Fusion、Decomposition、Step Back、HyDE和Multi Query。实验评估指标涵盖上下文精度、召回率、答案忠实度和相关性这4个维度,以全面衡量系统在检索准确性、覆盖率、答案一致性和相关性方面的表现。
表3为油菜领域数据集上的对比结果。可以看到,ReG-RAG在4项指标上均取得最优表现,其中上下文精度(Context_precision)达到0.904 2,召回率(Context_recall)达到0.842 1,答案忠实度(Faithfulness)高达0.988 6,答案相关性(Answer_relevancy)为0.986 9,相比其他方法具有显著优势。例如,相比Multi Query(0.790 0, 0.800 0, 0.855 0, 0.968 1),ReG-RAG在召回率和答案忠实度上分别提升了4.2%与13.4%,有效解决了通用方法在专业领域术语和复杂语境下覆盖不足的问题。
表3 油菜领域数据集ReG-RAG与5种方法的对比实验结果

Table 3 Comparative experimental results of ReG-RAG and five methods on the rapeseed domain dataset

RAG方法 Context_precision Context_recall Faithfulness Answer_relevancy
RAG-fusion 0.800 0 0.633 3 0.814 3 0.970 8
Decomposition 0.800 0 0.700 0 0.941 7 0.774 0
Step back 0.650 0 0.566 7 0.850 0 0.960 4
HyDE 0.812 2 0.665 7 0.726 3 0.934 6
Multi query 0.790 0 0.800 0 0.855 0 0.968 1
ReG-RAG 0.904 2 0.842 1 0.988 6 0.986 9
表4展示了在WikiEval数据集上的实验结果。该数据集覆盖了更为通用的知识范围,用于验证方法的跨领域适应性。ReG-RAG在4项指标上依旧保持领先,分别达到0.862 0 上下文精度(Context_precision)、0.838 7召回率(Context_recall)、0.969 4 答案忠实度(Faithfulness)和 0.942 1 答案相关性(Answer_relevancy),整体性能优于基线方法,相较最佳基线方法提升幅度为2.6%~4.7%。例如,相较于HyDE(0.834 2, 0.812 5, 0.874 5, 0.915 6),ReG-RAG 在答案忠实度上提升 9.5%,显示其在知识整合和答案生成环节上的优势。
表4 WikiEval数据集ReG-RAG与5种方法的对比实验结果

Table 4 Comparative experimental results of ReG-RAG and five methods on the WikiEval dataset

RAG方法 Context_precision Context_recall Faithfulness Answer_relevancy
RAG-fusion 0.802 1 0.783 3 0.915 0 0.890 2
Decomposition 0.810 5 0.775 0 0.800 0 0.902 5
Step back 0.750 0 0.500 0 0.763 3 0.862 5
HyDE 0.834 2 0.812 5 0.874 5 0.915 6
Multi query 0.800 0 0.782 3 0.925 6 0.918 6
ReG-RAG 0.862 0 0.838 7 0.969 4 0.942 1
通过实验数据对比可以发现,不同的检索增强生成方法在查询理解能力、知识覆盖广度和答案生成质量等方面的差异主要在于以下方面:
1)查询重写机制的作用:ReG-RAG能够将模糊或口语化的查询语义规范化,提高检索入口的针对性,这是上下文精度优于其他方法的主要原因。
2)知识图谱增强的价值:相比仅依赖文本检索的方法(如RAG-Fusion),ReG-RAG融入了实体与关系的图谱推理,提升了召回率和答案完整性。
3)双通道融合的鲁棒性:通过注意力路由机制自适应融合向量检索与图谱检索结果,使模型在专业术语密集型和跨领域问题上都能保持高性能。
在定量实验的基础上,本研究进一步选取油菜领域的典型问题,比较了ReG-RAG、LightRAG与RAG-Fusion的回答表现,结果如表5所示。案例分析结果表明,ReG-RAG 在多个维度上展现出更优的性能。
表5 ReG-RAG、LightRAG与RAG-Fusio问题回复案例对比

Table 5 Case comparison of question responses among ReG-RAG, lightRAG, and RAG-Fusion

问题 ReG-RAG LightRAG RAG-Fusion
哪些类型的油菜种质资源在油菜育种中具有重要价值? 在油菜育种中具有重要价值的种质资源主要包括以下类型:甘蓝型油菜(Brassica oleracea L.),分布于地中海沿岸及西欧部分地区,是二倍体祖先种之一,栽培与野生资源丰富,广泛用于蔬菜和饲料。白菜型油菜(Brassica campestris L.或Brassica rapa L.),分布最广,可能是最早被驯化的芸薹属物种,早在6 000~7 000年前中国即已利用,油用与蔬用资源丰富。黑芥(Brassica nigra Koch),主要分布于地中海及中亚、中东地区,作为调味品和药物使用,富含优异抗病基因,对抗病育种价值突出。除主要物种外,地方品种在长期驯化过程中形成,如朱砂红、太仓四月黄、织金黑油菜等,表现出早熟、结实性强或果室多等特性。选育品种则通过遗传学原理与技术创制,如波兰春性甘蓝型品种“布诺洛夫斯基”具有低硫苷特性,饲用品种“李霍”含低芥酸基因,成为全球品质育种的重要基因源。这些种质资源为油菜育种提供了丰富的遗传多样性,支撑高产、优质、抗病与抗逆新品种的培育 在油菜育种中,具有以下类型的种质资源具有重要价值。1)地方品种:这些品种经过长期选育,适应特定环境和栽培系统,具有独特的遗传特性和适应性。它们对于保持油菜遗传多样性、提高抗逆性和适应性具有重要意义。2)野生种:野生油菜品种携带基因,对疾病和害虫具有抵抗力,是油菜种质创新的关键材料。3)特殊遗传材料:这些材料具有特殊的遗传特性,如抗病性、抗逆性等,对于培育新品种和改良现有品种具有重要价值。4)引进品种:从国外引入的油菜品种可能具有新的遗传特性和适应性,可以丰富油菜种质资源。5)优异种质资源:这些种质资源具有遗传多样性、适应性强等特点,是培育新品种的重要基础。6)种质资源收集保护:通过收集和保护油菜种质资源,可以保存宝贵的遗传信息,为未来的育种工作提供基础 在油菜育种中,以下类型的油菜种质资源具有重要价值。白菜型油菜:具有较强的适应性,能在多种土壤和气候条件下生长。生育期短,适合早熟栽培。含油量较高,种子千粒重和含油量均较高。甘蓝型油菜:优质化、杂交化程度高,是当前油菜种植的主要类型。特早熟甘蓝型油菜杂交种的育成和推广,提高了产量和品质。对光照和温度的适应性较强,有利于在不同地区种植。芥菜型油菜:具有较强的抗逆性,如耐旱、耐盐碱等。分枝性强,产量潜力大。种子含油量较高,且蛋白质含量丰富
跳甲在油菜上主要发生的时间是什么时候? 跳甲在油菜上主要发生的时间是在油菜苗期,尤其是春油菜受害最重,冬油菜受害相对较轻。具体来说,当油菜初现子叶时,跳甲就可能开始为害,与生长点一起被吃掉,导致幼苗成片枯死。幼虫也会危害幼苗根部,使地上部变黄萎蔫而死。成虫具有驱绿性,在油菜抽薹开花以后,成虫会为害花蕾和幼嫩角果,晚熟品种受害较重。因此,跳甲在油菜苗期至抽薹开花期都可能发生,但以苗期最为严重 根据知识库信息,跳甲在油菜上的主要发生时间如下:苗期为主要危害期,跳甲是油菜苗期的重要害虫,特别是春油菜区受害较重,冬油菜区受害相对较轻。当油菜初现子叶时,跳甲就可能开始为害,吃掉子叶和生长点,导致幼苗成片枯死。成虫活动时间在油菜抽薹开花以后,成虫会为害花蕾和幼嫩角果,晚熟品种受害较重春油菜区跳甲成虫活动期通常在春季播种后出苗期间。越冬与防治时间春油菜区常用秋耕、冬凌、深翻、冬灌等措施来消灭越冬成虫或幼虫。播种时采用防虫种衣剂进行种子包衣可以有效预防跳甲危害。虫害发生时需及时进行药剂防治跳甲。1年发生代数因地区而异,寒冷地区较少,温暖地区较多,但其主要危害期集中在油菜苗期,特别是春油菜区的早期生长阶段 根据文档内容,跳甲类害虫在油菜上的发生时间如下:黄曲条跳甲以成虫或幼虫形态越冬,主要在春季油菜抽薹开花以后为害。成虫具有驱绿性,在油菜开花期为害花蕾和幼嫩角果,晚熟品种受害较重。油菜蚤跳甲以成虫越冬,1年发生1~2代。主要在春季油菜花蕾期危害,成虫取食花器和产卵于花蕾内为害,形成典型的“秃梗”症状。跳甲类害虫主要以成虫或幼虫越冬,春季是它们的主要危害期,特别是在油菜花蕾期。春油菜区通过秋耕、冬凌、深翻、冬灌等措施可以消灭越冬的跳甲虫态,减少春季虫口基数
高温胁迫会对油菜的哪些生理过程产生影响? 根据给定的内容,高温胁迫会对油菜的以下生理过程产生影响。1) 细胞膜系统:高温会导致油菜细胞膜系统被破坏,造成电解质外渗,细胞内大量活性氧积累。2)叶片功能:叶片变黄萎缩、气孔关闭、光合作用减弱。3)水分代谢:严重时会导致植物脱水死亡。4)籽粒发育:当气温达到28 ℃左右时,角果壳光合作用受阻。当日平均气温在24~25 ℃时,籽粒灌浆过程会被中止。5)整体生长:高温胁迫(通常伴随低湿和一定风力的大气干旱现象)会严重影响油菜的正常生长发育。这些影响涵盖了从细胞层面到器官层面再到整体植株的生理过程,包括膜系统稳定性、光合作用、水分平衡以及生殖发育等关键生理功能 高温胁迫会对油菜的多个生理过程产生显著的负面影响,主要包括以下几个方面:细胞结构与功能:高温胁迫会导致油菜细胞膜系统被破坏,引起电解质外渗,同时造成细胞内大量活性氧积累。这些变化会严重干扰细胞正常的生理功能,严重时可导致植物脱水死亡。光合作用:高温胁迫会显著影响油菜的光合作用过程,表现为气孔关闭和光合作用减弱。当气温达到28 ℃左右时,角果壳的光合作用会受到阻碍;当日平均气温在24~25 ℃时,籽粒灌浆过程会被中止。生长与发育:在油菜籽粒发育形成期,高温会影响正常的生长和发育过程。研究表明,高温胁迫会导致油菜株高和生物量积累随之降低,影响最终的产量和品质。应对措施:生产上可以通过营造防护林带改善农田小气候,加强农田基本建设,合理布局种植区域,以及适当喷施植物生长调节剂等措施来缓解高温胁迫对油菜的不利影响 细胞结构影响:高温会导致油菜细胞膜系统被破坏、电解质外渗、细胞内大量活性氧积累,这些变化直接破坏了细胞的基本结构和功能完整性。光合作用影响:高温胁迫会使叶片变黄萎缩、气孔关闭,进而导致光合作用显著减弱。在油菜籽粒发育形成期,当气温达到28 ℃左右,角果壳的光合作用会受到阻碍,严重影响能量转换效率。灌浆过程影响:当日平均气温达到24~25 ℃时,油菜籽粒灌浆过程会被中止,这直接影响了油菜的产量形成,因为籽粒灌浆是决定最终产量的关键阶段。生长发育影响:严重的高温胁迫会导致植物脱水死亡,使整个植株无法完成正常的生长发育周期,最终导致产量大幅下降。这些生理变化表明,高温胁迫通过破坏细胞结构、抑制光合作用、阻碍籽粒灌浆等多重机制,对油菜的生长发育和产量造成严重影响
从内容覆盖的角度看,ReG-RAG的回答不仅涉及核心知识点,还结合了资源分布、应用价值及育种意义等多层次信息,形成了系统而完整的答案框架。相比之下,LightRAG与RAG-Fusion的回答在细节广度与深度方面均显不足,往往仅停留在要点层面。针对专业规范性方面,ReG-RAG的回答充分使用油菜学科的标准化术语,并保持与已有领域知识体系的一致性。这种表述方式不仅保证了答案的科学性,也提升了其在专业应用场景中的可靠性,而其他方法的结果在概念使用上仍存在一定程度的模糊化。通过实验案例可以看出,逻辑结构同样也体现出差异。ReG-RAG生成的回答呈现出层次清晰的论证路径,能够在因果关系、条件约束和结论推导之间形成紧密衔接,使复杂问题的解释更具条理性。相较而言,LightRAG和RAG-Fusion的结果在逻辑组织上表现较为分散,缺乏系统性的支撑。
此外,ReG-RAG在忠实度方面的优势尤为明显。在解释高温胁迫对油菜生理过程的影响时,其回答涵盖了细胞膜系统、光合作用、水分代谢等关键生理环节,展现出较强的事实准确性与知识溯源能力。这一特征体现了该方法对多源知识整合的有效利用,也进一步印证了其生成结果的科学性。

3 结 论

本研究针对领域问答系统在查询语义模糊、知识覆盖不足与答案生成不准确等核心问题,提出了一种融合查询重写、知识图谱增强和多源知识检索机制的通用型检索增强生成框架 ReG-RAG。该方法在框架设计上引入了查询重写层、双通道知识检索层与知识生成层,实现了对查询语义的规范化、对多源知识的高效整合以及对答案生成的质量提升。结果表明,ReG-RAG在油菜领域专用数据集与通用WikiEval数据集上均取得优于现有方法的表现。在上下文精度、召回率、答案忠实度与相关性等指标上分别达到0.904 2、0.842 1、0.988 6、0.986 9(油菜领域)与0.862 0、0.838 7、0.969 4、0.942 1(WikiEval数据集),相较最佳基线方法提升幅度在约为2.6%~4.7%,有效验证了其在垂直领域与通用场景中的适用性和优势。
本研究仍存在一定局限性,如实验数据规模有限、推理效率和计算成本较高,可能影响在更大规模和实时场景下的应用。未来工作将围绕3方面展开:一是扩展知识库覆盖范围,增强跨领域通用性;二是探索模型压缩、知识蒸馏与边缘部署,降低推理成本;三是优化查询重写模块的语义建模与训练机制,提高在复杂表达和跨语言场景下的鲁棒性与泛化能力。通过这些改进,ReG-RAG有望在更大规模的智能问答与知识服务应用中发挥重要作用。

本研究不存在研究者以及与公开研究成果有关的利益冲突。

[1]
王婷, 王娜, 崔运鹏, 等. 基于人工智能大模型技术的果蔬农技知识智能问答系统[J]. 智慧农业(中英文), 2023, 5(4): 105-116.

WANG T, WANG N, CUI Y P, et al. Agricultural technology knowledge intelligent question-answering system based on large language model[J]. Smart agriculture, 2023, 5(4): 105-116.

[2]
殷艳, 尹亮, 张学昆, 等. 我国油菜产业高质量发展现状和对策[J]. 中国农业科技导报, 2021, 23(8): 1-7.

YIN Y, YIN L, ZHANG X K, et al. Status and countermeasure of the high-quality development of rapeseed industry in China[J]. Journal of agricultural science and technology, 2021, 23(8): 1-7.

[3]
TZACHOR A, DEVARE M, RICHARDS C, et al. Large language models and agricultural extension services[J]. Nature food, 2023, 4(11): 941-948.

[4]
CHOWDHERY A, NARANG S, DEVLIN J, et al. PaLM: Scaling language modeling with pathways[J]. Journal of machine learning research, 2023, 24(1): 11324-11436.

[5]
TOUVRON H, LAVRIL T, IZACARD G, et al. LLaMA: Open and efficient foundation language models[EB/OL]. arXiv: 2302.13971, 2023.

[6]
OPENAI, ACHIAM J, ADLER S, et al. GPT-4 technical report[EB/OL]. arXiv: 2303.08774, 2023.

[7]
LEWIS P, PEREZ E, PIKTUS A, et al. Retrieval-augmented generation for knowledge-intensive NLP tasks[EB/OL]. arXiv: 2005.11401, 2020.

[8]
文森, 钱力, 胡懋地, 等. 基于大语言模型的问答技术研究进展综述[J]. 数据分析与知识发现, 2024, 8(6): 16-29.

WEN S, QIAN L, HU M D, et al. Review of research progress on question-answering techniques based on large language models[J]. Data analysis and knowledge discovery, 2024, 8(6): 16-29.

[9]
IZACARD G, GRAVE E. Leveraging passage retrieval with generative models for open domain question answering[EB/OL]. arXiv: 2007.01282, 2020.

[10]
Guu K, Lee K, Tung Z, et al. Retrieval-Augmented Language Model Pre-Training[C] // Proceedings of the 37th International Conference on Machine Learning. New York, USA: PMLR, 2020: 3929–3938.

[11]
吴璇, 付涛. 检索增强生成技术研究综述[J/OL]. 计算机工程与应用. (2025-06-11)[2025-06-21].

WU X, FU T. Comprehensive review of retrieval-augmented generation[J/OL]. Computer engineering and applications. (2025-06-11) [2025-06-21].

[12]
SONG M Y, ZHENG M. A survey of query optimization in large language models[EB/OL]. arXiv: 2412.17558, 2024.

[13]
张鹤译, 王鑫, 韩立帆, 等. 大语言模型融合知识图谱的问答系统研究[J]. 计算机科学与探索, 2023, 17(10): 2377-2388.

ZHANG H Y, WANG X, HAN L F, et al. Research on question answering system of large language model fusion knowledge map[J]. Journal of frontiers of computer science technology, 2023, 17(10): 2377-2388.

[14]
LIANG L, BO Z P, GUI Z K, et al. KAG: Boosting LLMs in professional domains via knowledge augmented generation[C]// Proceedings of the ACM on Web Conference 2025. New York, USA: ACM, 2025: 334-343.

[15]
GLM T,:, ZENG A H, et al. ChatGLM: A family of large language models from GLM-130B to GLM-4 all tools[EB/OL]. arXiv: 2406.12793, 2024.

[16]
RAFFEL C, SHAZEER N, ROBERTS A, et al. Exploring the limits of transfer learning with a unified text-to-text transformer[J]. Journal of machine learning research, 2020, 21(1): 5485-5551.

[17]
李冬梅, 罗斯斯, 张小平, 等. 命名实体识别方法研究综述[J]. 计算机科学与探索, 2022, 16(9): 1954-1968.

LI D M, LUO S S, ZHANG X P, et al. Review on named entity recognition[J]. Journal of frontiers of computer science technology, 2022, 16(9): 1954-1968.

[18]
GUO Z R, XIA L H, YU Y H, et al. LightRAG: Simple and fast retrieval-augmented generation[EB/OL]. arXiv: 2410.05779, 2024.

[19]
杨文跃, 于千城, 王启明, 等. 葡萄酒领域知识多路径检索增强生成方法优化研究[J/OL]. 计算机工程与应. (2025-04-17)[2025-06-21].

YANG W Y, YU Q C, WANG Q M, et al. Optimization research on multi-path retrieval-augmented generation method for wine domain knowledge[J/OL]. Computer engineering and applications. (2025-04-17) [2025-06-21].

[20]
ES S, JAMES J, ESPINOSA ANKE L, et al. RAGAs: Automated evaluation of retrieval augmented generation[C]// Proceedings of the 18th Conference of the European Chapter of the Association for Computational Linguistics: System Demonstrations. St. Julians, Malta. Stroudsburg, PA, USA: ACL, 2024: 150-158.

[21]
DOUZE M, GUZHVA A, DENG C Q, et al. The faiss library[EB/OL]. arXiv: 2401.08281, 2024.

[22]
Rackauckas Z. RAG-Fusion: a New Take on Retrieval-Augmented Generation[EB/OL]. arXiv: 2402.03367v1, 2024.

[23]
ZHOU D, SCHÄRLI N, HOU L, et al. Least-to-most prompting enables complex reasoning in large language models[EB/OL]. arXiv: 2205.10625, 2022.

[24]
ZHENG H S, MISHRA S, CHEN X Y, et al. Take a step back: Evoking reasoning via abstraction in large language models[EB/OL]. arXiv: 2310.06117, 2023.

[25]
GAO L Y, MA X G, LIN J, et al. Precise zero-shot dense retrieval without relevance labels[C]// Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). Toronto, Canada. Stroudsburg, PA, USA: ACL, 2023: 1762-1777.

Outlines

/