欢迎您访问《智慧农业(中英文)》官方网站! English
专题--农业知识智能服务和智慧无人农场(上)

基于大语言模型推理的数字孪生平台蔬菜作物生长模型研究

  • 赵春江 ,
  • 李静晨 ,
  • 吴华瑞 ,
  • 杨雨森
展开
  • 北京市农林科学院信息技术研究中心,北京 100079,中国
赵春江,研究员,中国工程院院士,研究方向为大语言模型与农业知识服务。E-mail:

收稿日期: 2024-10-11

  网络出版日期: 2025-01-16

基金资助

国家重点研发计划(2021ZD0113604)

财政部和农业农村部国家现代农业产业技术体系建设专项(CARS-23-D07)

中央引导地方科技发展资金项目(2023ZY1-CGZY-01)

Vegetable Crop Growth Modeling in Digital Twin Platform Based on Large Language Model Inference

  • ZHAO Chunjiang ,
  • LI Jingchen ,
  • WU Huarui ,
  • YANG Yusen
Expand
  • Information Technology Research Center, Beijing Academy of Agriculture and Forestry Sciences, Beijing 100079, China
ZHAO Chunjiang, E-mail:

Received date: 2024-10-11

  Online published: 2025-01-16

Supported by

National Key R&D Program of China under Grant(2021ZD0113604)

China Agriculture Research System of MOF and MARA Grant(CARS-23-D07)

Central Guiding Local Science and Technology Development Fund Projects under Grant(2023ZY1-CGZY-01)

Copyright

copyright©2024 by the authors

摘要

[目的/意义] 利用数字孪生技术实现对无人农场的实时监管和虚实映射控制是新一代农业信息化技术的核心需求之一,但由于蔬菜生长模型过于复杂,难以在数字孪生平台中建立作物预期模拟,因此结合人工智能技术实现作物生长自动建模成了领域迫切需要的关键技术。 [方法] 在蔬菜作物数字孪生平台中引入大语言模型技术,通过预训练大语言模型的推理能力实现蔬菜生长数字孪生平台中准确的蔬菜作物生长模拟。为了使大语言模型具有关于蔬菜作物生长的更多知识和推理能力,首先收集了大量连续的蔬菜生长数据,用于预训练和指令微调;随后设计了阶段式大语言模型智能体集合,由一个预测蔬菜生长阶段的管理型智能体和负责各个阶段的智能体组成,根据数字孪生平台提供的实时数据对蔬菜作物生长进行建模。 [结果和讨论] 根据气候、土壤、灌溉、施肥、病虫害、生长日期等蔬菜生长状态信息,所建模型能够预测次日的作物长势,且能根据数字孪生平台的作物管理模拟实现几天甚至几个月的长势预测。通过十折交叉验证证明,该方法使得大语言模型在进行蔬菜作物生长建模时的准确率达到98%,蔬菜生长阶段识别准确率高达99.7%。 [结论] 研究表明大语言模型能够在特定数据微调后,实现对于数字孪生平台中作物生长的一般性推理,且能平滑过渡到作物生长的不同阶段。

本文引用格式

赵春江 , 李静晨 , 吴华瑞 , 杨雨森 . 基于大语言模型推理的数字孪生平台蔬菜作物生长模型研究[J]. 智慧农业, 2024 , 6(6) : 63 -71 . DOI: 10.12133/j.smartag.SA202410008

Abstract

[Objective] In the era of digital agriculture, real-time monitoring and predictive modeling of crop growth are paramount, especially in autonomous farming systems. Traditional crop growth models, often constrained by their reliance on static, rule-based methods, fail to capture the dynamic and multifactorial nature of vegetable crop growth. This research tried to address these challenges by leveraging the advanced reasoning capabilities of pre-trained large language models (LLMs) to simulate and predict vegetable crop growth with accuracy and reliability. Modeling the growth of vegetable crops within these platforms has historically been hindered by the complex interactions among biotic and abiotic factors. [Methods] The methodology was structured in several distinct phases. Initially, a comprehensive dataset was curated to include extensive information on vegetable crop growth cycles, environmental conditions, and management practices. This dataset incorporates continuous data streams such as soil moisture, nutrient levels, climate variables, pest occurrence, and historical growth records. By combining these data sources, the study ensured that the model was well-equipped to understand and infer the complex interdependencies inherent in crop growth processes. Then, advanced techniques was emploied for pre-training and fine-tuning LLMs to adapt them to the domain-specific requirements of vegetable crop modeling. A staged intelligent agent ensemble was designed to work within the digital twin platform, consisting of a central managerial agent and multiple stage-specific agents. The managerial agent was responsible for identifying transitions between distinct growth stages of the crops, while the stage-specific agents were tailored to handle the unique characteristics of each growth phase. This modular architecture enhanced the model's adaptability and precision, ensuring that each phase of growth received specialized attention and analysis. [Results and Discussions] The experimental validation of this method was conducted in a controlled agricultural setting at the Xiaotangshan Modern Agricultural Demonstration Park in Beijing. Cabbage (Zhonggan 21) was selected as the test crop due to its significance in agricultural production and the availability of comprehensive historical growth data. Over five years, the dataset collected included 4 300 detailed records, documenting parameters such as plant height, leaf count, soil conditions, irrigation schedules, fertilization practices, and pest management interventions. This dataset was used to train the LLM-based system and evaluate its performance using ten-fold cross-validation. The results of the experiments demonstrating the efficacy of the proposed system in addressing the complexities of vegetable crop growth modeling. The LLM-based model achieved 98% accuracy in predicting crop growth degrees and a 99.7% accuracy in identifying growth stages. These metrics significantly outperform traditional machine learning approaches, including long short-term memory (LSTM), XGBoost, and LightGBM models. The superior performance of the LLM-based system highlights its ability to reason over heterogeneous data inputs and make precise predictions, setting a new benchmark for crop modeling technologies. Beyond accuracy, the LLM-powered system also excels in its ability to simulate growth trajectories over extended periods, enabling farmers and agricultural managers to anticipate potential challenges and make proactive decisions. For example, by integrating real-time sensor data with historical patterns, the system can predict how changes in irrigation or fertilization practices will impact crop health and yield. This predictive capability is invaluable for optimizing resource allocation and mitigating risks associated with climate variability and pest outbreaks. [Conclusions] The study emphasizes the importance of high-quality data in achieving reliable and generalizable models. The comprehensive dataset used in this research not only captures the nuances of cabbage growth but also provides a blueprint for extending the model to other crops. In conclusion, this research demonstrates the transformative potential of combining large language models with digital twin technology for vegetable crop growth modeling. By addressing the limitations of traditional modeling approaches and harnessing the advanced reasoning capabilities of LLMs, the proposed system sets a new standard for precision agriculture. Several avenues also are proposed for future work, including expanding the dataset, refining the model architecture, and developing multi-crop and multi-region capabilities.

0 引 言

随着信息技术的飞速发展,农业领域正经历着一场革命性的变革1。农业信息化作为这一变革的核心,正在逐步将传统农业转型为精准、高效且可持续的现代农业2。传统农业依赖于经验积累和人工操作,往往受到气候条件、土壤质量,以及人力资源等多重因素的限制,难以实现高效、稳定的生产3, 4。然而,现代农业信息化技术的引入为解决这些难题提供了可能性5。通过整合先进的传感器、物联网、云计算、大数据分析,以及人工智能技术,农业信息化能够实现农业生产过程的实时监测、分析与决策支持,极大地提升了农作物管理的精确度和生产效率6, 7
数字农业是农业信息化的重要组成部分,它强调通过对数据的深度挖掘和分析,优化农业生产的各个环节8-10。在这一框架下,数字孪生技术脱颖而出。数字孪生技术作为一种新兴的信息化工具,能够通过构建物理实体的虚拟数字模型,实现对农业生产环境、农作物生长过程及相关管理措施的精确模拟。在无人农场领域,数字孪生技术的应用尤为关键。无人农场依赖于高度自动化和智能化的技术手段进行生产管理,而数字孪生技术则为无人农场提供了虚拟环境下的精准模拟和反馈控制能力。通过建立作物生长的虚拟模型,数字孪生平台能够实时接收来自传感器的数据,动态调整生产策略,并为农作物的健康生长提供更为科学的管理方案。
尽管数字孪生技术在无人农场中的应用展现了巨大的潜力,但在复杂农作物生长模拟方面仍然存在显著的挑战。传统的数学建模或基于经验规则的模拟方法,往往难以有效捕捉这些复杂因素之间的相互作用,进而导致作物生长模型的精度不足,模拟结果不具备足够的可靠性和实用性。为了克服这些局限性,近年来,人工智能技术,尤其是大语言模型(Large Language Models, LLMs)11,在多个领域的预测和推理任务中展现了强大的能力。LLMs通过大规模数据预训练,能够在自然语言处理、知识推理、复杂系统模拟等方面发挥出色的性能。然而,尽管LLMs具备强大的推理能力,其在蔬菜作物生长模拟中的应用仍面临诸多挑战12。如何将LLMs的推理能力有效应用于蔬菜作物的生长模拟,成为了当前研究的关键难题13。LLMs虽然可以通过预训练掌握一定的基础知识,但要实现对具体作物生长状态的准确预测,还需要进一步有针对性地调优和改进14, 15。此外,如何让LLMs具备处理多维度时空数据的能力16, 17,能够根据传感器数据、气象信息等外部输入动态调整预测结果,也是实现这一目标的核心挑战之一。
针对上述挑战,本研究提出了一种基于LLMs的数字孪生蔬菜作物生长模拟新方法,旨在有效解决传统方法在处理复杂生长动态时的局限性。首先通过收集和整理大量连续的蔬菜生长数据,对LLMs进行预训练和指令微调,赋予其关于蔬菜作物生长过程的基础知识和推理能力。这一数据集涵盖了多个生长周期内的关键因素,包括气候条件、土壤养分、灌溉施肥策略及病虫害控制措施等,从而为模型提供了足够的背景信息,使其能够在面对复杂的作物生长场景时,做出合理的推断和预测。此外,本研究提出了一种阶段式智能体集合架构,由一个管理型智能体和多个负责不同生长阶段的智能体组成。管理型智能体负责综合分析来自数字孪生平台的实时数据,并根据蔬菜的生长周期将任务动态分配给相应的阶段智能体。各阶段智能体则根据其负责的特定生长阶段,结合气候、土壤、灌溉、施肥等多维度数据,进行深度推理和预测,从而模拟蔬菜作物在特定时间点的生长状态。并以北京市小汤山现代农业科技示范园为对应场景进行试验和验证,结果表明,所提出的方法在长势预测与生长阶段识别等蔬菜生长建模指标上均表现优异。

1 模型研究

1.1 数字孪生蔬菜生长建模

蔬菜作物生长建模是现代农业生产中提升产量和质量的关键技术。这些模型通过模拟作物从播种到收获的整个生长过程,帮助研究人员和农户理解作物生长发育的规律,预测作物对环境变化的响应,并指导农业生产实践。传统的蔬菜作物生长模型主要基于机理方法,依赖作物生理学原理和生态学过程,如光合作用、呼吸作用、蒸腾作用、养分吸收和运输等。这些模型的核心在于通过对作物生长的生物学机制进行量化描述,利用大量实验数据进行参数化,以确保模型的准确性和适用性。然而,这类模型通常需要较为复杂的生物学知识,且随着作物品种和生长条件的变化,模型的移植性和通用性受到一定限制。
在使用数字孪生技术构建无人农场时蔬菜作物生长建模是必不可少的一环18。然而农业生产环境的复杂性和不确定性给数字孪生模型的构建和优化带来了困难19。作物生长受到气候、土壤、病虫害等多种因素的影响,这些因素的动态变化和相互作用难以完全通过模型精确模拟。此外,数据采集的局限性也是一个重要问题。数字孪生模型需要大量的实时数据来支持其运行,但在实际应用中,由于传感器分布不均、数据采集频率不高等原因,导致数据的完整性和实时性难以保证现有的数字孪生大模型对于单一作物或单一生长阶段的模拟,缺乏对整个生长周期的全面考虑。这限制了模型在实际生产中的应用价值20。同时,模型的泛化能力也有待提高。许多模型在特定条件下表现良好,但在不同的环境或作物品种中可能无法取得同样的效果。
随着信息技术的快速发展,数据驱动的蔬菜作物生长模型逐渐成为研究热点。这类模型依托机器学习和统计分析方法,从历史数据中挖掘出作物生长的规律21。相比于机理模型,数据驱动模型不需要深入了解复杂的生物学机理,而是通过海量数据的训练来实现对作物生长过程的预测。这一方法克服了部分机理模型的局限性,尤其在数据丰富的情况下,能够实现更为灵活的模型构建和高效的预测性能22。系统模型通过将蔬菜作物生长视为一个复杂的整体系统,进一步整合了土壤水分、养分循环、气候条件、病虫害管理等多个子系统。通过这些综合模型,可以模拟作物与环境之间的相互作用。例如,一些模型能够结合作物生长的内部机理与外部环境条件,构建多维度的环境响应模型,模拟不同时期作物对气候变化、灌溉管理等外界条件的反应。这类集成模型不仅提升了农业生产的精准性,还为作物生长过程中的关键决策提供了科学依据,为农业可持续发展提供了技术支持。

1.2 LLMs建模

LLMs在建模方面展现出了强大的能力,特别是在自然语言处理任务中。这些模型通过在大规模文本数据上的预训练,学习到了丰富的语言表示和知识推理能力23。例如,Google的BERT(Bidirectional Encoder Representations from Transformers)模型在文本分类、问答系统和文本摘要等任务上都取得了显著的性能24。此外,OpenAI的GPT(Generative Pre-trained Transformer)系列模型通过其强大的文本生成能力,在聊天机器人开发、文本内容生成等领域得到了广泛应用25。LLMs也被用于构建预测模型,如时间序列预测、异常检测等任务。例如,有综述系统地阐述了大型语言模型在预测和异常检测方面的应用,分析了目前的研究现状、挑战和未来发展方向26。这些模型能够解析和分析大量数据集以识别模式、预测未来事件以及检测各种领域的异常行为。
将LLMs应用于蔬菜作物生长建模时,场景任务的复杂性和不确定性难以被忽视。蔬菜作物生长是一个高度复杂的过程,受到遗传、环境、管理措施等多种因素的影响。这些因素的动态变化和相互作用难以通过传统的语言模型完全捕捉。此外,农业领域特定数据的获取和处理也存在一定的难度,数据的质量和完整性直接影响模型的准确性和可靠性。这要求LLMs收集和整合更多的农业领域特定数据,进行领域适应性的微调。可以探索将LLMs与传统的作物生长模型相结合,利用LLMs强大的特征提取和知识推理能力,辅助传统模型的参数化和决策过程。

2 主要方法

本节首先介绍了对LLMs的微调工作,包括数据集收集与处理、一阶段预训练,以及二阶段提示学习。随后详细说明了为数字孪生蔬菜生长模型建立的阶段式智能体集合,并给出了与数字孪生系统的交互方式。图1给出了所提出方法的结构。
图1 基于大语言模型的数字孪生蔬菜作物生长建模结构

Fig. 1 Modeling structure of digital twin vegetable crop growth based on large language models

2.1 数据集收集与处理

数据集的构建分为两个阶段以满足不同训练需求。在第1阶段的预训练中,收集了广泛的蔬菜生长通用数据,这些数据包括了不同品种蔬菜在多个生长周期内的生理指标、气候数据、土壤分析报告、灌溉和施肥记录,以及病虫害发生和处理的历史信息。这些数据为模型提供了一个全面的蔬菜生长知识背景,使其能够理解蔬菜生长的一般规律和环境因素的普遍影响。进入二阶段提示学习,数据集则更加专注于特定蔬菜作物的生长历史数据,这包括了特定作物的详细生长日志、历史产量数据,以及针对该作物的特定环境管理措施。通过这种分阶段的数据集构建,模型首先学习到蔬菜生长的通用知识,然后在第2阶段通过特定数据进一步细化和优化其推理能力,以适应具体的蔬菜作物的生长条件。
为了构建蔬菜作物的数字孪生模型,第1阶段的预训练着重于收集蔬菜生长的通用数据。数据来源主要包括农技平台的问答数据和维基百科上收集的相关信息。农技平台的问答数据提供了实际农业生产中遇到的问题和解决方案,这些数据有助于模型理解农作物生长过程中可能遇到的实际问题。例如:
问题:如何防治番茄晚疫病?
答案:番茄晚疫病的防治可以通过以下步骤进行。首先,选择抗病品种;其次,合理轮作,避免与茄科作物连作;再次,加强田间管理,及时排水,降低田间湿度;最后,适时施药,使用如霜脲氰、代森锰锌等药剂进行防治。
维基百科上收集的数据则提供了蔬菜作物生长的基础知识,包括不同作物的生长周期、适宜的生长条件等。例如:“西红柿(番茄)生长条件:西红柿喜欢温暖且光照充足的环境,适宜生长的温度为20~30 °C。它们需要肥沃、排水良好的土壤。种植技术:西红柿可以通过种子或苗床移植的方式种植。种植时应保持适当的间距,以确保通风和光照。病虫害防治:常见的病虫害包括晚疫病和叶霉病,防治方法包括使用抗病品种、合理轮作和适时施药。”
第2阶段提示学习所需的数据集主要来源于特定任务提供的历史种植数据。这些数据涵盖了特定蔬菜作物的生长状态监控信息,以及与之相关的作物管理操作记录,包括播种、灌溉、施肥、撒药、和收割。数据被整理为统一的格式,以便于模型的训练和测试。对于文本数据,每个样本包括1个问题描述和相应的答案;对于数值型数据,每个样本则包括一系列与蔬菜生长相关的特征,如温度、湿度、光照等。所有数据被组织成特征向量和标签的形式,以适应监督学习的需求。数据集的具体设置如表1所示。
表1 微调学习所用数据集类型及格式

Table 1 Data type and format of the collected dataset for finetune and learning

数据源 数据类型 实体/记录数量 格式
农业书籍 文本 500本书籍 JSON
研究论文 文本 2 000篇论文 JSON
互联网数据 文本 500个实体 JSON
农场记录 结构化数据 4 300条记录 CSV
特定农场环境测量 结构化数据 4 300条记录 CSV

2.2 模型训练

2.2.1 一阶段预训练

本研究使用“Qwen-VL-Chat-Int4”作为基模型,使用LoRA(Low-rank Adaptation)方法对其进行一阶段微调。LoRA方法通过在模型的权重矩阵中引入低秩结构来减少可训练参数的数量,从而在不显著增加计算成本的情况下,实现对预训练模型的有效微调。
LoRA的核心原理是在模型的权重矩阵中引入两个低秩矩阵 A B,以此来模拟全参数微调的效果。具体地,对于模型中原有的权重矩阵 W 0,首先初始化 A B B通过高斯分布初始化,而 A初始化为零矩阵,参数 W 0通过公式(1)更新为 W '
W ' = W 0 + α × B A
式中 : B R d × r A R r × d为LoRA低秩适应的权重矩阵,秩 r远小于 d α为缩放系数,用于控制LoRA矩阵的影响力度。此时,微调的参数量从原来 W d × d,变成了 B A 2 × r × d
在模型的反向传播过程中,计算损失函数 L关于 A B的梯度,并更新 A B。在此过程原始参数 W 0被冻结,不参与梯度计算,并使用梯度下降算法更新 A B,见公式(2)公式(3)
A n e w = A o l d - η × A L
B n e w = B o l d - η × B L
式中: η为学习率,为0到1的自然向量; A L B L分别是损失函数关于 A B的梯度。

2.2.2 二阶段预学习

在二阶段学习中,利用特定作物的历史生长数据,通过提示学习的方式,进一步提升LLMs对该作物的建模能力。此阶段的数据集包含了丰富的信息,如作物生长天数、施肥灌溉情况、土壤条件、气候等,以及可能影响作物生长的其他因素,包括病虫害发生情况、作物价格波动、种植者管理习惯等。
二阶段学习的数据集主要来源于特定作物的长期田间试验和农业生产记录。这些数据集包含了以下关键信息。
生长天数:作物从播种到收获的总天数。
施肥灌溉:包括施肥的种类、数量、时间和频率,以及灌溉的周期和水量。
土壤条件:土壤类型、pH值、水分、有机质含量和营养成分等。
气候条件:生长季节的平均温度、降水量、日照时数和极端气候事件记录。
病虫害:病虫害的发生时间、种类、严重程度和防治措施。
提示学习过程通过在模型输入中加入提示信息来引导模型生成特定输出。设计提示模板,这些模板包含了作物生长的关键特征,如“在第 t天,土壤水分为 S t,施肥量为 F t,气候条件为 C t,作物生长状态为?”
将设计好的提示模板与实时数据结合,形成模型的输入,模型基于输入的提示信息和历史数据生成作物的生长预测。该过程可写为公式(4)
P x t + 1 | x t , y t , h t ; θ = s o f t m a x [ W 0 × R e L U ( W h h t + W x x t + b ) ]
式中: P为预测作物生长状态的条件概率; x t为在时间 t的作物生长特征向量,如叶片数量和高度、花蕾和果实数量等; y t = < S t , F t , C t >是在时间 t的生长条件,包括土壤湿度、施肥量和气候条件; h t 模型在时间 t的隐藏状态; θ 模型参数,包括权重矩阵 W 0 W h W x和偏置 b。通过这种方式,模型能够根据历史数据和实时输入预测作物的生长状态,从而实现对特定作物生长过程的精细化建模。

2.3 LLMs智能体

作物生长是一个涵盖多个阶段的复杂过程,每个阶段都有其特定的生长特点和环境互动。通过构建多智能体系统,可以对每个阶段进行专门的建模和细致的管理,从而提高模型对作物生长过程的适应性和预测的准确性。在提高作物生长建模精准度的过程中,本研究提出了一种基于LLMs的多智能体构建方法。用 n表示任务既定的蔬菜作物生长阶段数量,该方法将作物生长过程分为 n个阶段,并为此设计了 n + 1个智能体。如图2所示,一个中心管理智能体负责监控和判断作物是否应该进入下一个生长阶段,而其余的 n个智能体则分别负责模拟各个阶段内作物的生长。
图2 阶段式大语言模型智能体结构

Fig. 2 Stage based large language model intelligent agent structure

管理型智能体作为系统的核心,负责协调各个阶段型智能体的工作,并根据实时数据和预设的逻辑判断作物是否满足进入下一生长阶段的条件。管理型智能体的决策过程可以表示为公式(5)
D t + 1 = f ( x t , y t )
式中: D t + 1表示是否进入下一阶段的决策; f表示决策函数,即为经过一阶段预训练的LLMs本身。
每个阶段型智能体专注于模拟特定生长阶段的作物生长过程,并提供详细的生长状态报告。阶段型智能体的建模过程可以表示为公式(6)
G t + 1 = g ( x t , y t )
式中 : G t + 1表示作物在t+1时间点的生长状态; g表示生长建模函数,即为经过一阶段预训练和二阶段的LLMs本身。
数字孪生平台通过集成传感器网络实时收集作物生长数据,包括生长天数、施肥灌溉情况、土壤条件、气候等关键信息。这些数据被输入到LLMs智能体中,智能体通过协同交互,对作物的下一天状态进行预测,并将预测结果反馈给数字孪生系统,用于指导实际的农业生产管理。在实际过程中,数字孪生平台通过传感器实时收集作物生长数据,LLMs智能体基于当前状态和历史数据,预测作物下一天的生长状态,预测结果被反馈到数字孪生系统,用于调整作物管理措施,从而实现对蔬菜作物生长状态的实时监控和预测,并将预测结果用于指导实际的农业生产管理。

3 实验结果与分析

3.1 场景介绍

本研究所提出的基于LLMs推理的数字孪生平台蔬菜作物生长模型在北京市小汤山现代农业示范园区场景进行验证,以甘蓝(中甘21号)生产为给定任务,收集了该示范园区5年(2018—2023年)的甘蓝管理记录共4 300条作为LLMs二阶段提示学习的数据集。甘蓝因其广泛的种植范围、丰富的营养价值在农业研究中拥有重要地位。它不仅在全球多个地区都有种植,而且其生长周期、病虫害抗性以及对环境适应性的研究为蔬菜种植提供了宝贵的科学数据。此外,甘蓝的多样化品种和广泛的市场需求也使其成为研究蔬菜生长特性和市场动态的理想选择。甘蓝作为验证对象,不仅能够反映蔬菜生长的普遍规律,还能为蔬菜种植的可持续发展提供重要的参考价值。数字孪生平台与对应的场景如图3所示。甘蓝的生长阶段分为播种期、幼苗期、莲座期、结球期和成熟期,因此所提出的方法包含一个管理型智能体,用以判断甘蓝处于哪个生长阶段,还包含5个阶段型智能体,在对应阶段内预测甘蓝的长势。
图3 甘蓝数字孪生系统及生长阶段

Fig. 3 Cabbage digital twin system and growth stages

数据集以天为单位记录了4 300条甘蓝生长信息,涵盖了生长周期内的气候、土壤、灌溉、施肥和病虫害等关键因素。为了全面评估模型性能,采用十折交叉验证方法。阶段型智能体的甘蓝生长程度预测能力则通过生长高度和叶片数量这两个量化指标进行衡量。生长高度直接反映了甘蓝植株的生长情况,叶片数量则能够体现植株的发育状态。

3.2 生长阶段识别验证

对管理型智能体的生长阶段识别功能进行验证,包括4种类型,分别为播种期到幼苗期的验证、幼苗期到莲座期的验证、莲座期到结球期的验证,以及结球期到成熟期的验证。在生长阶段识别功能的验证中,采用了几种先进的机器学习方法作为实验的基线模型,以评估管理型智能体的性能。这些方法包括:
1)基于LSTM(Long Short-Term Memory)的模型。使用长短期记忆网络的深度学习模型,已被证明在时间序列预测方面非常有效27
2)基于XGBoost(eXtreme Gradient Boosting)的模型。该模型是一种基于梯度提升决策树的集成学习算法,它在许多结构化数据集上都显示出了优异的性能28
3)基于LightGBM(Light Gradient Boosting Machine)的模型。LightGBM是一个基于梯度提升框架的高效机器学习算法,它设计用于分布式和高效的训练,并且在速度和性能上通常优于传统的梯度提升方法29
实验结果如图4所示,本研究提出的方法(LLM-based)在4种类型的验证上均优于基于LSTM的模型(LSTM-based)、基于XGBoost的模型(XGBoost-based),以及基于LightGBM的模型(LightGBM-based)。在4种类型的验证上的平均准确率为99.7%,而标准差不超过0.2%。相比通过训练得到的基线方法,并没有达到和LLMs相同的准确率,这说明经过一阶段预训练之后的LLMs能够使用自身强大的推理能力完成对蔬菜作物生长建模中的生长阶段预测识别。
图4 管理型智能体和基线方法的生长阶段识别实验结果

Fig. 4 Experimental results of growth stage identification of management agent and baseline methods

3.3 生长程度预测验证

生长程度预测验证将评估阶段型智能体对于甘蓝长势的建模能力,包括叶片数量和高度。在该部分验证实验中的基线方法与之前相同,但评估方法则对叶片数量和高度预测分别进行评估。同样使用北京市小汤山现代农业示范园区内甘蓝作物的生长数据作为数据集,采用十折交叉验证的方式,不考虑播种期,实验结果如图5所示。
图5 阶段型智能体生长程度预测实验结果

Fig. 5 Experimental results for growth degree prediction of stage agents

图5统计了不同方法在叶片数量和生长高度上的准确率,由模型输出和实际值之差的绝对值除以实际值得到。可以看到,所提出的方法在叶片数量的建模预测上有明显优势,在作物生长高度上优势不明显。总体来说,对于生长程度的预测,所提出方法的准确率在4个生长阶段平均有98%,对于叶片数量的预测准确率在4个阶段表现一致,对于生长高度的预测则随着甘蓝生长阶段准确率变高。相比起来,基线方法在甘蓝叶片数量和生长高度上正好相反,对于生长高度的预测更加精准,但总体上仍弱于所提出的方法,这说明了LLMs在单阶段的推理能力可观,在给予提示学习之后,LLMs对于生长程度的预测能力能超过传统预测模型,这进一步说明了LLMs对于数字孪生蔬菜作物生长建模的潜力。

3.4 多维度实验分析

阶段型智能体在幼苗期和莲座期的预测准确率略高于其他方法。这可能是由于这两个阶段的生长特征更为明显,且受环境因素影响较小。相比之下,结球期和成熟期的预测准确率略低,这可能与这两个阶段的生长变化较为复杂,且受多种因素综合作用有关。进一步地,本研究探讨了不同环境因素对模型预测准确性的影响。通过Dropout掉不同维度的生长特征,并对比Dropout前后预测结果的交叉熵来判断不同生长环境因素对预测准确率的作用程度。在每次迭代中针对特定的生长特征(如气候条件、土壤特性等)进行神经元的随机丢弃,以模拟这些特征缺失时对模型预测结果的影响。具体操作在模型训练过程中,对于每个生长特征,独立地以一定的概率(0.3)随机丢弃与其相关的神经元。通过比较Dropout前后模型的交叉熵变化,本研究可以评估该特征对输出的重要性。结果如表2所示,通过对比分析气候条件、土壤特性和灌溉施肥策略对模型预测准确率的影响,本研究发现气候条件对模型预测的影响最为显著,尤其是在极端气候条件下。土壤特性和灌溉施肥策略的影响相对较小,但仍不容忽视。这些发现为农业生产管理提供了重要的参考,提示在模型应用过程中需要特别关注气候条件的变化。
表2 不同因素对作物生长状态预测结果的影响

Table 2 Impact of different factors on prediction results for crop growth state

因素 Dropout前平均交叉熵 Dropout后平均交叉熵 交叉熵变化
生长天数 0.51 0.64 +0.13
施肥灌溉 0.51 0.55 +0.04
土壤条件 0.51 0.60 +0.09
非极端气候 0.51 0.63 +0.12
极端气候 0.51 0.74 +0.23
病虫害 0.51 0.61 +0.10

注:+表示熵值增加。

4 结 论

本研究通过引入LLMs技术,构建了一种基于数字孪生平台的蔬菜作物生长建模方法,实现了对蔬菜作物生长过程的高效模拟。在北京市小汤山现代农业示范园区内甘蓝作物数字孪生系统的实验结果表明,该方法在生长阶段识别和生长程度预测上均达到了高水平的准确率,显著优于传统机器学习方法。管理型智能体和阶段型智能体的协同工作,确保了模型能够动态适应作物生长的各个阶段并提供精准的作物生长状态预测。此外,高质量的数据集为模型提供了坚实的基础,证明了数据在提高建模准确性中的重要性。这一成果为无人农场的实时监管和作物管理提供了新的技术手段,有助于提升农业生产的智能化水平和作物产量。未来的工作将集中在模型结构的优化、数据集的扩展、实时数据集成、多任务学习和用户交互界面的开发上,以进一步增强模型的性能和应用范围。

利益冲突声明

本研究不存在研究者以及与公开研究成果有关的利益冲突。

1
ALSTON J M, PARDEY P G. Chapter 75 The economics of agricultural innovation[J]. Handbook of agricultural economics, 2021, 5: 3895-3980.

2
NORTON G W, ALWANG J. Changes in agricultural extension and implications for farmer adoption of new practices[J]. Applied economic perspectives and policy, 2020, 42(1): 8-20.

3
LOWDER S K, SKOET J, RANEY T. The number, size, and distribution of farms, smallholder farms, and family farms worldwide[J]. World development, 2016, 87: 16-29.

4
RICCIARDI V, RAMANKUTTY N, MEHRABI Z, et al. How much of the world's food do smallholders produce?[J]. Global food security, 2018, 17: 64-72.

5
RUTATORA D F, MATTEE A. Major agricultural extension providers in Tanzania[J]. African study monographs, 2001, 22(4): 155-173.

6
KLERKX L, JAKKU E, LABARTHE P. A review of social science on digital agriculture, smart farming and agriculture 4.0: New contributions and a future research agenda[J]. NJAS: Wageningen journal of life sciences, 2019, 90/91(1): 1-16.

7
BASSO B, ANTLE J. Digital agriculture to design sustainable agricultural systems[J]. Nature sustainability, 2020, 3: 254-256.

8
BELLON-MAUREL V, LUTTON E, BISQUERT P, et al. Digital revolution for the agroecological transition of food systems: A responsible research and innovation perspective[J]. Agricultural systems, 2022, 203: ID 103524.

9
EASTWOOD C, AYRE M, NETTLE R, et al. Making sense in the cloud: Farm advisory services in a smart farming future[J]. NJAS: Wageningen journal of life sciences, 2019, 90: ID 100298.

10
FOUNTAS S, ESPEJO-GARCIA B, KASIMATI A, et al. The future of digital agriculture: Technologies and opportunities[J]. IT professional, 2020, 22(1): 24-28.

11
KUSKA M T, WAHABZADA M, PAULUS S. AI for crop production: Where can large language models (LLMs) provide substantial value?[J]. Computers and electronics in agriculture, 2024, 221: ID 108924.

12
RADOVICH T. Biology and classification of vegetables[M]// Siddiq M, Uebersax M A. Handbook of vegetables and vegetable processing. Hoboken, New Jersey: John Wiley & Sons Ltd. 2018.

13
FANG H, CHU B Q, HE Y, et al. Agricultural information processing technology[M]// Agriculture Automation and Control. Cham: Springer International Publishing, 2021: 219-250.

14
BENDER E M, GEBRU T, MCMILLAN-MAJOR A, et al. On the dangers of stochastic parrots: Can language models be too big?[C]// Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency. New York, USA: ACM, 2021: 610-623.

15
WISEMAN L, SANDERSON J, ZHANG A R, et al. Farmers and their data: An examination of farmers' reluctance to share their data through the lens of the laws impacting smart farming[J]. NJAS: Wageningen journal of life sciences, 2019, 90: ID 100301.

16
ZHAI Z Q, ZHU Z X, DU Y F, et al. Multi-crop-row detection algorithm based on binocular vision[J]. Biosystems engineering, 2016, 150: 89-103.

17
KUNDU R, CHAUHAN U, CHAUHAN S P S. Plant leaf disease detection using image processing[C]// 2022 2nd International Conference on Innovative Practices in Technology and Management (ICIPTM). Piscataway, New Jersey, USA: IEEE, 2022: 393-396.

18
ATTARAN M, CELIK B G. Digital twin: Benefits, use cases, challenges, and opportunities[J]. Decision analytics journal, 2023, 6: ID 100165.

19
EASTWOOD C, KLERKX L, AYRE M, et al. Managing socio-ethical challenges in the development of smart farming: From a fragmented to a comprehensive approach for responsible research and innovation[J]. Journal of agricultural and environmental ethics, 2019, 32(5): 741-768.

20
PURCELL W, NEUBAUER T. Digital twins in agriculture: A state-of-the-art review[J]. Smart agricultural technology, 2023, 3: ID 100094.

21
CHANG Y B, LATHAM J, LICHT M, et al. A data-driven crop model for maize yield prediction[J]. Communications biology, 2023, 6(1): ID 439.

22
ASSOUS H F, AL-NAJJAR H, AL-ROUSAN N, et al. Developing a sustainable machine learning model to predict crop yield in the gulf countries[J]. Sustainability, 2023, 15(12): ID 9392.

23
CHANG Y P, WANG X, WANG J D, et al. A survey on evaluation of large language models[J]. ACM transactions on intelligent systems and technology, 2024, 15(3): 1-45.

24
DEVLIN J, CHANG M W, LEE K, et al. BERT: Pre-training of deep bidirectional transformers for language understanding[C]// Proceedings of NAACL-HLT 2019. Minneapolis, Minnesota, USA: ACL, 2019: 4171-4186.

25
WU T Y, HE S Z, LIU J P, et al. A brief overview of ChatGPT: The history, status quo and potential future development[J]. CAA journal of automatica sinica, 2023, 10(5): 1122-1136.

26
WU J, LAI Z X, CHEN S Y, et al. The new agronomists: Language models are experts in crop management[C]// 2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW). Piscataway, New Jersey, USA: IEEE, 2024: 5346-5356.

27
VAN HOUDT G, MOSQUERA C, NÁPOLES G. A review on the long short-term memory model[J]. Artificial intelligence review, 2020, 53(8): 5929-5955.

28
SAGI O, ROKACH L. Approximating XGBoost with an interpretable decision tree[J]. Information sciences, 2021, 572: 522-542.

29
KE G, MENG Q, FINLEY T, et al. LightGBM: A highly efficient gradient boosting decision tree[C]// Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach, USA: ACM, 2017: 3149-3157.

文章导航

/