基于轻量化改进YOLOv11n-Seg的胡麻倒伏区域识别方法

苏玉杰; 李玥; 魏霖静; 吴兵; 郭林海; 剡斌; 周慧; 高玉红; 康亮河; 刘欢; 苏舜昌

doi:10.12133/j.smartag.SA202508013

智慧农业 >

2026 , Vol. 8 >Issue 2: 35 - 47

DOI: https://doi.org/10.12133/j.smartag.SA202508013

专题--多源遥感驱动数字农业创新与实践

基于轻量化改进YOLOv11n-Seg的胡麻倒伏区域识别方法

苏玉杰 ¹ ,
李玥 ^,¹^,² ,
魏霖静 ¹ ,
吴兵 ²^,³ ,
郭林海 ¹ ,
剡斌 ²^,⁴ ,
周慧 ¹ ,
高玉红 ²^,⁴ ,
康亮河 ¹ ,
刘欢 ¹ ,
苏舜昌 ¹

展开

^1. 甘肃农业大学信息科学技术学院，甘肃兰州 730070，中国
^2. 干旱生境作物学国家重点实验室，甘肃兰州 730070，中国
^3. 甘肃农业大学生命科学技术学院，甘肃兰州 730070，中国
^4. 甘肃农业大学农学院，甘肃兰州 730070，中国

李玥，博士，教授，研究方向为智慧农业、人工智能、大数据分析挖掘等。E-mail：liyue@gsau.edu.cn

苏玉杰，硕士研究生，研究方向为智慧农业和深度学习。E-mail：1554041920@qq.com

收稿日期: 2025-08-14

网络出版日期: 2025-11-14

基金资助

国家自然科学基金项目(32460443,32060437)

甘肃省科技计划-自然科学基金重点项目(23JRRA1403)

科技部国家外专项目(G2022042005L)

甘肃省高等学校产业支撑项目(2023CYZC-54)

甘肃省重点研发计划(23YFWA0013)

甘肃省高端外专引进计划(25RCKA015)

国家特色油料产业技术体系(CARS-14-1-16)

收起

Lodging Region Detection Method in Flax Based on Lightweight Improved YOLOv11n-seg Model

SU Yujie ¹ ,
LI Yue ^,¹^,² ,
WEI Linjing ¹ ,
WU Bing ²^,³ ,
GUO Linhai ¹ ,
YAN Bin ²^,⁴ ,
ZHOU Hui ¹ ,
GAO Yuhong ²^,⁴ ,
KANG Lianghe ¹ ,
LIU Huan ¹ ,
SU Shunchang ¹

Expand

^1. College of Information Science and Technology, Gansu Agricultural University, Lanzhou 730070, China
^2. State Key Laboratory of Crop Biology in Dryland, Lanzhou 730070, China
^3. College of Life Science and Technology, Gansu Agricultural University, Lanzhou 730070, China
^4. College of Agronomy, Gansu Agricultural University, Lanzhou 730070, China

LI Yue, E-mail: liyue@gsau.edu.cn

SU Yujie, E-mail:1554041920@qq.com

Received date: 2025-08-14

Online published: 2025-11-14

Supported by

National Natural Science Foundation of China Projects(32460443,32060437)

Key Project of Gansu Provincial Science and Technology Plan-Natural Science Foundation(23JRRA1403)

National Foreign Experts Project of the Ministry of Science and Technology(G2022042005L)

Industry Support Project of Higher Education Institutions in Gansu Province(2023CYZC-54)

Key R&D Program of Gansu Province(23YFWA0013)

High-Level Foreign Experts Recruitment Program of Gansu Province(25RCKA015)

National Technology System for Specialty Oil Crops(CARS-14-1-16)

Copyright

Fold

摘要

【目的/意义】 倒伏是制约作物产量与品质的关键因素之一，本研究针对胡麻田间图像中倒伏区域形态复杂、边界模糊、背景干扰大导致不易识别的问题，提出一种高精度、轻量化的倒伏区域识别方法，以支持智能化田间监测和自动化农业设备的实际部署。 【方法】 提出一种基于改进YOLOv11n-seg模型的胡麻倒伏区域识别方法，该方法从模型轻量化与精度提升出发，首先在骨干网络中引入融合多尺度高效通道注意力机制的集成空间深度可分离模块（C3k2 Spatial‑Depthwise, C3k2_SDW），以增强模型对倒伏区域特征的敏感性；其次在颈部结构中引入双向特征金字塔网络结构，并结合多阶段语义融合策略，实现不同尺度与语义层次特征的充分交互，从而提升对细粒度倒伏区域的识别能力；最后在输出阶段对预测边界进行精细化处理，提高倒伏区域分割结果的边界精度。 【结果和讨论】 改进后的YOLOv11n-seg模型在精确度和平均精度均值上分别达到92.6%和95.2%，较原始YOLOv11n-seg模型分别提升3.7个百分点和2.1个百分点。模型参数量仅为1.73 M，计算量为8.0 GFLOPs，模型体积仅为3.8 MB，显示出较好的轻量化优势。 【结论】 基于改进YOLOv11n-seg模型的胡麻倒伏区域识别方法兼顾精度与轻量化，为智能化胡麻倒伏监测与实际田间设备部署提供了技术基础。

关键词： 胡麻; 图像分割; 轻量化模型; 倒伏识别; YOLOv11n-seg; 注意力机制

本文引用格式

苏玉杰 , 李玥 , 魏霖静 , 吴兵 , 郭林海 , 剡斌 , 周慧 , 高玉红 , 康亮河 , 刘欢 , 苏舜昌 . 基于轻量化改进YOLOv11n-Seg的胡麻倒伏区域识别方法[J]. 智慧农业, 2026 , 8(2) : 35 -47 . DOI: 10.12133/j.smartag.SA202508013

Abstract

[Objective] Lodging is a major agronomic constraint that adversely affects both yield and quality in field crops, with flax (Linum usitatissimum L.) being especially vulnerable due to its slender stems and susceptibility to wind and rainfall. Precise delineation of lodged areas from field imagery remains a significant challenge owing to the complex and heterogeneous morphology of lodging patterns, irregular and blurred boundaries, and substantial background interference from upright plants, weeds, and soil textures. These factors necessitate the development of a segmentation framework that combines high precision and strong boundary adherence with computational efficiency, enabling deployment on resource-constrained agricultural monitoring platforms. In response to this need, a lightweight accurate lodging segmentation approach based on improved YOLOv11n-seg architecture was proposed to enhance fine-grained feature sensitivity, multi-scale representation capability, and boundary precision, while markedly reducing parameter count, giga floating-point operations (GFLOPs), and model size. [Methods] The proposed architecture integrated targeted modifications across the backbone, neck, and output stages. In the backbone, standard C3k2 modules were replaced with C3k2_SDW blocks, which combined a StarBlock structure with depthwise separable convolutions to reduce redundancy and computation without sacrificing spatial and contextual representational capacity. To counteract potential reductions in channel discrimination resulting from light-weighting, a multi-scale efficient channel attention (MS-ECA) mechanism was embedded within selected backbone layers, yielding C3k2_SDW_MS-ECA modules. These modules incorporated parallel convolution branches with varying kernel sizes to capture channel-wise dependencies across multiple receptive fields, thereby adaptively recalibrating lodging-related features with minimal computational overhead. In the neck, a bidirectional feature pyramid network (BiFPN) was introduced to facilitate efficient bidirectional information exchange between scales. By assigning normalized, trainable fusion weights, the BiFPN adaptively balanced contributions from low- and high-level feature maps, while a multi-stage semantic fusion strategy further enriched the integration of spatial details and contextual semantics, thereby improving the detection of small and fragmented lodged patches. At the output stage, a boundary refinement procedure was applied to the predicted masks, improving contour sharpness, enhancing boundary compactness, and mitigating false detections in complex visual environments.The experimental dataset comprised unmanned aerial vehicle (UAV) RGB imagery at a resolution of 4 032×2 268 pixels, acquired from flax fields in Dingxi, Gansu province. Lodged regions were manually annotated with polygonal masks. To increase robustness against variability in illumination, background complexity, and lodging morphology, data augmentation techniques, including random rotation, brightness and contrast adjustment, and blurring were employed, expanding the dataset to 3 852 images. The dataset was divided into training, validation, and testing subsets in a 75%, 15% and 10% split. Model training was conducted with 640×640 pixel inputs for 300 epochs using stochastic gradient descent (initial learning rate 0.01, momentum 0.937, weight decay 0.000 5) in PyTorch 2.0.0. Evaluation involved comparison with YOLACT, YOLOv7-seg, YOLOv8n-seg, and the original YOLOv11n-seg using precision (P), recall (R), mAP@0.5, mAP@0.5:0.95, parameter count, GFLOPs, and model size. [Results and Discussions] Ablation experiments demonstrated the incremental contributions of each architectural component. Substituting C3k2 with C3k2_SDW reduced parameters from 2.83 M to 2.14 M and computation from 10.2 to 8.1 GFLOPs, with slight performance improvements. Incorporating BiFPN further lowered complexity to 1.68 M parameters and 7.7 GFLOPs, accompanied by notable gains in detection metrics. The addition of MS-ECA attention achieved the highest performance, delivering P of 92.6%, R of 92.0%, and mAP@0.5 of 95.2%, corresponding to improvements of 3.7 percentage points in Precision and 2.1 percentage points in mAP@0.5 over the YOLOv11n-seg baseline, without increasing model size. Qualitative Grad-CAM visualizations revealed more precise focus on lodging regions and reduced false activations in upright stems and non-lodged soil areas. Generalization capability was further validated on the public WE3DS agricultural segmentation dataset, where the proposed model achieved average improvements of 4.3, 1.9, and 2.6 percentage points in precision, recall, and mAP@0.5, respectively, compared to the baseline. [Conclusions] The improved YOLOv11n-seg architecture achieves a superior balance between accuracy and efficiency for flax lodging segmentation by combining the C3k2_SDW_MS-ECA backbone, BiFPN with multi-stage semantic fusion in the neck, and output boundary refinement. This combination of high accuracy, lightweight design, and robust boundary delineation renders the model highly applicable to real-time, in-field deployment for intelligent lodging monitoring and precision agriculture. The results further suggest that the approach is transferable to broader agricultural segmentation tasks, providing a practical and scalable solution for modern smart farming applications.

Key words： flax; image segmentation; lightweight model; lodging detection; YOLOv11n-seg; attention mechanism

0 引言

胡麻（油用胡麻，Linum usitatissimum L.）是重要的油料作物之一，承担着粮油互补和生态涵养双重作用，在中国农业生产中占有重要地位^{［1, 2］}。甘肃省是中国主要胡麻产区之一，由于干旱频发^{［3, 4］}，胡麻容易发生倒伏。胡麻倒伏一般发生在盛花期^［5］，该阶段属于倒伏的高敏感期，此时植株正处于开花生长阶段，株高已达峰值，茎秆机械强度相对薄弱，且阴雨大风等不利气象较多，极易诱发大面积倒伏^［6］。相较之下，青果期与成熟期倒伏发生率较少，属于中低敏感期。倒伏不仅影响胡麻的后期收割，降低生产效率，还会使得胡麻贪青晚熟^［7］，造成大面积减产及品质下降。准确识别胡麻倒伏区域，对于实现灾害监测、农业保险定损、辅助品种选育及产量评估等具有重要意义。

目前，胡麻倒伏检测仍主要依赖人工巡田、经验评估或局部拍照记录等传统随机方式，不仅费时费力、效率低下^［8］，而且无法满足大规模作物倒伏灾害评估的实际需要，并且在人工评定的过程中，还有可能对作物造成二次伤害。

近年来，基于图像的作物信息自动识别技术取得显著成效，深度学习在农业图像识别领域也被广泛应用，采用图像分割方法处理胡麻倒伏区域，能够在技术实现上获得明显优势^{［9, 10］}。ZHANG等^［11］研究证实DeepLabv3+模型在小麦倒伏检测中表现F ₁-Score达到90.22%，并创新性地提出多分支二分类框架。该框架将问题转化为“倒伏/非倒伏”二分类任务，相较于传统的单分支多分类方法，识别精度提升7.22%，仅依靠RGB图像便能实现与多光谱数据接近的准确度。SONG等^［12］融合了无人机的多光谱图像与高分辨率可见光图像，借助SegNet深度语义分割模型实现对向日葵的倒伏情况进行识别。在倒伏区域识别方面，张淦等^［13］利用Swin-Transformer框架结合迁移学习策略，解决了无人机图像数量不足的问题，在麦田倒伏区域识别中实现了平均IoU 85.37%和F ₁-Score 91.84%的高精度，尤其是在高空80 m图像中表现优异，为有限数据场景提供了有效方案。龙佳宁等^［14］改进EfficientNetV2模型，引入坐标注意力机制（Coordinate Attention, CA）和CB-Focal Loss损失函数解决类别不平衡问题，改进后模型平均准确率达93.58%，显著优于机器学习模型及未改进的ResNet101、EfficientNetV2等深度学习模型。杨蜀秦等^［15］通过引入多头注意力机制改进DeepLabV3+模型，结合无人机遥感图像实现对小麦生长过程不同阶段倒伏情况的识别。这些成果验证了深度学习在作物倒伏识别中的普适性优势，通过端到端的特征学习实现客观、高效的灾情量化，为农情决策提供数据支撑。但上述研究中，深度学习模型往往参数量大、计算复杂度高，难以在资源有限的农业现场设备上实现快速部署和实时监测。

YOLO（You Only Look Once）系列算法在目标检测任务中应用广泛，后续版本在图像分割方面同样展现出良好的性能^{［16, 17］}。YUE等^［18］针对作物边界分割开展研究，改进YOLOv8n-seg算法使其分割平均精度（Segment mean Average Precision,Segment mAP@0.5）达到92.2%，相较于Mask RCNN提高了0.7个百分点。WU等^［19］基于YOLOv8n-seg进行了优化，将模型大小降低了约39%，参数量减少约40%，并将计算量GFLOPs减少51%，显著提升了模型的轻量化程度和实时性能。张姝瑾等^［20］提出的改进方案在保持模型参数量基本不变的前提下，使mAP提高了3.1个百分点，最终达到93.15%。然而，现有倒伏研究常以小麦、水稻、油菜等作物为主，胡麻倒伏区域相关研究却较少。

综上所述，现有作物倒伏自动识别方法大致可分为两类：一类为基于像素级语义分割模型，如U-Net、DeepLabV3+、SegFormer等，强化边界精确化，适合高精度需求；另一类为基于实时检测与轻量化分割，如YOLO系列、YOLACT（You Only Look at Coefficients）等，突出推理速度和模型紧凑性，更契合无人机巡检与边缘计算需求。前者精度较高，但对于算力和存储的需求较高，后者推理迅速但在小目标和复杂背景下的识别存在不足。近年来，多尺度特征融合、轻量化卷积以及高效注意力机制等逐渐成为目标识别的新研究方向。

针对上述研究中存在的问题，本研究提出基于YOLOv11n-seg模型的改进方法，使其兼顾计算速度和精确度，实现胡麻倒伏区域自动分割识别。该方法基于YOLOv11-seg框架，对特征提取主干进行优化，集成空间深度可分离模块（C3k2 Spatial‑Depthwise, C3k2_SDW）以增强浅层与深层特征的交互，融合多尺度高效通道注意力机制（Multi-Scale Efficient Channel Attention, MS-ECA）提高对关键区域的响应能力，并引入双向特征金字塔网络（Bidirectional Feature Pyramid Network, BiFPN）结构实现高效的多尺度特征融合，针对不同复杂度的场景数据集进行验证，从而在保证轻量化的同时细化倒伏区域的分割效果。

1 材料与数据处理

1.1　试验区概况

为了验证提出的方法在胡麻倒伏区域识别中的有效性，于2024年7月10日在甘肃省定西市农业科学研究院油料作物研究站开展了实地数据采集，地理位置如图1所示。试验区位于中温带偏旱区，平均海拔约2 050 m。根据2024年7月上旬的气象观测数据，该时期气温起伏较大，平均最高气温为26 ℃，平均最低气温为15 ℃，整体平均气温约为22.3 ℃，风力多为2~3级，最大风力达到4级。7月上旬天气以阴天、小雨和多云为主，降水较为频繁，对胡麻的生长状况及倒伏发生有较大影响。

显示原图|下载原图ZIP|生成PPT

图1 甘肃省定西市农业科学研究院油料作物研究站

注：该图基于自然资源部标准地图服务网站下载的审图号为GS（2019）3333号标准地图制作，底图无修改。

Fig. 1 Oil crops research station of Dingxi city academy of agricultural sciences， Gansu province

1.2　图像获取及预处理

数据获取使用大疆mini 4 Pro无人机，拍摄分辨率像素为4 032×2 268，水平与垂直分辨率均为96 dpi。利用无人机监视器对无人机进行飞行参数配置，包括无人机的航线设计、飞行姿态监控、图像质量获取，以及续航状态检测等操作，飞行高度约20 m，以保证影像空间分辨率足以分辨胡麻倒伏形态。镜头角度采用垂直俯拍，俯角为90°。航向重叠率与旁向重叠率分别约为75%和70%，以减少遗漏保证图像覆盖完整性。

在数据预处理阶段，首先剔除了存在明显模糊、大面积遮挡问题的胡麻图像，最终筛选得到107张用于分析倒伏区域的图像，利用Labelme软件对胡麻倒伏区域图像进行精确标注，类别设置为“倒伏”与“非倒伏”。对于试验区胡麻倒伏情况不均衡导致的数据分布不平衡问题，通过数据增强来提升模型在不同自然环境下的泛化能力和鲁棒性，防止过拟合现象的发生。通过对已有样本进行裁剪、随机旋转角度、亮度与对比度随机调整、模糊化处理等操作进行数据集扩充，样本数据扩充后得到3 852张图片，不同增强方式处理后的图像示例如图2所示。

显示原图|下载原图ZIP|生成PPT

图2 胡麻倒伏数据增强示例

Fig. 2 Flax lodging data augmentation examples

数据集随机抽取样本，按比例划分为75%训练集、15%验证集及10%测试集。这种“先增强，后随机划分”的策略在小样本场景中较为常见，可以有效增加训练和测试样本的多样性，从而提升模型对不同视角和光照条件的适应性。但该策略可能会导致训练集与测试集包含来自同一原始图像的不同增强版本，在一定程度上弱化了测试集的独立性。未来研究将采用更加严格的原始图像级划分策略，仅在训练集实施增强，以确保训练与测试样本的完全独立性。数据集信息如表1所示。

表1 胡麻倒伏数据集信息 (张)

Table 1 Information of the flax lodging dataset

初始数据集	增强数据集
初始数据集	训练集	验证集	测试集	总计
107	2 889	577	386	3 852

2 研究方法

鉴于其实际使用中便携式低算力设备计算量和内存受限，本研究提出了一种基于YOLOv11n-seg框架改进的倒伏区域识别模型：通过集成C3K2_SDW结构、MS-ECA机制以及BiFPN多尺度特征融合模块，实现在胡麻区域的分割精度基本不变的情况下，显著降低模型的计算复杂度，模型整体架构如图3所示。

显示原图|下载原图ZIP|生成PPT

图3 改进YOLOv11n-seg网络结构图

Fig. 3 Network structure of improved YOLOv11n-seg

模型具体改进体现在：首先，在Backbone中引入C3k2_SDW模块，以强化浅层与深层特征之间的信息交互能力，并降低计算成本；其次，在主干网络的C3k2_SDW模块嵌入MS-ECA机制，提升模型对胡麻倒伏区域等关键语义特征的响应能力；最后，在Neck部分采用BiFPN结构，实现多尺度特征的高效融合与传递，从而增强模型对复杂形态倒伏区域的表达能力。

2.1　基准模型YOLOv11n-seg

本研究选用YOLOv11n-seg作为基本模型，该模型延续了YOLO系列^［21］的基础结构，由骨干网络（Backbone）、颈部网络（Neck）和头部网络（Head）3部分组成。在骨干网络中，网络采用卷积模块（ConvModule）与C3k2模块交替堆叠的方式进行多级特征提取，有效增强特征表达能力。在骨干网络中集成了快速空间金字塔快速池化（Spatial Pyramid Pooling Fast, SPPF）模块，可以有效地利用几个最大池化层从输入图像中提取多尺度特征。颈部网络融合多尺度特征金字塔网络（Feature Pyramid Network, FPN）与路径聚合网络（Path Aggregation Network, PAN）结构，通过双向特征金字塔实现多尺度融合，并引入跨层连接优化小目标检测。头部网络承担了生成最终结果的中心功能。

YOLOv11n-seg在保持YOLO系列高效目标检测与分割能力的同时，还具备轻量化和实时推理更快的优势，尤其适合无人机巡检和边缘计算等资源受限场景。与YOLOv5和YOLOv7等早期版本相比，YOLOv11n-seg在分割任务中展现出更优的基线性能，并对其轻量化结构进行了改进；与YOLOv8n-seg相比，其在保证精度的同时进一步降低了参数量和计算开销，使得在嵌入式部署环境中具有更强的实用性。考虑到胡麻倒伏识别任务需要兼顾轻量化和分割精度，本研究选择YOLOv11n-seg作为基准模型。

2.1.1　C3k2_SDW主干网络

为提升模型的轻量化性能，本研究基于原有C3K2模块提出改进结构C3k2_SDW，主要包括两个方面：一是将模块内部的Bottleneck层替换成更高效的StarBlock轻量化模块；二是将常规卷积操作替换成深度可分离卷积（Depthwise Separable Convolution），构建改进的C3k2_SDW模块。以显著降低模型参数量与计算量，同时能够保持良好的特征提取能力。

StarBlock通过提出星操作（Star Operation），利用元素级乘法实现不同子空间特征的高效融合，能够在低维空间内进行快速计算，并有效映射到高维特征空间。这种机制一方面不仅解决了传统轻量网络在精度与计算开销之间的权衡困境；另一方面增强了模型对复杂背景与细粒度特征的表征能力。综上所述，基于StarBlock与深度可分离卷积构建的C3k2_SDW模块具有以下优势：首先，在显著降低计算负担的同时，实现对高维特征的高效建模，提升模型在复杂场景下的表现力；其次，网络结构简洁，无需依赖多分支路径或复杂融合策略，即可获得优异的特征表达效果；并且整体架构更适合在资源受限环境中快速部署，为实际应用中的高效倒伏区域检测提供了新的技术路径。C3k2_SDW模块结构如图4所示。该模块作为基础构件，在后续与MS-ECA融合形成C3k2_SDW_MS-ECA复合模块在本研究中使用。

显示原图|下载原图ZIP|生成PPT

图4 C3k2_SDW模块结构

Fig. 4 Module structure of C3k2_SDW

2.1.2　BiFPN颈部结构

为进一步增强模型对多尺度胡麻倒伏区域的检测和分割能力，在Neck部分引入了BiFPN结构。BiFPN^［22］是一种针对传统FPN优化的高效多尺度特征融合方法，能够在保持较低计算复杂度的同时，显著提升特征表达能力。

BiFPN通过自顶向下和自底向上路径之间建立双向连接，实现跨尺度特征的高效传递与融合。该机制使不同尺度的特征信息能够充分交互，更加高效地融合低层细节和高层语义特征，从而提高检测与分割精度。BiFPN采用了简化的网络结构设计，通过删除仅有单一输入边的节点、在相同层级的输入与输出节点之间增加连接边，并将每个双向路径视为一个可重复堆叠的特征融合单元，从而减少了模型参数量并优化了计算开销。此外，BiFPN采用可训练的加权特征融合方法，通过引入权重系数自动学习不同输入特征的重要性，实现对多尺度特征的自适应优化，如公式（1）所示。

O = ∑ i w i ε + ∑ j w j I i

（1）

式中：

O

为融合的输出特征；

I i

为第i个输入特征；

w i

为可学习的权重参数，通过反向传播优化，反映各输入特征的重要性；

ε = 0.000 1

以确保数值稳定，公式通过归一化权重（

w i ∑ j w j

）将融合结果进行约束，既保留权重区分度，又避免训练不稳定。BiFPN结构如图5所示。

显示原图|下载原图ZIP|生成PPT

图5 BiFPN结构

Fig. 5 Network structure of BiFPN

综合以上优势，BiFPN的引入不仅有效提升了模型的多尺度特征整合效果，还增强了对胡麻倒伏区域复杂场景的适应性，为实现轻量化、高精度的区域分割奠定基础。

2.1.3　多尺度通道注意力机制

尽管轻量化设计在模型部署效率和计算资源控制方面具有明显优势，但其结构压缩往往导致特征表达能力受到限制，尤其在处理复杂纹理与弱化边界区域时，模型感知能力下降显著。为缓解这一问题，本研究在一种参数高效、结构简洁的高效通道注意力（Efficient Channel Attention, ECA）机制基础上，进一步引入MS-ECA，用于增强模型对关键语义通道的响应能力。

ECA的核心思想是通过局部跨通道交互信息（Local Cross-channel Interaction）来自动学习通道间的重要性权重，避免使用复杂的全连接结构从而大幅降低参数量与计算成本，使其适用于对推理速度和模型体积有严格要求的场景^［23］。压缩和激励模块（Squeeze‑and‑Excitation, SE）^［24］、卷积块注意力模块（Convolutional Block Attention Module, CBAM）^［25］等主流注意力机制，通常采用全连接层来建模通道依赖关系，虽然能够提升模型性能，但会显著增加计算开销，且容易引发信息瓶颈。在ECA的基础上，为进一步增强模块对不同尺度特征的敏感性，本研究在ECA中引入多尺度卷积并行结构。通过不同卷积核尺寸（如3、5、7）在通道维度的交互融合捕获多层语义依赖关系，在保持轻量特性的同时有效提升了特征表达能力与细节保留能力，如公式（2）所示。

ω = σ 1 n ∑ i = 1 n C k i 1 D y

（2）

式中：

ω

为各个通道的权重；

σ

为Sigmoid函数；

C k i 1 D

表示卷积核大小为

k i

（如3、5、7）的多尺度一维卷积操作；

n

为卷积尺度数；y为一维卷积的输入信号。通过不同卷积核尺寸的并行处理，使模型可以同时关注细粒度与粗粒度的语义信息，从而提升对复杂区域的感知能力。其中卷积核的尺寸

k i

由通道数量C自适应确定，如公式（3）所示。

k i = φ i C = l o g 2 (C) γ + b i γ o d d

（3）

式中：C为通道数；odd为向上取最近的奇数；本研究中的γ取值为2；

b i

根据不同的卷积核尺度分别取值。多尺度ECA模块结构如图6所示。

显示原图|下载原图ZIP|生成PPT

图6 MS-ECA模块结构

Fig. 6 Structure diagram of Multi-Scale ECA mechanism

考虑到胡麻倒伏区域在图像中通常表现为结构复杂、纹理丰富且与周围背景差异明显的特点，本研究将引入的MS-ECA模块分别嵌入模型的Backbone第2、4、6、8层（即C3k2_SDW_MS-ECA模块所在位置），以增强多尺度语义特征的通道选择与融合能力，从而提升模型对胡麻倒伏区域纹理变化与边界特征的感知能力。MS-ECA模块通过不同核大小卷积并行处理，实现跨尺度的通道信息交流与整合，能捕捉多层的通道依赖关系，丰富了特征表达的维度与深度。

2.1.4　C3k2_SDW_MS-ECA复合模块

为了更好地兼顾模型的轻量化和特征增强能力，本研究将C3k2_SDW结构与MS-ECA进行融合，构建C3k2_SDW_MS-ECA复合模块。该模块在保持StarBlock与深度可分离卷积高效提取空间特征的同时，引入MS-ECA对通道维度进行自适应建模与加权重标定，提升模型对胡麻倒伏区域纹理细节与边界特征的响应能力。C3k2_SDW_MS-ECA模块在本次研究中的Backbone部分均有较多应用，是结构优化的核心改进单元。

2.2　试验方法

2.2.1　试验环境与参数配置

本研究采用的试验平台如下：64位Windows11，CPU为Intel（R） Xeon（R） Platinum 8255C处理器，NVIDIA Ge Force RTX3090Ti的GPU显卡。搭建与训练网络模型在Python 3.8环境，Pytorch 2.0.0的深度学习框架上。在训练模型的过程中，输入图像分辨率像素调整为640×640，初始学习率设定为0.01，批量大小设置为32，训练次数为300，动量设定为0.937，以保证模型权重的稳定更新与高效收敛；优化器使用随机梯度下降（Stochastic Gradient Descent, SGD），权重衰减系数为0.000 5，以提高模型的泛化能力并减少过拟合风险。

2.2.2　评价指标

为了客观评估模型在胡麻倒伏分割任务中的有效性，本研究采用精确度（Precision, P）、召回率（Recall, R）、mAP，以及边界交并比（Intersection over Union, IoU）对模型的性能进行评价。此外，为了衡量模型运算负担及硬件资源消耗情况，本研究采用GFLOPs和参数量（Parameters）作为衡量模型运算复杂度的评价指标，如公式（4）~公式（7）所示。

P = T P T P + F P

（4）

R = T P T P + F N

（5）

A P = ∫ 01 P r R d R

（6）

m A P = 1 X ∑ i = 1 X A P i

（7）

式中：

T P

为预测为真实际为真

; F P

为预测为真实际为假；

F N

为未被预测到的正样本；

P r R

表示当召回率为R时的精度；

X

表示所检测目标类别的数量；

A P

表示平均精度。精确度与召回率均为比例类指标，AP与mAP的取值范围为［0，1］。

3 结果与分析

3.1　消融实验

为系统验证所提模块的有效性，本研究以YOLOv11n-seg为基准，依次引入C3k2_SDW模块、BiFPN融合结构及MS-ECA机制，最终构建C3k2_SDW_MS-ECA+BiFPN模型，并在胡麻倒伏区域分割任务中完成性能测试。Baseline表示YOLOv11n-seg基准模型，其骨干网络未引入任何特征融合或注意力机制模块；C3k2_SDW表示在基准模型基础上引用C3k2_SDW模块；C3k2_SDW+BiFPN表示进一步引用了BiFPN模块；最终Improved Model同时引用3种模块。实验结果如表2所示。

表2 改进胡麻倒伏识别模型消融实验结果

Table 2 Ablation experiment results of the improved model for flax lodging recognition

模型	P/%	R/%	mAP@0.5/%	Boundary IoU	参数量/M	计算量/GFLOPs
Baseline	88.9	86.2	93.1	80.3	2.83	10.2
C3k2_SDW	89.8	87.6	93.0	79.8	2.14	8.1
C3k2_SDW+BiFPN	90.1	91.5	93.8	81.0	1.68	7.7
Improved model	92.6	92.0	95.2	82.3	1.73	8.0

从表2的实验结果可知，在逐步引入C3K2_SDW、BiFPN与MS-ECA模块后，模型的参数量与计算量均较基准模型有所下降。这主要是因为改进模型所采用的模块均具备轻量化且不丢失精度的特性。在基准模型中引入C3K2_SDW模块，通过采用更小的卷积核及深度可分离卷积减少了冗余计算，精确率提升了0.9个百分点，召回率提升了1.4个百分点，参数量由2.83 M减少至2.14 M，计算量由10.2 GFLOPs减少至8.1 GFLOPs，但该结构在降低计算开销的同时牺牲了部分细粒度特征建模能力，导致mAP@0.5略微降低0.1个百分点。因此，在此基础上进一步加入BiFPN模块后，精确率和召回率分别提升至90.1%和91.5%，mAP@0.5为93.8%，Boundary IoU进一步提升至81.0，参数量与计算量进一步降至1.68 M和7.7 GFLOPs，说明BiFPN模块有助于增强多尺度特征的融合能力，提高模型整体感知能力，BiFPN通过重复利用特征图和共享权重，实现多尺度特征的高效融合，无需增加额外卷积参数，从而在增强模型感知能力的同时保持轻量化。最终，结合MS-ECA模块，使模型能同时从空间分布和通道语义两个维度精准定位关键信息，提升整体特征表示的准确性与完整性，精确率和召回率分别提升至92.6%和92.0%，mAP@0.5提升了2.1个百分点，达到95.2%，Boundary IoU也提升至82.3，由于引入多尺度分支和参数，导致参数量和计算量分别上升到1.73 M和8.0 GFLOPs，但该模块显著改善了模型对倒伏区域的检测精度和鲁棒性。由此表明，本研究提出的改进方法能够有效增强模型的特征提取与多尺度信息融合能力，提升了对复杂倒伏场景的适应能力，在精度和运算效率方面均优于基准模型。

3.2　不同模型实验结果对比

为进一步评价所改进模型的有效性，本研究在相同实验环境下，选取YOLACT、YOLOv7-seg、YOLOv8n-seg、YOLOv11n-seg等不同分割模型，基于数据集进行训练与验证，实验结果如表3所示。相较于原始YOLOv11n-seg模型，优化后的模型在精确率、召回率及mAP@0.5指标方面分别达92.6%、92.0%、95.2%，显著增强了模型对目标区域的整体检测能力。此外，改进模型在Boundary IoU上也取得了显著提升，达到了82.3，表明在边界精度上有明显优化。相比于YOLOv8n-seg，该模型在精度方面也均表现出优越性，其中mAP@0.5提升了1.8个百分点；与较大规模但分割能力较好的YOLOv7-seg相比，在mAP@0.5上仅有0.2个百分点的浮动；YOLACT作为早期的分割方法，虽然模型复杂度低，但其mAP@0.5仅为60.3%，与改进模型存在显著差距。这系列对比结果表明，所引入C3k2_SDW模块、MS-ECA轻量注意力机制模块，以及BiFPN多尺度特征融合结构效果良好。

表3 不同胡麻倒伏识别模型对比实验结果

Table 3 Comparative experimental results of different models for flax lodging recognition

模型	P/%	R/%	mAP@0.5/%	Boundary IoU	参数量/M	计算量/GFLOPs	模型体积/MB	推理速度/（帧/s）
YOLACT	56.8	59.6	60.3	65.5	9.38	35.0	37.5	38.10
YOLOv7-seg	95.1	93.0	95.0	83.9	37.84	141.9	73.0	87.31
YOLOv8n-seg	92.2	87.2	93.4	78.5	3.26	12.0	6.8	111.18
YOLOv11n-seg	88.9	86.2	93.1	80.3	2.83	10.2	6.0	98.72
Improved model	92.6	92.0	95.2	82.3	1.73	8.0	3.8	119.20

此外，在RTX3090Ti环境下，改进后的YOLOv11n-seg模型的计算复杂度降至8.0 GFLOPs，模型体积仅3.8 Mb，推理速度达到119.2帧/s，满足实时田间监测需求。本研究所改进的模型在保持分割精度提升的同时，进一步实现了显著的轻量化效果，显著降低了模型在嵌入式平台或边缘设备中的部署成本。

本研究提出的改进YOLOv11n-seg模型不仅在分割能力方面优于现有轻量化与非轻量化模型，同时在参数量和计算量方面明显下降，具有良好的实际部署价值和推广前景，尤其适用于对模型性能和效率均有较高要求的农业遥感图像分割任务。

3.3　与主流语义分割模型的对比实验

除基准实验外，本研究与U-Net和Deeplabv3+两种经典的倒伏区域识别模型在相同数据集、相同环境下，以及相同训练策略下进行对比，以检验改进模型在不同维度上的表现，实验结果如表4所示。

表4 改进模型与主流语义分割模型的性能对比实验结果

Table 4 Comparative performance experimental results between the improved model and mainstream semantic segmentation models

模型	Boundary IoU	参数量/M	计算量/GFLOPs	推理速度/（帧/s）
U-Net	77.2	24.90	44.1	68.93
DeepLabv3+	83.9	54.40	53.0	50.00
Improved model	82.3	1.73	8.0	119.20

由于3种模型属于不同框架，为保证公平性，重新训练并评估了各模型，并选取语义分割任务中共同常用的指标：Boundary IoU、参数量、计算量与推理速度综合考察模型的表现。从表中可以看出，U-Net在精度指标上略有优势，但其庞大的参数量和较低的推理速度限制了模型部分价值；DeepLabv3+在精度与边界分割上表现较好，但其效率较低；改进后的YOLO模型在精度上略逊色于主流语义分割模型，但大幅度降低了计算开销并显著提升了推理速度，更符合农业场景下的部署需求。

3.4　可视化分析

为了更直观地评估所提出模型在复杂场景下对胡麻倒伏区域的关注能力，本研究采用Grad-CAM可视化技术对模型的注意力分布进行展示分析，其中红色区域表示对最终预测结果具有较大贡献的特征区域。如图7所示，从胡麻实拍图像中挑选出典型倒伏场景，分别比较原始YOLOv11n-seg与改进模块后的模型在目标感知方面的表现。

显示原图|下载原图ZIP|生成PPT

图7 不同模型热力图可视化效果对比

Fig. 7 Comparison of heatmap visualization effects among different models

由图7可见，YOLOv11n-seg模型在处理倒伏区域时，受限于对边缘模糊、纹理相似区域的判别能力，容易对背景中直立植株或裸露土壤产生误激活，导致模型聚焦不准确。相比之下，本研究提出的改进模型，在复杂背景下表现出更强的倒伏区域感知能力。其中，C3k2_SDW_MS-ECA模块有效增强了局部特征的表达力与目标区域的响应强度，BiFPN结构则在不同尺度间实现了高效的信息传递与融合，进一步提升了模型对倒伏形态的全局感知与边界判别能力。因此，从热力图来看，改进后的模型能更精准地覆盖倒伏目标区域，体现出更强的判别能力与注意力引导效果。

3.5　跨区域适应性验证

为验证改进模型在不同地域和不同生长阶段条件下的适应性，本研究在甘肃省农业科学院会宁县试验站的胡麻田间倒伏影像进行测试。该区域样本为成熟期胡麻，植株颜色偏黄、背景纹理难以区分，倒伏形态更具差异性。在此情况下，改进的YOLOv11n-seg模型依然保持较好的分割表现，模型Boundary IoU达到84.31%。结果如图8所示，改进模型在此类样本中能够清晰地分割出倒伏区域，且边界识别较为准确，表明模型不仅适用于灌浆期的绿色植株影像，也能在成熟期的复杂场景下保持较好的分割效果。这一结果说明模型在不同场景下具备一定的泛化潜力。

显示原图|下载原图ZIP|生成PPT

图8 会宁县成熟期胡麻数据测试效果图

Fig. 8 Testing results of mature-stage flax lodging data in Huining county

3.6　倒伏面积与产量损失估算的拓展性分析

为进一步体现分割结果在农业生产中的应用价值，本研究参考了任长忠和杨才^［26］在燕麦研究中提出的田间倒伏率的分级标准方法（Lodging Rate, LR），并将其推广至胡麻影像分割任务：以预测掩膜中倒伏区域像素占整幅影像像素总数的比例来表示倒伏面积率，并采用与田间调查一致的阈值区间实现倒伏程度划分与产量损失的区间推算方法。倒伏等级划分标准如表5所示。

表5 胡麻倒伏等级划分标准

Table 5 Classification criteria of flax lodging grades

倒伏等级	倒伏面积率对应倒伏程度
0级（未倒伏）	未倒伏
1级（轻度倒伏）	0%~<15%
2级（中度倒伏）	15%~<45%
3级（重度倒伏）	45%及以上

在模型输出的掩膜基础上，计算了倒伏区域所占比例

r

^［27］，如公式（8）所示。

r = Σ i = 1 H Σ j = 1 W m i, j H × W

（8）

式中：i和

j

分别为图像的行与列；

m i, j

表示像素点

i, j

是否属于倒伏区域（取值为1或0，若该像素属于倒伏区域则为1，否则为0）；H和W分别为图像的高与宽。

在此基础上，分别将轻度、中度、重度等级在图像面积中的占比记为

p L 、 p M 、 p H

（满足

p L + p M + p H = 1

），并结合农学研究中关于不同倒伏等级对应的减产区间，建立了产量损失估算公式，如公式（9）和公式（10）所示。

Δ Y m i n = r × p L × α L m i n + p M × α M m i n + p H × α H m i n

（9）

Δ Y m a x = r × p L × α L m a x + p M × α M m a x + p H × α H m a x

（10）

式中

: α L

、

α M

、

α H

分别为轻度、中度、重度倒伏的减产系数区间

; Δ Y m i n

与

Δ Y m a x

分别为估算的最小与最大损失率。该公式体现了倒伏面积率与产量损失的近似线性关系。

本研究虽然未获取实地产量测定数据，但结合上述产量损失系数，可以通过分割结果给出倒伏可能导致的产量区间估算。该方法表明，本研究所改进的模型不仅能够实现倒伏区域识别，还可为农业生产中的定损和管理提供参考。未来将在实地调查的基础上，进一步建立胡麻倒伏程度、面积比例与实际产量之间的定量关系，以增强模型在生产应用中的可靠性。

3.7　不同数据集对比结果分析

为验证改进模型在多类别作物中的泛化与提升能力，本研究在自建胡麻倒伏数据集验证其性能的基础上，选取公共数据集WE3DS^［28］的部分数据进行测试，数据集包含土壤、作物和杂草（所有非作物植物种类）三大类数据，验证模型在自然光条件下进行多种类分割性能，数据集包括土壤、黑麦草、野燕麦、玉米、车前草和小花天竺葵等。在实验中，分别使用基准模型与本研究提出的改进模型完成训练与验证，具体部分试验结果如表6所示。

表6 改进模型在不同数据集的对比实验结果

Table 6 Comparative experimental results of the improved model on different datasets

类别	P/%			R/%			mAP@0.5/%
类别	YOLOv11n-seg	Improved model	提升/百分点	YOLOv11n-seg	Improved model	提升/百分点	YOLOv11n-seg	Improved model	提升/百分点
全部	69.2	73.5	4.3	56.2	58.1	1.9	61.6	64.2	2.6
裸地	88.5	92.3	3.8	61.3	61.1	-0.2	68.9	69.3	0.4
土壤	80.0	87.3	7.3	88.4	89.3	0.9	92.3	94.1	1.8
蚕豆 Vicia faba L.	67.0	71.5	4.5	64.3	64.3	0.0	66.6	64.8	-1.8
黑麦草 Lolium perenne L.	83.1	86.9	3.8	82.9	84.1	1.2	89.6	91.0	1.4
红根苋 Amaranthus tricolor L.	85.0	87.5	2.5	86.7	89.2	2.5	89.6	92.0	2.4
荞麦 Fagopyrum esculentum Moench.	90.8	92.2	1.4	84.0	84.2	0.2	86.7	87.4	0.7
豌豆 Pisum sativum L.	44.9	48.2	3.3	15.0	12.5	-2.5	15.3	16.2	0.9
红指草 Digitaria sanguinalis （L.） Scop.	77.8	75.6	-2.2	38.8	50.0	11.2	49.2	55.4	6.2
野燕麦 Avena fatua L.	68.1	73.5	5.4	53.8	55.4	1.6	59.7	63.6	3.9
矢车菊 Centaurea cyanus L.	68.2	76.5	8.3	64.9	68.0	3.1	69.7	75.4	5.7
麦仙翁 Agrostemma githago L.	88.8	86.3	-2.5	82.6	78.3	-4.3	88.2	84.9	-3.3
玉米 Zea mays L.	77.2	77.8	0.6	88.2	89.5	1.3	88.7	91.3	2.6
奶蓟 Silybum marianum （L.） Gaertn.	68.2	72.0	3.8	34.9	41.1	6.2	41.7	53.0	11.3
玉米草 Setaria viridis	14.9	13.8	-1.1	10.5	5.36	-5.2	12.0	10.4	-1.6
大豆 Glycine max （L.） Merr.	59.6	67.9	8.3	72.8	84.7	11.9	77.6	85.4	7.8
向日葵 Helianthus annuus L.	61.3	84.8	23.5	12.8	14.4	1.6	23.0	30.5	7.5
车前草 Plantago lanceolata L.	44.0	46.6	2.6	14.1	17.1	3.0	24.6	25.0	0.4
小花天竺葵 Geranium pusillum L.	78.5	81.8	3.3	55.0	58.2	3.2	64.5	66.6	2.1

由表6可知，改进模型在各类别上P、R、mAP@0.5均优于原始模型。其中，全类别平均各指标P、R、mAP@0.5分别提升4.3、1.9和2.6个百分点。在具体类别中，土壤和野燕麦类别的各项指标提升幅度最为显著，P分别提升7.3和5.4个百分点、mAP@0.5分别提升1.8和3.9个百分点，表明改进模型在处理目标边界模糊、形态差异较大或训练样本相对稀缺的类别时更具优势。相比之下，黑麦草和小花天竺葵等类别的提升幅度相对较小，P提升3.8和3.3个百分点、mAP@0.5分别仅提升1.4和2.1个百分点，主要原因在于这些类别在WE3DS数据集中具有明显的形态特征，且背景干扰较弱，使得基准模型已经可以较好地完成识别。对于车前草等类别，改进模型在P指标上提升2.6个百分点，但mAP@0.5提升较小，仅为0.4个百分点。与此同时，部分小样本中的指标略有下降现象，揭示了当前的能力边界，未来工作将在更多样化的数据上进行训练以提升模型的泛化能力。综上所述，改进后的YOLOv11n-seg模型在WE3DS公共数据集上的综合表现良好，可以有效应对多场景、多类别的农作物识别任务。

4 结论

本研究面向胡麻倒伏区域识别任务，基于无人机获取的RGB影像，提出了一种轻量化、高精度的改进YOLOv11n-seg模型方案。针对倒伏区域在田间环境中呈现出的边界模糊、尺度不一等挑战，模型从结构上进行了3方面的关键改进，力求在提升识别精度的同时，兼顾模型效率与部署能力。主要研究结论如下。

1）本研究所提出的模型在Backbone部分中引入C3k2_SDW_MS-ECA模块，融合深度可分卷积与注意力机制，有效提升网络对关键倒伏区域的表达能力，并保持模型参数量紧凑。在Neck部分构建了高效的多尺度特征融合路径BiFPN结构，实现不同尺度语义信息的双向交互增强，增强模型对倒伏区域尺度多样性的适应能力。Head部分进一步引入通道注意力机制，增强模型对关键特征区域的响应能力，提升分割精度。在上述结构改进的基础上，模型整体参数量控制在1.73 M，计算量达到8.0 GFLOPs，兼具轻量化与特征表达能力。

2）在胡麻倒伏数据集上的实验验证表明，改进后的模型在主要评价指标上优于其他模型。具体而言，精确率、召回率和mAP@0.5分别达到92.6%、92.0%和95.2%，在保持较低计算成本的前提下，实现了全面的性能提升。与原始YOLOv11n-seg模型和同类模型相比，改进后的模型不仅体现了模型在倒伏分割中的可靠性，也展示了其在实际农场中的部署能力，具有明确的实际应用价值。未来工作将考虑引入多源遥感信息，以及多样化场景，进一步增强模型在复杂背景下的泛化能力，为胡麻的智能监测与管理提供技术支持。

本研究不存在研究者以及与公开研究成果有关的利益冲突。

参考文献

原文顺序 | 文献年度倒序 | 文中引用次数倒序

[1]	邓欣, 陈信波, 邱财生, 等. 我国亚麻种质资源研究与利用概述[J]. 中国麻业科学, 2015, 37(6): 322-329. DENG X, CHEN X B, QIU C S, et al. Review on research and utilization of flax (Linum usitatissimum L.) germplasm resources[J]. Plant Fiber Sciences in China, 2015, 37(6): 322-329.

[2]	GAO Y H. Oilseed flax (Linum usitatissimum L.), an emerging functional cash crop of China[J]. Oil Crop Science, 2020, 5(2): 23.

[3]	王炜, 陈军, 叶春雷, 等. 甘肃胡麻地方及育成品种农艺性状分析及评价[J]. 中国种业, 2022(12): 75-81. WANG W, CHEN J, YE C L, et al. Analysis and evaluation of agronomic characters of local and bred linseed varieties in Gansu Province[J]. China Seed Industry, 2022(12): 75-81.

[4]

张瑞兰, 武万里, 王淑丽, 等. 气候变化条件下宁南山区旱地胡麻土壤水分变化特征及对发育期和产量的影响[J]. 农业与技术, 2022, 42(21): 69-72.

ZHANG

R L

, WU

W L

, WANG

S L

, et al. Characteristics of soil moisture change and its influence on development period and yield of dry land flax in southern Ningxia under climate change[J]. Agriculture & Technology, 2022, 42(21): 69-72.

[5]	刘玄, 董宏伟, 高玉红, 等. 不同供钾水平下胡麻木质素代谢及其抗倒伏特性研究[J]. 中国生态农业学报(中英文), 2021, 29(5): 821-832. LIU X, DONG H W, GAO Y H, et al. Study on lignin metabolism and lodging resistance of flax under different potassium supply levels[J]. Chinese Journal of Eco-Agriculture, 2021, 29(5): 821-832.

[6]	张明. 胡麻生育时期界定标准探讨[J]. 甘肃农业科技, 2018(3): 9-14. ZHANG M. Gansu agricultural science and technology[J]. Gansu Agricultural Science and Technology, 2018(3): 9-14.

[7]	李政升, 麻丽娟, 董宏伟, 等. 钾肥用量对不同品种旱地胡麻抗倒伏能力及产量的影响[J]. 中国农学通报, 2021, 37(23): 69-76. LI Z S, MA L J, DONG H W, et al. Effects of potassium fertilizer on lodging resistance and yield of different varieties of dryland flax[J]. Chinese Agricultural Science Bulletin, 2021, 37(23): 69-76.

[8]	ZHAO X, YUAN Y T, SONG M D, et al. Use of unmanned aerial vehicle imagery and deep learning U-Net to extract rice lodging[J]. Sensors, 2019, 19(18): 3859.

[9]	梁美静, 毛克彪, 郭中华, 等. 深度学习在农业领域的研究与应用[J]. 农业工程, 2024, 14(1): 30-36. LIANG M J, MAO K B, GUO Z H, et al. Research and application of deep learning in agriculture[J]. Agricultural Engineering, 2024, 14(1): 30-36.

[10]	LEI L, YANG Q L, YANG L, et al. Deep learning implementation of image segmentation in agricultural applications: A comprehensive review[J]. Artificial Intelligence Review, 2024, 57(6): 149.

[11]	ZHANG K, ZHANG R D, YANG Z Q, et al. Efficient wheat lodging detection using UAV remote sensing images and an innovative multi-branch classification framework[J]. Remote Sensing, 2023, 15(18): 4572.

[12]	SONG Z S, ZHANG Z T, YANG S Q, et al. Identifying sunflower lodging based on image fusion and deep semantic segmentation with UAV remote sensing imaging[J]. Computers and Electronics in Agriculture, 2020, 179: 105812.

[13]	张淦, 严海峰, 胡根生, 等. 基于深度学习语义分割和迁移学习策略的麦田倒伏面积识别方法[J]. 智慧农业(中英文), 2023, 5(3): 75-85. ZHANG G, YAN H F, HU G S, et al. Identification method of lodging area in wheat field based on deep learning semantic segmentation and transfer learning strategy[J]. Smart Agriculture, 2023, 5(3): 75-85.

[14]	龙佳宁, 张昭, 刘晓航, 等. 利用改进EfficientNetV2和无人机图像检测小麦倒伏类型[J]. 智慧农业(中英文), 2023, 5(3): 62-74. LONG J N, ZHANG Z, LIU X H, et al. Detection of wheat lodging types by improved EfficientNetV2 and UAV images[J]. Smart Agriculture, 2023, 5(3): 62-74.

[15]	杨蜀秦, 王鹏飞, 王帅, 等. 基于MHSA+DeepLab v3+的无人机遥感影像小麦倒伏检测[J]. 农业机械学报, 2022, 53(8): 213-219, 239. YANG S Q, WANG P F, WANG S, et al. Wheat lodging detection in UAV remote sensing images based on MHSA+DeepLab v3+[J]. Transactions of the Chinese Society for Agricultural Machinery, 2022, 53(8): 213-219, 239.

[16]	翟肇裕, 张梓涵, 徐焕良, 等. YOLO算法在动植物表型研究中应用综述[J]. 农业机械学报, 2024, 55(11): 1-20. ZHAI Z Y, ZHANG Z H, XU H L, et al. Review on the application of YOLO algorithm in the study of plant and animal phenotypes[J]. Transactions of the Chinese Society for Agricultural Machinery, 2024, 55(11): 1-20.

[17]	MA J, ZHAO Y K, FAN W P, et al. An improved YOLOv8 model for Lotus seedpod instance segmentation in the Lotus pond environment[J]. Agronomy, 2024, 14(6): 1325.

[18]	YUE X, QI K, NA X Y, et al. Improved YOLOv8-seg network for instance segmentation of healthy and diseased tomato plants in the growth stage[J]. Agriculture, 2023, 13(8): 1643.

[19]	WU Y, HAN Q B, JIN Q L, et al. LCA-YOLOv8-seg: An improved lightweight YOLOv8-seg for real-time pixel-level crack detection of dams and bridges[J]. Applied Sciences, 2023, 13(19): 10583.

[20]	张姝瑾, 许兴时, 邓洪兴, 等. 基于YOLOv8n-seg-FCA-BiFPN的奶牛身体分割方法[J]. 农业机械学报, 2024, 55(3): 282-289, 391. ZHANG S J, XU X S, DENG H X, et al. Body segmentation method of dairy cows based on YOLOv8n-seg-FCA-BiFPN[J]. Transactions of the Chinese Society for Agricultural Machinery, 2024, 55(3): 282-289, 391.

[21]	REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: Unified, real-time object detection[C]// 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2016: 779-788.

[22]	TAN M X, PANG R M, LE Q V. EfficientDet: Scalable and efficient object detection[C]// 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2020: 10778-10787.

[23]	WANG Q L, WU B G, ZHU P F, et al. ECA-Net: Efficient channel attention for deep convolutional neural networks[C]// 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2020: 11531-11539.

[24]	HU J, SHEN L, SUN G. Squeeze-and-excitation networks[C]// 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Piscataway, New Jersey, USA: IEEE, 2018: 7132-7141.

[25]	WOO S, PARK J, LEE J Y, et al. CBAM: Convolutional block attention module[C]// Computer Vision-ECCV 2018. Cham, Germany: Springer, 2018: 3-19.

[26]	任长忠, 杨才. 中国燕麦品种志[M]. 北京: 中国农业出版社, 2018: 23.

[27]	高珍妮, 郭丽琢, 李丽, 等. 氮肥对胡麻茎秆木质素合成酶活性及其抗倒性的影响[J]. 中国油料作物学报, 2014, 36(5): 610-615. GAO Z N, GUO L Z, LI L, et al. Effect of nitrogen fertilizer on lignin synthase activity and lodging resistance of flax stalk[J]. Chinese Journal of Oil Crop Sciences, 2014, 36(5): 610-615.

[28]	KITZLER F, BARTA N, NEUGSCHWANDTNER R W, et al. WE3DS: An RGB-D image dataset for semantic segmentation in agriculture[J]. Sensors, 2023, 23(5): 2713.

Options

文章导航

模态框（Modal）标题

摘要

本文引用格式

Abstract

0 引 言

1 材料与数据处理

1.1 试验区概况

图1 甘肃省定西市农业科学研究院油料作物研究站

1.2 图像获取及预处理

图2 胡麻倒伏数据增强示例

表1 胡麻倒伏数据集信息 (张)

2 研究方法

图3 改进YOLOv11n-seg网络结构图

2.1 基准模型YOLOv11n-seg

2.1.1 C3k2_SDW主干网络

图4 C3k2_SDW模块结构

2.1.2 BiFPN颈部结构

图5 BiFPN结构

2.1.3 多尺度通道注意力机制

图6 MS-ECA模块结构

2.1.4 C3k2_SDW_MS-ECA复合模块

2.2 试验方法

2.2.1 试验环境与参数配置

2.2.2 评价指标

3 结果与分析

3.1 消融实验

表2 改进胡麻倒伏识别模型消融实验结果

3.2 不同模型实验结果对比

表3 不同胡麻倒伏识别模型对比实验结果

3.3 与主流语义分割模型的对比实验

表4 改进模型与主流语义分割模型的性能对比实验结果

3.4 可视化分析

图7 不同模型热力图可视化效果对比

3.5 跨区域适应性验证

图8 会宁县成熟期胡麻数据测试效果图

3.6 倒伏面积与产量损失估算的拓展性分析

表5 胡麻倒伏等级划分标准

3.7 不同数据集对比结果分析

表6 改进模型在不同数据集的对比实验结果

4 结 论

参考文献

0 引言

1.1　试验区概况

1.2　图像获取及预处理

2.1　基准模型YOLOv11n-seg

2.1.1　C3k2_SDW主干网络

2.1.2　BiFPN颈部结构

2.1.3　多尺度通道注意力机制

2.1.4　C3k2_SDW_MS-ECA复合模块

2.2　试验方法

2.2.1　试验环境与参数配置

2.2.2　评价指标

3.1　消融实验

3.2　不同模型实验结果对比

3.3　与主流语义分割模型的对比实验

3.4　可视化分析

3.5　跨区域适应性验证

3.6　倒伏面积与产量损失估算的拓展性分析

3.7　不同数据集对比结果分析

4 结论