Welcome to Smart Agriculture 中文
Information Processing and Decision Making

Agricultural Knowledge Recommendation Model Integrating Time Perception and Context Filtering

  • WANG Pengzhe , 1, 2 ,
  • ZHU Huaji 2, 3, 4 ,
  • MIAO Yisheng 2, 3, 4 ,
  • LIU Chang 2, 3, 4 ,
  • WU Huarui , 1, 2, 3, 4
Expand
  • 1. College of Computer and Electronic Information, Guangxi University, Nanning 530004, China
  • 2. National Engineering Research Center for Information Technology in Agriculture, Beijing 100097, China
  • 3. Information Technology Research Center, Beijing Academy of Agriculture and Forestry Sciences, Beijing 100097, China
  • 4. Key Laboratory of Digital Village Technology, Ministry of Agriculture and Rural Affairs, Beijing 100097, China
WU Huarui, E-mail:

Received date: 2023-12-14

  Online published: 2024-02-06

Supported by

National Key Research and Develpment Program(2022YFD1600602)

Copyright

copyright©2024 by the authors

Abstract

Objective Knowledge services in agricultural scenarios have the characteristics of long periodicity and prolonged activity time. Traditional recommendation models cannot effectively mine hidden information in agricultural scenarios, in order to improve the quality of agricultural knowledge recommendation services, agricultural contextual information based on agricultural time should be fully considered. To address these issues, a Time-aware and filter-enhanced sequential recommendation model for agricultural knowledge (TiFSA) was proposed, integrating temporal perception and enhanced filtering. Methods First, based on the temporal positional embedding, combining the temporal information of farmers' interactions with positional embedding based on time perception, it helped to learn project relevance based on agricultural season in agricultural contexts. A multi-head self-attention network recommendation algorithm based on time-awareness was proposed for the agricultural knowledge recommendation task, which extracted different interaction time information in the user interaction sequence and introduced it into the multi-head self-attention network to calculate the attention weight, which encoded the user's periodic interaction information based on the agricultural time, and also effectively captured the user's dynamic preference information over time. Then, through the temporal positional embedding, a filter filtering algorithm was introduced to adaptively attenuate the noise in farmers' situational data adaptively. The filtering algorithm was introduced to enhance the filtering module to effectively filter the noisy information in the agricultural dataset and alleviate the overfitting problem due to the poorly normalized and sparse agricultural dataset. By endowing the model with lower time complexity and adaptive noise attenuation capability. The applicability of this method in agricultural scenarios was improved. Next, a multi-head self attention network with temporal information was constructed to achieve unified modeling of time, projects, and features, and represent farmers' preferences of farmers over time in context, thereby providing reliable recommendation results for users. Finally, the AdamW optimizer was used to update and compute the model parameters. AdamW added L2 regularization and an appropriate penalty mechanism for larger weights, which could update all weights more smoothly and alleviate the problem of falling into local minima. Applied in the field of agricultural recommendation, it could further improve the training effect of the model. The experimental data came from user likes, comments, and corresponding time information in the "National Agricultural Knowledge Intelligent Service Cloud Platform", and the dataset ml-1m in the movie recommendation scenario was selected as an auxiliary validation of the performance of this model. Results and Discussions According to the user interaction sequence datasets in the "National Agricultural Knowledge Intelligent Service Cloud Platform", from the experimental results, it could be learned that TiFSA outperforms the other models on two different datasets, in which the enhancement was more obvious on the Agriculture dataset, where HR and NDCG were improved by 14.02% and 16.19%, respectively, compared to the suboptimal model, TiSASRec; while on the ml-1m dataset compared to the suboptimal model, SASRec, HR and NDCG were improved by 1.90% and 2.30%, respectively. In summary, the TiFSA model proposed in this paper has a large improvement compared with other models, which verifies verified the effectiveness of the TiFSA model and showed that the time interval information of farmer interaction and the filtering algorithm play an important role in the improvement of the model performance in the agricultural context. From the results of the ablation experiments, it could be seen that when the time-aware and enhanced filtering modules were removed, the values of the two metrics HR@10 and NDCG@10 were 0.293 6 and 0.203 9, respectively, and the recommended performance was poor. When only the time-aware module and only the augmentation filtering module were removed, the experimental results had different degrees of improvement compared to TiFSA-tf, and the TiFSA model proposed in this paper achieved the optimal performance in the two evaluation metrics. When only the multi-head self-attention network was utilized for recommendation, both recommendation metrics of the model were lower, indicating that the traditional sequence recommendation method that only considered the item number was not applicable to agricultural scenarios. When the augmented filtering module was introduced without the time-aware module, the model performance was improved, but still failed to achieve the ideal recommendation effect. When only the time-aware module was introduced without the augmented filtering module, there was a significant improvement in the model effect, which proved that the time-aware module was more applicable to agricultural scenarios and can effectively improve the model performance of the sequence recommendation task. When both time-aware and augmented filtering modules were introduced, the model performance was further improved, which on the one hand illustrated the dependence of the augmented filtering module on the time-aware module, and on the other hand verified the necessity of adopting the augmented filtering to the time-aware self-attention network model. Conclusions This research proposes an agricultural knowledge recommendation model that integrates time-awareness and augmented filtering, which introduces the user's interaction time interval into the embedded information, so that the model effectively learns the information of agricultural time in the agricultural scene, and the prediction of the user's interaction time and the object is more closely related to the actual scene; augmented filtering algorithms are used to attenuate the noise in the agricultural data. At the same time, the enhanced filtering algorithm is used to attenuate the noise in the agricultural data, and can be effectively integrated into the model for use, further improving the recommendation performance of the model. The experimental results show the effectiveness of the proposed TiFSA model on the agricultural dataset. The ablation experiments confirm the positive effect of time-awareness and enhanced filtering modules on the improvement of recommendation performance.

Cite this article

WANG Pengzhe , ZHU Huaji , MIAO Yisheng , LIU Chang , WU Huarui . Agricultural Knowledge Recommendation Model Integrating Time Perception and Context Filtering[J]. Smart Agriculture, 2024 , 6(1) : 123 -134 . DOI: 10.12133/j.smartag.SA202312012

0 引 言

随着现代信息技术在农业领域的广泛应用,发布于互联网上的农业知识信息量成指数级增长,造成信息过载和碎片化严重等问题。面对海量的农业信息数据,农业知识个性化推荐任务能够快速获取农户的知识需求,计算农户的兴趣偏好特征,最终为农户提供准确、个性化的农业知识服务。
在推荐领域中,捕获用户的动态序列交互行为对于提高推荐系统的性能至关重要。为了准确刻画用户的兴趣偏好并提供高质量的推荐结果1-3,早期的序列推荐利用Markov链(Markov Chains, MC)从用户交互序列中获取顺序模式4。该方法只能关注到局部的信息,无法从整体构建用户偏好特征。近年来,深度学习技术凭借其更强大的深层表达能力,在序列推荐领域研究中得到了较好的发展。其中基于循环神经网络的推荐通常使用长短期记忆网络(Long Short-Term Memory, LSTM)和门控循环单元处理推荐问题中的长序列信息5。Niu等6提出通过自注意力机制与Bi-GRU网络分别提取用户长短期兴趣偏好,最后通过欧式距离融合特征得到最终加权求和的推荐结果。Tang和Wang7将卷积神经网络运用至序列推荐领域,分别使用水平卷积核和垂直卷积核对用户行为序列进行兴趣偏好提取,提高了内存的使用效率。Zhao等8提出了LSIC(Long and Short-term Information in Content-aware)模型,通过对抗训练利用长期和短期信息的内容感知进行推荐。Fang等9集合基于内容的推荐方法、K最邻近(K-Nearest Neighbor, KNN)和协同过滤(Collaborative Filtering, CF)这3种算法实现特定用户输入的特定电影推荐。此外,相关研究人员也将丰富的上下文信息引入到序列推荐当中10-12,预测用户下一项可能交互的项目。上述推荐算法在视频、新闻、商业等领域可以被推广应用,但在农业场景中的适用度有限。在农业知识推荐领域,惠银帆13通过获取农户当前行为特征并加以分析,为农户提供农业种植技术的个性化推荐。国帅14构建农业知识领域本体,根据用户需求、情感和兴趣偏好,综合考虑农业信息服务平台的结构特征,结合现有的用户画像和知识图谱,为用户提供精准的个性化推荐。王梦瑶15设计的农产品电商个性化推荐系统利用农产品领域知识图谱,通过建立群组动态用户画像,运用动态画像与协同过滤的混合推荐算法来实现个性化推荐。系统根据用户在农产品领域的兴趣和偏好,结合群组内的动态用户画像,精准地推荐符合用户需求的农产品。
当前,互联网的农业知识存在碎片化严重、低质重复、噪声影响严重,同时缺少公开的序列推荐数据集,相关研究仍处于起步阶段16。传统的序列推荐模型对于农业场景的适用度不高,农业情境中的隐藏信息难以被发掘,需要结合农业情境信息进行个性化推荐,而基于用户画像和知识图谱的推荐算法,融入了一定的农业情境信息但无法更好地获得农户的动态兴趣变化和需求。为了提高农业知识推荐服务质量,要充分考虑基于农时的农业情境信息。农业用户的交互行为往往有着丰富的农时信息,种植不同作物的农户在不同的农时下会有不同的知识需求。而传统的序列推荐算法往往丢弃了时间信息,只保留了交互项目的相对位置信息,依靠用户所访问的时间顺序进行位置编码,忽略了时间间隔信息对推荐结果的影响,因此无法有效捕捉用户基于农时的动态偏好信息。综上所述,目前农业领域的推荐模型存在以下问题:1)常规模型无法针对农业数据场景进行有效的推荐8-12;2)农业数据规范性差、噪声影响严重16;3)农业数据场景信息利用不充分13-15
针对以上问题,本研究提出融合时间感知和增强过滤的农业知识推荐模型(Time-aware and Filter-enhanced Sequential Recommendation Model for Agriculture Knowledge, TiFSA),通过引入时间间隔信息对用户交互的农时特征进行建模,并以此进行推荐。针对农业场景周期性强、活动时间长的特点,将用户交互的时间戳信息引入推荐框架,通过时间感知位置嵌入方法,将所有的用户序列信息转换为带时间信息的序列嵌入;设计增强过滤算法对嵌入序列信息进行噪声过滤,优化农业数据集噪声影响大、容易过拟合的问题;使用多头自注意力网络进行时序分解和用户偏好特征的捕捉,通过时间间隔信息计算注意力得分,提升农业场景下的推荐性能;采用AdamW优化器优化最终预测结果,在预测层推测出用户下一农时时期内的知识需求。

1 数据采集与处理

1.1 农业数据描述

实验数据来源于作者团队开发的“全国农业知识智能服务云平台”中的用户点赞、评论数据和对应的时间信息。其中农业知识包括种植和养殖数据。种植知识包括病虫草害、土壤肥料、栽培管理、市场销售、品种选择、农业机械。养殖知识包括养殖管理、动物疫病、良种繁育、饲料营养、市场销售5种类型。其中种植品种涵盖蔬菜、水果和作物3种类型,主要包括黄瓜、甘蓝、辣椒、萝卜、西红柿、水稻、小麦、玉米、苹果、桃子10个品种。每个品种根据其时间或者生长时期对应不同农时。例如,甘蓝的种植时间通常为4~9月份,时间范围较广,因此以发芽期、种苗期、生长期、接球期、成熟期这5个生长时期作为对甘蓝的农时描述更为合适。不同作物和不同种植时期下农时的划分方式不相同,因此引入交互时间戳,以时间间隔信息作为对农时的感知方式。
本研究的推荐数据为农户交互知识的序列数据,将交互的农业知识按照时间顺序排列。用户在不同的农时阶段会浏览相应的知识,如图1所示,用户A为种植冬小麦的农户,在10月浏览品种选择和播种相关的知识,11~12月份浏览越冬水灌溉相关知识,次年的3月和4月分别浏览返青水灌溉和病虫害防治知识,以此组成序列推荐数据。最终目标是预测出用户下一个可能交互的知识。
图1 农户兴趣漂移图

Fig. 1 An example of farmer interest drift

1.2 数据预处理

通过对原始数据的标准化处理、剔除异常值和重复值等操作,选择用户交互序列长度大于5的数据构建农业数据集,包括1 270位用户对69 504条农业知识的128 547条交互数据,并命名为“Agriculture”。同时选用电影推荐场景下的数据集ml-1m作为对本模型性能的辅助验证。2个数据集的具体信息如表1所示。
表1 农业知识推荐实验数据集信息

Table 1 Agricultural knowledge recommendation experimental dataset information

数据集 用户数 项目数 交互数 数据密度/%
Agriculture 1 270 69 504 128 547 0.146
ml-1m 6 040 3 706 1 000 209 4.468

2 模型构建

本研究提出的TiFSA模型,整体结构由嵌入层、增强过滤层、时间感知自注意力层、预测层4个部分组成。嵌入层可以获取用户和项目交互序列的初始嵌入,同时在用户序列嵌入矩阵中引入他们的绝对位置和相对时间间隔信息;增强过滤层包含可学习农业推荐场景的滤波器,用于对农业领域序列推荐数中的噪声进行过滤;时间感知自注意力层利用时间间隔信息计算注意力权重,探索农户、所交互的农业知识以及交互时间之间的关系,从而得到不同农户在不同农时下的兴趣偏好信息;预测层结合农户兴趣特征进行推荐,获得目标项目的Top-N排序。整体模型结构如图2所示。
图2 TiFSA模型整体结构

Fig. 2 Overall structure of TiFSA model

2.1 农业场景问题建模

UI分别表示农业用户集和农业知识集,在时间感知序列推荐模型的中,对于每个农户所交互的农业知识序列表示为 S u = ( S 1 u , S 2 u , . . . , S S u u ),其中 S t u对应于每一个农业知识I T u = ( T 1 u , T 2 u , . . . , T T u u )表示农户交互每个知识的时间序列。在模型训练过程中,设置最大时间步长为t,模型读取农户交互的前t个农业知识,将 r i   j u作为定义两次交互农业知识ij的时间间隔,根据交互序列与时间间隔信息共同来预测下一个项目。本研究所提出的模型的输入为附带交互时间间隔 R u的农户交互序列 ( S 1 u , S 2 u , . . . , S S u - 1 u ),其中时间信息 R u N ( S u - 1 ) × ( S u - 1 ),模型每次的输出是用户交互的下一个项目 ( S 2 u , S 3 u , . . . , S S u u ),最终目标是预测农户u在(t+1)时刻的交互项目。

2.2 嵌入层

本研究提出的时间感知位置嵌入方法,主要为建模农时层面的农业知识相关性。首先将最大序列长度设置为n,模型将输入的用户交互序列 ( S 1 u , S 2 u , . . . , S S u - 1 u )转换为固定的最大长度的序列 S = ( S 1 , S 2 , , S n )。当输入的序列长度大于n时,截取交互序列中时间最近的前n个项目;当输入的序列长度小于n时,补充添加填充项至最大序列长度为n。对于一同输入的时间序列 T u = ( T 1 u , T 2 u , . . . , T T u - 1 u ),转换为与用户交互序列相对应的时间序列 T = T 1 , T 2 , , T n
本研究对输入农户交互序列中的时间间隔信息进行建模,表示两个农业知识之间基于农时情境的关系。其中一些农户在他种植作物的生长周期内会有更频繁的交互行为;而另一些种植作物没有在生长周期内的农户的活跃程度则相对较低。因此,本方法主要计算交互时间间隔的相对长度。对于每一个农户,将所有时间间隔信息除以其最短的时间间隔,得到不同农户个性化的农时情境表示。根据用户u的时间序列 T = T 1 , T 2 , , T n,将交互农户知识的时间间隔设置为|TiTj |,并定义为Ru。用户交互的最小时间间隔为 r m i n u = m i n ( I u ),按比例缩放的时间间隔为 r i j u = t i - t j r m i n u,其中 r i j u N。因此,用户的关系矩阵 M uNn × n 可表示为矩阵(1)。
M u = r 11 u r 12 u . . . r 1 n u r 21 u r 22 u . . . r 2 n u . . . . . . . . . . . . r n 1 u r n 2 u . . . r n n u
由于农业的周期性时间较长,会出现交互知识之间时间间隔过大的问题,导致稀疏关系编码。在农业领域中,精确的时间间隔信息在超过一定的阈值时将失去它的作用,因此对相对时间间隔修剪为k,作为交互知识之间的最大时间间隔,可以缓解稀疏关系编码的问题。因此,被修剪后的矩阵为 M c l i p p e d u = c l i p ( M u ),其中将修剪运算应用于矩阵的每个元素,定义为 r i j u = m i n ( k , r i j u )
嵌入层创建了农户交互知识的嵌入矩阵 M I R I × d,其中d是嵌入向量维度。在进行嵌入查找操作时,可以将嵌入矩阵的前n个交互知识的嵌入进行堆叠,形成一个新的嵌入矩阵,使用常数零向量0作为填充项,以保持嵌入矩阵的形状一致。最后得到矩阵 E I R n × d,如矩阵(2)。
E I = m s 1 m s 2 . . . m s n
在自注意力机制中使用两个不同的位置嵌入矩阵 M K P R n × d M V P R n × d分别作为键和值,得到农户交互知识的嵌入 E K P R n × d E V P R n × d,表示为矩阵(3)和矩阵(4)。
E K P = p 1 k p 2 k . . . p n k
E V P = p 1 v p 2 v . . . p n v
自注意力机制中的键和值的相对时间间隔与位置嵌入类似,嵌入矩阵为 M K R R k × d M V R R k × d。在检索到裁剪过的关系矩阵 M c l i p p e d u后,得到嵌入矩阵 E K R R n × n × d E V R R n × n × d,其中主对角线上的元素都是零,表示为矩阵(5)和矩阵(6)。
E K R = r 11 k r 12 k . . . r 1 n k r 21 k r 22 k . . . r 2 n k . . . . . . . . . . . . r n 1 k r n 2 k . . . r n n k
E V R = r 11 v r 12 v . . . r 1 n v r 21 v r 22 v . . . r 2 n v . . . . . . . . . . . . r n 1 v r n 2 v . . . r n n v

2.3 增强过滤层

经过嵌入层的数据处理后,增强过滤层通过堆叠多个可学习滤波器来过滤农业项目噪声,其结构如图3所示。
图3 农业知识推荐研究增强过滤层结构

Fig. 3 Agricultural knowledge recommendation structure of filter-enhanced layer

在增强过滤层中,对数据频域中的每个维度特征进行滤波操作,然后进行连接和归一化操作。给定输入项表示矩阵 E R n × n × d的第l层,首先沿着项目维度执行快速傅里叶变换(Fast Fourier Transform, FFT)以转换 E 到频域,如公式(7)所示。
X l = f ( E ) C n × d
式中:f(·)表示一维FFT;Xl 表示 E 频谱的复张量;然后乘以可学习滤波器K,如公式(8)所示。
X ˜ l = K X l
式中:⊙表示元素乘法;滤波器K是一个可学习滤波器,它可以被随机梯度下降(Stochastic Gradient Descent, SGD)优化以自适应地表示农业领域数据的频域。最后采用逆FFT变换调制频谱 X ˜ l使其返回到频域并更新序列,如公式(9)所示。
E ˜ l f - 1 ( X ˜ l ) R n × d
式中: f - 1 ( )表示逆FFT运算,它将复数张量转换为实数张量。经过FFT和逆FFT的运算,可以有效降低农业数据中的噪声,获得更纯净的农业项目嵌入。最后结合跳跃连接、层归一化和丢弃操作,缓解梯度消失和训练不稳定的问题,如公式(10)所示。
E ˜ l = L a y e r N o r m [ E ˜ l + D r o p o u t ( E ˜ l ) ]

2.4 时间感知自注意力层

根据自注意力机制,本研究提出融入两个项目之间不同时间间隔的自注意力机制。由于农业用户在获取知识时的交互序列可能有很多相同的时间戳,不仅要考虑时间间隔,还需要考虑项目在序列中的位置。
对于时间感知自注意力层,包含n个项目的每个输入序列 E I = ( m S 1 , m S 2 , , m S n ),同时计算一个新的序列 X = ( x 1 , x 2 , , x n )。每个输出元素xi 被计算为线性变换的输入元素和关系与位置的加权和,如公式(11)所示。
x i = j = 1 n i j ( m s j W V + r i j v + p j v )
式中: W V R d × d是值的输入投影。
使用softmax函数计算每个权重系数αij,如公式(12)所示。
α i j = e x p e i j k = 1 n e x p e i k
使用考虑输入、关系和位置的兼容性函数来计算eij,如公式(13)所示。
e i j = m s i W Q ( m s j W K + r i j k + p j k ) T d
式中:WQ ϵRd × dWK ϵRd × d 分别为查询和关键字的输入投影。当尺寸过高时,比例因子 d 可以避免内积的较大值。
时间序列任务中,模型预测下一个时间步的值时通常只考虑前面时间步的历史信息。然而,基于时间感知的自注意力机制在计算权重时考虑了时间的关系。它通过对序列中的每个位置应用自注意力机制,以便在预测第(t+1)个项目时能够捕捉到更多全局的依赖关系。因此,本研究通过禁止QiKij>i)之间的所有链接来修改注意力,如公式(14)公式(15)所示。
Q i = m S i W Q
K j = m S j W K + r i j k + p j k
式中:Q代表输入序列的特征;K代表输入序列中的每个元素进行匹配,以确定与之相关的特征。
在该层中,模型能够根据序列中不同位置的重要性和相关程度,自适应地计算每个位置的权重。通过这种方式,模型可以在预测任务中综合利用以往的项目、绝对位置和相对时间信息。考虑线性组合实现的方式,因此在每个时间感知自注意力层之后应用两个线性变换,通过ReLU函数激活,可以赋予模型非线性能力,如公式(16)所示。
F F N ( x i ) = m a x ( 0 , x i W 1 + b 1 ) W 2 + b 2
式中:W 1W 2ϵRd × db 1b 2ϵRd 线性变换在不同的层之间参数不共享。
由于农业数据的稀疏性和低质性,在堆叠两个网络层之后,本层同样采用层归一化、残差连接和丢弃正则化技术来解决过拟合、梯度消失和训练时间过长的问题,如公式(17)所示。
X i = x i + D r o p o u t     F F N   L a y e r N o r m ( x i )
归一化层用于归一化特征之间的输入,可以加速和稳定神经网络的训练。假设z是包含所有农户样本特征的向量,归一化层可定义为公式(18)
L a y e r N o r m   ( z ) = α z - μ σ 2 + ε + β
式中:⊙表示元素乘积;μσ分别表示z的均值和方差;αβ表示学习的比例因子和偏差项。

2.5 预测层

本研究的输出结果为预测的用户下一个交互项目,其输出交互序列为 S = ( S 1 , S 2 , . . . , S n ),其中每一个输出元素S代表一个预测结果,并按照偏好得分输出评分最高的前n个项目。
在时间感知自注意力层之后,得到项目、位置和时间间隔的组合表示。本研究使用潜在因子模型来计算农户对下一个可能交互的农业知识i的偏好得分,如公式(19)所示。
R i , t = X t M i I
式中: M i I R d表示项目i的嵌入Xt 是给定的前t个项(S 1S 2...St )及其时间间隔 ( r 1 ( t + 1 ) u ,   r 2 ( t + 1 ) u , . . . ,   r t ( t + 1 ) u )
本研究采用AdamW优化器,在继承Adam算法的基础上引入权重衰减的思想,提高Adam的泛化能力和收敛速度,进一步提升模型性能。

3 实验与分析

3.1 实验设置与评价指标

本实验模型采用PyTorch深度学习框架进行实验,设置最大序列长度在[10,20,30,40,50,60,70]之间调整,嵌入向量维度在[8,16,32,64,128]之间调整,Dropout比率设置为0.5,初始学习率为0.001,批处理大小设置为128,设置自注意力块数为2,注意力头数为2,采用AdamW作为本实验的优化器,损失函数为BCEWithLogitsLoss,所有实验均在GTX-1650Ti GPU上进行。
本实验采用Top-N排序的两种常用评估指标,分别是用于衡量推荐结果的准确性的命中率(Hit Rate,HR)和用于对推荐结果中位置排名靠前的项目分配更大的权重的位置感知指标归一化折损累计增益(Normalized Discounted Cumulative Gain, NDCG),如公式(20)公式(21)所示。
H R @ N = 1 U u U 1 ( i d x u , i < N )
N D C G @ N = 1 U u U 1 ( i d x u , i < N ) l g ( 2 + i d x u , i )
根据文献[1820]中的策略,为每个用户随机抽取99个用户未交互过的项目作为负样本。将这些项目与正样本一起进行排名,并计算相应的HR和NDCG。

3.2 模型对比实验分析

本研究将所提出的TiFSA模型与PopRec、GRU4Rec17、SASRec18、BERT4Rec19、Caser11、TiSASRec20、FMLP-Rec217个具有代表性的先进模型进行对比分析。
在Agriculture与ml-1m两个数据集上对所有模型进行测试。各个模型的结果如表2所示。其中实验结果最后一列数据为TiFSA模型结果相较于次优结果的提升比率。根据表2实验结果可知,PopRec模型在两个数据集上的表现最差,说明了个性化的用户建模在推荐领域的重要性。在基于用户序列推荐的模型中,BERT4Rec、SASRec、TiSASRec的模型性能都超过了GRU4Rec和Caser模型。这表明相较于GRU和卷积神经网络,自注意力机制拥有更强大的序列建模能力。此外,在Agriculture数据集上,FMLP-Rec的性能优于BERT4Rec和SASRec,表明基于滤波算法的推荐模型对于农业数据集噪声大的问题有一定的优化和提升。引入时间间隔信息的TiSASRec模型比其他传统序列推荐模型提升较大。FMLP-Rec和TiSASRec对农业数据集的提升较为明显,而在电影数据集中的模型性能低于SASRec。这表明在时间间隔信息和滤波算法的引入更符合农业场景下的服务需求。
表2 农业知识推荐研究不同模型性能对比

Table 2 Agricultural knowledge recommendation performance comparison of different models

Datasets Metric PopRec GRU4Rec Caser BERT4Rec FMLP-Rec SASRec TiSASRec TiFSA Impro./%
Agriculture HR@10 0.205 1 0.223 0 0.263 6 0.275 4 0.287 4 0.278 0 0.469 4 0.535 2 14.02
NDCG@10 0.136 3 0.155 4 0.196 1 0.203 2 0.208 2 0.198 2 0.394 1 0.457 9 16.19
ml-1m HR@10 0.400 3 0.558 1 0.751 7 0.759 2 0.795 7 0.818 9 0.803 8 0.834 5 1.90
NDCG@10 0.227 7 0.338 1 0.501 1 0.592 3 0.566 2 0.587 8 0.576 8 0.601 3 2.30

注:加粗为最优模型结果;下划线为次优模型结构。

表2中结果可以得知,TiFSA在两个不同数据集上的结果都优于其他模型,其中在Agriculture数据集上的提升较为明显,与次优模型TiSASRec相比,HR和NDCG分别提高14.02%和16.19%;而在ml-1m数据集上与次优模型SASRec相比,HR和NDCG分别提升1.90%和2.30%。综上所述,本研究提出的TiFSA模型相较于其他模型有较大提升,验证了TiFSA模型的有效性,有利于对用户所处不同农时情境进行感知,表明农户交互的时间间隔信息和滤波算法对农业情境下的模型性能的提升具有重要作用。

3.3 参数影响分析

3.3.1 嵌入向量维度分析

隐藏空间中,嵌入向量维度是一个关键参数。不同维度的嵌入向量对推荐性能的影响也会不同。本实验设置嵌入维度的值分别为8~128维,其他参数保持不变,对模型性能进行实验,采用公式(20)公式(21)的评估指标HR@10和NDCG@10,实验结果如图4所示。
图4 TiFSA模型的不同嵌入向量维度对比图

Fig. 4 Comparison of different embedding dimension in TiFSA model

图4分析可知,随着嵌入向量维度的不断增加,所提模型性能在维度达到64之前呈现上升趋势,超过64时模型性能开始下降,因此认为在维度为64时模型性能达到饱和。分析原因,在嵌入向量维度较小时,模型可供学习的参数较少,无法有效捕获农业场景下基于农时特征的用户信息,从而导致模型性能不好;在嵌入向量维度较大时,模型可以更好地学习农户的隐藏信息,提升模型性能,但当嵌入维度达到128时,模型的计算量增大,需要更长的时间进行收敛,同时由于数据噪声的影响,出现过拟合的现象,导致性能下降。在农业数据集上,TiFSA模型均在嵌入维度设置为64时达到最佳性能,因此将两个模型的嵌入向量维度设置为64。

3.3.2 最大序列长度分析

图5展示了在Agriculture和ml-1m数据集上最大序列长度对模型性能的影响,其中序列长度的取值范围设置为10~60个序列信息。从图5分析可以得知,随着序列长度的增加,模型性能会不断提升,Agriculture数据集的序列长度在达到40时会使结果趋向平稳。ml-1m数据集数据密度较大,在最大序列长度为60时达到最佳性能。而对于农业场景下数据密度较小的Agriculture数据集,模型性能同样呈现先上升再下降的趋势,在序列长度超过50后性能开始平稳下降。这是因为Agriculture数据集噪声较大,在增大序列长度后会引入更多的噪声数据,使得模型性能退化。因此在Agriculture数据集上的最大序列长度设置为50,而在ml-1m数据集上的最大序列长度设置为60。
图5 TiFSA模型不同序列长度对比图

Fig. 5 Comparison of different sequence length in TiFSA model

3.3.3 超参数分析

本节将选择Dropout比率和学习率两个超参数进行实验,进一步验证TiFSA模型的稳定性,实验结果如图6图7所示。从图6可以看出,两个数据集的模型结果随着Dropout比率的增加先平稳上升再下降,其中当Dropout比率达到0.5时模型性能达到最优,超过0.5后性能逐渐下降。这是因为当Dropout比率较高时会减小有效参数,使模型无法在农业情境下有效学习用户特征,从而降低模型的性能,而适当的Dropout比率则可以有效过滤数据集中的噪声,从而提高模型性能。从图7中可以看出,ml-1m和Agriculture数据集分别在学习率为5e-4和1e-3时达到最好的性能,而较大的学习率会导致模型性能降低。这是由于当学习率较大时,模型无法收敛达到最优解;而当学习率较小时,会降低模型的收敛速度。若想达到模型的最优解,则需要更多的迭代次数。因此在ml-1m数据集上,Dropout比率设置为0.5,学习率设置为5e-4;在Agriculture数据集上Dropout比率设置为0.5,学习率设置为1e-3。
图6 Dropout比率实验对比图

Fig. 6 Experiment comparison of dropout ratio

图7 学习率实验对比图

Fig. 7 Experimental comparison of learning rates

3.3.4 优化器对比分析

本研究通过两个数据集,分别选取SGD、Adagrad、RMSprop、Adam和AdamW优化器进行对比实验,结果如图8所示。
图8 TiFSA模型不同优化器对比实验

Fig. 8 Comparison of different optimisers in TiFSA model

图8表明,不同的优化器在两个数据集上有不同的收敛速度。其中SGD优化器的收敛效果较差,主要原因是该优化器每次更新参数时采用的数据量较小,且容易受到异常值的影响,无法有效适应农业数据集规范性较差、噪声影响严重的特点。Adagrad优化器在训练过程中可以自适应调整学习率,获得更好的训练效果,因此其性能优于SGD优化器。RMSprop优化器针对梯度平方和累计越来越大的问题,改进了Adagrad优化器上梯度下降算法,适合处理平稳的目标,但对于较为稀疏的农业数据集效果并不理想。Adam优化器则既吸收了Adagrad优化器善于处理稀疏梯度的特点,又结合了RMSprop的优点,使得其在两个数据集上分别取得了不错的效果,其中对于稀疏度较高的农业数据集提升较为明显。AdamW优化器则在Adam基础上引入权重衰减,解决Adam的自适应学习率在遇到L2正则化时效果不理想的问题,比Adam收敛得更快,相比于其他优化算法具有一定优势。

3.3.5 消融实验分析

本节将讨论时间感知和增强过滤模块对模型性能的影响,评估指标为3.1节所提出的HR和NDCG。由于这两个模块主要是对农业场景下的数据提升较为明显,因此本节将只针对Agriculture数据集进行实验,结果如表3所示。其中TiFSA-tf表示将时间感知模块和增强过滤模块移除,仅利用多头自注意力网络进行推荐;TiFSA-t表示仅将时间感知模块移除,利用加入滤波算法的自注意力网络进行推荐;TiFSA-f表示仅将滤波器模块进行移除,利用基于时间感知的自注意力网络进行推荐。
表3 农业知识推荐研究的TiFSA消融实验

Table 3 Research on agricultural knowledge recommendation ablation experiments of TiFSA

方法 HR@10 NDCG@10
TiFSA-tf 0.293 6 0.209 3
TiFSA-t 0.338 6 0.229 8
TiFSA-f 0.475 4 0.403 2
TiFSA 0.535 2 0.457 9
表3的消融实验结果可以看出,当移除时间感知和增强过滤模块时,HR@10和NDCG@10两个指标的值分别为0.293 6和0.203 9,推荐性能较差。当仅移除时间感知模块和仅移除增强过滤模块时,实验结果相比于TiFSA-tf有不同程度的提升,本研究所提出的TiFSA模型在两个评估指标上达到最优性能。对实验结果的具体分析如下:
1)当仅利用多头自注意力网络进行推荐时,模型两个推荐指标都较低,表明只考虑项目号的传统序列推荐方法不适用于农业场景。
2)当引入增强过滤模块而未引入时间感知模块时,模型性能有所提升,但依然无法达到理想推荐效果。主要原因是增强过滤模块能有效解决农业数据集规范性差、噪声影响较大的问题,但由于没有引入相关的农业情境信息,导致该方法并不能完全适应农业场景。
3)当仅引入时间感知模块而未引入增强过滤模块时,模型效果有显著的提升,证明时间感知模块对于农业场景的适用性较强,能够有效感知不同作物种植环境下的复杂农时情境,提升序列推荐任务的模型性能。
4)当同时引入时间感知模块和增强过滤模块时,模型性能得到进一步的提升。一方面说明了增强过滤模块对时间感知模块的依赖性;另一方面也验证了采用增强过滤对时间感知的自注意力网络模型的必要性。
综上所述,TiFSA模型的两个组成模块在农业场景下的具有积极提升作用,验证了各组成模块的有效性。

4 结论与展望

本研究针对农业知识推荐这一重要问题开展了研究,提出了一种融合时间感知和增强过滤的农业知识推荐模型。该模型将用户的交互时间间隔引入嵌入信息中,使得模型对农业场景中农时信息进行有效的学习,使用户的交互时间和对象的预测更贴近实际场景;同时采用增强过滤算法对农业数据中的噪声进行衰减,并能有效融入模型中进行使用,进一步提高模型的推荐性能。实验结果表明,在农业数据集上,所提出的TiFSA模型具有有效性,且在农业领域有较显著的提升,在HR@10和NDCG@10上分别提高14.02%和16.19%;消融实验证实了时间感知和增强过滤模块对推荐性能的提升具有积极作用。
在未来的研究中,将考虑引入地域、种植作物、温度等更多农业情境信息,并研究如何实现各情境信息的有效融合,进一步提高农业知识推荐的性能。

利益冲突声明

本研究不存在研究者以及与公开研究成果有关的利益冲突。

1
陶丹, 姚伊, 吴谨汐, 等. 用户偏好与时间序列的兴趣点推荐模型[J]. 小型微型计算机系统, 2022, 43(3): 582-588.

TAO D, YAO Y, WU J X, et al. User preference and time sequence based POI recommendation model[J]. Journal of Chinese computer systems, 2022, 43(3): 582-588.

2
陈灿宇, 付阿敏, 李国伟, 等. 基于卷积神经网络的中草药推荐系统[J]. 世界科学技术-中医药现代化, 2022, 24(6): 2402-2410.

CHEN C Y, FU A M, LI G W, et al. Convolutional neural network-based recommendation for Chinese herbal prescriptions[J]. Modernization of traditional Chinese medicine and materia medica-world science and technology, 2022, 24(6): 2402-2410.

3
冯健. 基于用户长短期兴趣的自注意力序列推荐[J]. 计算机应用与软件, 2023, 40(6): 103-111.

FENG J. Self-attention sequential recommendation based on users' long and short term interests[J]. Computer applications and software, 2023, 40(6): 103-111.

4
滕传志, 赵月旭. 基于随机森林-马尔可夫用户冷启动推荐系统[J]. 计算机工程与设计, 2020, 41(11): 3094-3098.

TENG C Z, ZHAO Y X. User cold start recommendation system based on random forest-Markov chain[J]. Computer engineering and design, 2020, 41(11): 3094-3098.

5
于蒙, 何文涛, 周绪川, 等. 推荐系统综述[J]. 计算机应用, 2022, 42(6): 1898-1913.

YU M, HE W T, ZHOU X C, et al. Review of recommendation system[J]. Journal of computer applications, 2022, 42(6): 1898-1913.

6
NIU L S, PENG Y, LIU Y M. Deep recommendation model combining long - and short-term interest preferences[J]. IEEE access, 2021, 9: 166455-166464.

7
TANG J X, WANG K. Personalized top-N sequential recommendation via convolutional sequence embedding[C]// Proceedings of the Eleventh ACM International Conference on Web Search and Data Mining. New York, USA: ACM, 2018: 565-573.

8
ZHAO W, WANG B Y, YANG M, et al. Leveraging long and short-term information in content-aware movie recommendation via adversarial training[J]. IEEE transactions on cybernetics, 2020, 50(11): 4680-4693.

9
FANG W, SHA Y, QI M H, et al. Movie recommendation algorithm based on ensemble learning[J]. Intelligent automation & soft computing, 2022, 34(1): 609-622.

10
汤小月, 周康, 王凯. 一种空间上下文感知的提及目标推荐方法[J]. 软件学报, 2020, 31(4): 1189-1211.

TANG X Y, ZHOU K, WANG K. Spatial context-aware mention target recommendation method[J]. Journal of software, 2020, 31(4): 1189-1211.

11
陈劲松, 孟祥武, 纪威宇, 等. 基于多维上下文感知图嵌入模型的兴趣点推荐[J]. 软件学报, 2020, 31(12): 3700-3715.

CHEN J S, MENG X W, JI W Y, et al. POI recommendation based on multidimensional context-aware graph embedding model[J]. Journal of software, 2020, 31(12): 3700-3715.

12
卢泽伦, 古万荣, 毛宜军, 等. 融合评分上下文和物品相似度的推荐算法[J]. 计算机应用研究, 2023, 40(10): 3040-3046.

LU Z L, GU W R, MAO Y J, et al. Recommendation algorithm with rating context and item similarity[J]. Application research of computers, 2023, 40(10): 3040-3046.

13
惠银帆. 农业种植技术个性化推荐模型研究与系统实现[D]. 杨凌: 西北农林科技大学, 2021.

HUI Y F. Research on personalized recommendation model of agricultural planting technology and its system realization[D]. Yangling: Northwest A & F University, 2021.

14
国帅. 基于本体的农业信息服务个性化推荐模型研究[D]. 郑州: 河南农业大学, 2021.

GUO S. Personalization recommendation model research of agricultural information service based on ontology[D]. Zhengzhou: Henan Agricultural University, 2021.

15
王梦瑶. 基于用户画像的农产品电商个性化推荐方法研究[D]. 合肥: 安徽农业大学, 2021.

WANG M Y. Research on personalized recommendation methods of agricultural products E-commerce based on user portraits[D]. Hefei: Anhui Agricultural University, 2021.

16
赵继春, 孙素芬, 郭建鑫, 等. 农业在线学习资源知识图谱构建与推荐技术研究[J]. 计算机应用与软件, 2022, 39(8): 69-75.

ZHAO J C, SUN S F, GUO J X, et al. Research on the construction of knowledge graph and recommendation technology of agricultural online learning resources[J]. Computer applications and software, 2022, 39(8): 69-75.

17
HIDASI B, KARATZOGLOU A. Recurrent neural networks with top-k gains for session-based recommendations[C]// Proceedings of the 27th ACM International Conference on Information and Knowledge Management. New York, USA: ACM, 2018: 843-852.

18
KANG W C, MCAULEY J. Self-attentive sequential recommendation[C]// 2018 IEEE International Conference on Data Mining (ICDM). Piscataway, New Jersey, USA: IEEE, 2018: 197-206.

19
SUN F, LIU J, WU J, et al. BERT4Rec: Sequential recommendation with bidirectional encoder representations from transformer[C]// Proceedings of the 28th ACM International Conference on Information and Knowledge Management. New York, USA: ACM, 2019: 1441-1450.

20
LI J C, WANG Y J, MCAULEY J. Time interval aware self-attention for sequential recommendation[C]// Proceedings of the 13th International Conference on Web Search and Data Mining. New York, USA: ACM, 2020: 322-330.

21
ZHOU K, YU H, ZHAO W X, et al. Filter-enhanced MLP is all you need for sequential recommendation[C]// Proceedings of the ACM Web Conference 2022. New York, USA: ACM, 2022: 2388-2399.

Outlines

/