本期介绍浙江工商大学王海燕教授团队(第一作者:张寅升)发表在《中国食品学报》第24卷第10期特约专栏(人工智能+食品)上的文章《基于注意力机制的水果新鲜度检测可解释模型》。
1.研究背景
在当今快节奏的生活中,水果的新鲜度直接关系到公众健康和经济行为。准确评估水果的新鲜度不仅是消费者关心的问题,也是零售商和供应商关注的重点。目前,大多数传统方法是先进行人工设计特征提取后,再利用经典机器学习模型进行分类,虽然取得了一定的效果,但这些方法依赖于特定领域的专家知识,并且难以泛化或迁移到其它任务中。
近年来,随着计算机视觉技术的发展,基于深度学习的方法逐渐成为主流。特别是卷积神经网络(CNN),因其强大的特征自动提取能力而被广泛应用于图像识别任务中。本研究旨在通过引入注意力机制来增强深度学习模型对水果新鲜度特征信息的关注和提取能力,同时提高模型的可解释性和特征提取的有效性。
2.方法
本研究在ResNet34(34-layer residual network)主干网络中引入卷积注意力模块(Convolutional block attention module,CBAM),以实现水果新鲜度的检测,并利用类激活图(Class activation mapping,CAM)技术对于能够反映图片关键特征的像素进行热力图可视化,以评价模型的注意力导向。引入注意力机制旨在提升模型的泛化能力和可解释性。
3.结果
在青提公开数据集上开展案例研究。数据集包含新鲜和腐烂两类样本,共计1502张图片。试验结果显示,改进后的ResNet34-CBAM模型在多个评价指标上均有显著提升。ResNet34-CBAM准确率为99.71%,比ResNet34提高了3.01%,精确率提高了2.59%,召回率提高了2.59%,特异度提高了6.45%。
此外,通过对两种模型提取特征的能力对比发现,加入CBAM后的ResNet34能够更精准地聚焦于果实本身而非周围环境或边缘特征,这使得预测结果更加准确且更具有说服力。
4.结论
研究表明,在传统的深度学习架构中引入注意力机制可以有效提高机器视觉分类任务的表现。相比于未加改进的ResNet34,新的ResNet34-CBAM模型增强了模型的关键特征提取能力,提升了分类精度,并且具有更强的可解释性。后续有望将该方法拓展到其它食品对象的新鲜度检测和质量安全管理场景中。
原文链接:https://kns.cnki.net/kcms2/article/abstract?v=2iaLu-A-XVmLuy14RXLjTL8N3iY2NoyuBkXxn30jISErHliBYpagtC3ptAhVsPDgtEGzmQ2bVoSCPNX-r7v69bCl_q6fhc5xkAEKuevfGqeh-w8zP38h1Pz1iD471mZy215pfdszt2SIC5DA2NliZ6QGrNLMwng-e3CzQEXK_dI8y5xKy1IfrSn9ZLDFLXDf&uniplatform=NZKPT&language=CHS