-
苦瓜(Momordica charantia)是重要的特色瓜类蔬菜作物,在亚洲及热带、亚热带地区广泛栽培,具有较高的商品价值和营养保健潜力,在功能食品开发中受到广泛关注[1]。在苦瓜育种与生产实践中,果实外观性状是品种选育和商品分级的重要依据,果皮颜色直接影响果实商品性和消费者接受度,是评价苦瓜品质的重要表型之一[2]。已有研究表明,不同苦瓜种质资源在果皮颜色上存在显著差异,为开展颜色性状的客观评价提供了材料基础[3]。因此,构建科学、客观且可重复的苦瓜果皮颜色的精准鉴定方法,对种质资源鉴定和育种应用具有重要意义。
植物果皮颜色是数量遗传性状且具有明确的遗传基础[4],但在实际鉴定评价中,仍主要依赖人工目测和经验判断,易受光照条件和主观因素影响,难以实现精准鉴定。为克服人工评价的局限,基于图像分析的果实表型测量方法逐渐受到关注。已有研究表明,利用图像信息提取果实颜色特征,并在CIE Lab颜色空间中进行分析,可有效提高不同品种间颜色差异识别的客观性和一致性[5]。由于Lab颜色空间具有良好的感知均匀性,其在颜色分类与评价研究中被广泛采用,为复杂颜色性状的定量分析提供了理论基础[6]。随着机器视觉和深度学习技术的发展,基于图像的果蔬外观表型智能识别逐渐成为精准农业研究的重要方向。有研究指出,卷积神经网络在果蔬外观表型识别中具有较高的应用潜力,为农业表型自动化分析提供了新思路[7]。基于AlexNet等网络结构的模型已成功用于蔬菜图像分类,并取得较高的识别精度[8]。有研究指出,传统CNN更擅长提取空间纹理特征,对颜色差异较小且连续变化的表型性状区分能力有限[9]。针对农业表型中普遍存在的多点测量或序列型特征,长短期记忆网络(LSTM)已被应用于作物表型和生理状态识别,并在连续特征建模方面展现出一定优势[10]。在水稻(Oryza sativa)和小麦(Triticum aestivum)等作物研究中,基于LSTM的模型已被证明适用于处理多特征或序列型农业数据[11]。然而,针对苦瓜果皮颜色的系统量化研究,尚缺乏颜色定量特征与深度学习模型相结合的精准鉴定评价体系。基于上述研究背景,本研究以田间条件下采集的苦瓜模型在苦瓜果皮颜色分类中的性能差异,并结合颜色标准化与色差量化方法,探索无需复杂模型即可获得稳定分类结果的评价路径,旨在建立一套客观、可重复且具有生物学意义的苦瓜果皮颜色精准鉴定评价体系,为苦瓜种质资源鉴定评价和育种材料利用提供技术支撑。
-
本试验图像采集设备为SONYα-7RII数码相机。程序开发与模型训练涉及本地计算设备与云端服务器,主要硬件配置如下:本地开发计算机处理器为Intel Core i7,内存为16 GB,操作系统为Windows10(64-bit);深度学习模型训练所用服务器配置GPU为NVIDIA GeForce RTX4090D(24 GB显存),CPU为Intel(R)Xeon(R)Platinum8474C(16 vCPU),操作系统为Ubuntu22.04。程序开发与数据分析所用软件为Python3.8.1、PyTorch2.5.1(CUDA 12.4)、R4.4.1及ImageJ1.8.0。程序设计中,图像处理与颜色特征提取由ImageJ完成;数据整理、可视化、传统机器学习模型(SVM、随机森林等)构建与分析在R语言环境中实现;一维卷积神经网络(CNN)与长短期记忆网络(LSTM)的搭建、训练及评估,基于PyTorch框架与Python完成。
-
供试材料为205份苦瓜核心种质资源,所有样本均种植于中国热带农业科学院热带作物品种资源研究所儋州五队蔬菜试验基地(经纬度:109.25°E-109.75°E,19.26°N-19.76°N),采用统一的栽培管理模式。试验分别于2个生长年度开展:第1年度于2023年12月播种定植,205份苦瓜种质资源种植于露地,果实生长期间进行套白色纸袋处理(白色防虫套袋为瓜类田间防治瓜实蝇的常规措施,主要用于防治瓜实蝇侵害。套袋处理对黄瓜果皮色泽无显著影响[12]),并于2024年4月在商品瓜期(未成熟)进行图像采集。第2年度于2024年12月播种定植,种植于塑料大棚内,果实生长期间未进行套白色纸袋处理,并于2025年4月进行商品瓜的图像采集。2次试验均在相近的生育期和成熟标准下完成图像采集,以保证数据的可比性。本研究基于图像颜色信息直接开展分析与模型训练,无论种质在不同年份间是否存在轻微颜色变化,均以实际采集图像为依据进行学习与识别,颜色波动不会影响模型训练与分类结果,保证了鉴定体系的可靠性。供试205份苦瓜种质商品瓜期果皮颜色类型丰富,包含7种颜色类别,表型多样性充足,可满足果皮颜色精准鉴定评价体系构建需求(图1)。
-
选择晴天上午7:00—10:00及下午16:00—18:00进行图像采集,该时段太阳高度角适中,光线强度稳定且柔和,可避免强光直射导致的果皮局部过曝或阴影畸变。采集时采用遮光板对果实进行漫反射处理,减少高光区域占比;统一使用SONYα-7RII相机,固定参数为ISO400、光圈f/8、快门速度1/500 s、白平衡(日光模式),镜头距果实垂直距离保持50 cm±1 cm,确保所有图像光学条件一致,降低采集环节的系统误差。
-
ImageJ作为一种成熟的开源图像分析软件,已被广泛应用于果蔬颜色等表型参数的提取与分析,在果蔬颜色分类与品质评价研究中具有良好的适用性和可靠性[12]。采用ImageJ软件对采集的苦瓜果实图像进行颜色特征提取。针对每张果实图像,在果皮表面选取30~40个避光测量点,测量点均匀分布于果皮上、中、下3个区域,并刻意避开果柄、病斑及机械损伤部位,以降低非目标区域对颜色测定结果的干扰。在此基础上,提取各测量点在CIE Lab颜色空间中的亮度(L*)、红绿色度(a*)和黄蓝色度(b*)参数(图2)。
为满足不同分析与建模需求,构建了2类数据集。第1类为颜色均值特征数据集:以2024年采集的205份苦瓜种质果皮颜色为研究对象,对每份苦瓜种质的所有测量点进行统计汇总,计算其L*、a*、b*的均值,形成以Lab均值为特征向量的样本数据集,该数据集主要用于传统机器学习模型的构建,以及结合K-means聚类与CIE ΔE色差公式建立并优化苦瓜果皮颜色的客观标准色体系,进一步利用2025年采集的205份种质的果皮颜色Lab均值数据作为独立验证集,用于检验颜色标准体系在不同年份条件下的稳定性与泛化能力;第2类为原始序列特征数据集:在不进行均值化处理的前提下,完整保留每个果实不同空间位置的颜色测量信息,并按照实际测量采集的先后顺序进行编号与排列,构建一维序列特征,不对空间位置进行额外排序处理,保证测量点覆盖果皮上、中、下3个区域。为保证序列模型输入维度的一致性,在实际采集的30~40个测量点中,统一选取前30个有效测量点构建30×3的特征矩阵。以2024年采集的205份样本为基础,通过对测量点组合方式进行扩展,构建用于CNN与LSTM模型训练的序列数据集;采用2025年采集的数据进行模型预测与验证,以评估深度学习模型在跨年份条件下的泛化性能。
-
数据预处理基于R 4.2.1软件平台完成,采用tidyverse包进行数据清洗与整理。通过逐样本核查机制剔除存在缺失值的数据,确保数据集完整性;统一变量命名规范,将亮度、红绿色度和黄蓝色度标准化为L、a、b 3个核心特征变量,并将人工标注的果皮颜色类别作为分类标签(共7类),构建标准化特征-标签体系,采用R中的ggplot2、scatterplot3d包对果皮颜色在Lab颜色空间中的分布情况进行可视化,为后续模型选择与参数优化提供依据。
-
基于颜色均值特征数据集,选取支持向量机(SVM)、随机森林(RF)、决策树(DT)、K近邻(KNN)及Softmax回归5种经典机器学习算法构建颜色分类模型。采用分层随机抽样方法将数据集按8︰2比例划分为训练集和测试集,确保不同数据子集中各颜色类别比例一致。模型超参数通过5折交叉验证进行优化,并以测试集分类准确率作为主要评价指标,构建基于颜色均值特征的分类性能基线[14]。
为提升分类标准的客观性、统一性与可重复性,解决人工颜色判读的主观性问题,引入基于统计学的颜色量化优化流程。首先利用Lab颜色空间的均匀性特征,采用K-means聚类算法对样本数据进行聚类分析,初步定位各类别的颜色中心坐标;随后采用CIE 1976ΔE公式[15]量化样本与标准色的感知差异,计算公式如下:
$$ {ΔE=}\sqrt{{{(}{{{L}}_{{1}}}-{{{L}}_{{2}}}{)}}^{{2}}+{{(}{{{a}}_{{1}}}-{{{a}}_{{2}}}{)}}^{{2}}+{{(}{{{b}}_{{1}}}-{{{b}}_{{2}}}{)}}^{{2}}} {,} $$ (1) 式中,$ {{L}}_{{1}} $,$ {{a}}_{{1}} $,$ {{b}}_{{1}} $和$ {{L}}_{{2}} $,$ {{a}}_{{2}} $,$ {{b}}_{{2}} $分别表示待测样本颜色、标准参考颜色的Lab值。量化每个样本与所属类别中心的色差距离,通过网格搜索算法对各类别的颜色中心值进行迭代优化。
-
卷积神经网络(CNN)能够通过多层卷积与池化操作自动提取图像特征,在果蔬分类与品质识别领域已得到广泛应用[8]。本研究以CNN模型作为深度学习对照模型,对果皮颜色进行分类识别。
为充分挖掘果皮颜色在空间分布上的序列特征,本研究在卷积神经网络模型基础上,引入长短期记忆网络(Long Short-Term Memory,LSTM)对苦瓜果皮颜色数据进行建模。LSTM是一种改进的循环神经网络结构,能够通过门控机制有效缓解传统RNN在长序列建模过程中易出现的梯度消失问题,已被广泛应用于农业表型时间序列与空间序列分析中[16]。在本研究中,将单个果实果皮上连续获取的30个测量点视为一维空间序列,每个测量点包含CIE Lab颜色空间中的L、a、b 3个特征值,从而构成一个30×3的输入矩阵。LSTM模型通过对相邻测量点颜色信息的递归学习,刻画果皮颜色在空间维度上的连续变化规律,实现对颜色类别的精准判别。对于时间步,LSTM单元的计算过程可表示为(2)~(7):
$$ {{f}}_{{t}}{=σ(}{{W}}_{{f}}{∙[}{{h}}_{{t}}{-1,}{{x}}_{{t}}{]+}{{b}}_{{f}}{)} {,} $$ (2) $$ {{i}}_{{t}}{=σ(}{{W}}_{{i}}{∙[}{{h}}_{{t}}{-1,}{{x}}_{{t}}{]+}{{b}}_{{i}}{)} {,} $$ (3) $$ {\tilde{{C}}}_{{t}}=\tan {h(}{{W}}_{{C}}{∙[}{{h}}_{{t}}{-1,}{{x}}_{{t}}{]+}{{b}}_{{C}}{)} {,} $$ (4) $$ {{C}}_{{t}}={{f}}_{{t}}{∙}{{C}}_{{t}}{-1+}{{i}}_{{t}}\cdot {\widetilde{{C}}}_{{t}}{} {,} $$ (6) $$ {{o}}_{{t}}{=σ(}{{W}}_{{o}}{∙[}{{h}}_{{t}}{-1,}{{x}}_{{t}}{]+}{{b}}_{{o}}{)} {,} $$ (7) $$ {{h}}_{{t}}={{o}}_{{t}}{∙}\tan {h(}{{C}}_{{t}}{)} {,} $$ (8) 如图3-A表示,$ {{x}}_{{t}} $表示第t个果皮测量点的输入特征向量(即Lab值),$ {{{\mathrm{h}}}}_{{t-1}} $和$ {\text{h}}_{{t}} $分别表示前一时间步与当前时间步的隐藏状态输出,$ {{C}}_{{t-1}} $和$ {{C}}_{{t}} $分别表示前一时间步与当前时间步的单元记忆状态;$ {{f}}_{{t}} $、$ {{i}}_{{t}} $和$ {{o}}_{{t}} $分别表示遗忘门、输入门和输出门的激活结果;$ {\sigma (\cdot)} $为Sigmoid激活函数,$ tan \text{h(∙)} $为双曲正切函数;$ {{W}}_{{f}} $、$ {{W}}_{i} $、$ {{W}}_{c} $、$ {{W}}_{o} $分别为遗忘门、输入门、候选记忆单元和输出门对应的权重矩阵,$ {{b}}_{{f}} $、$ {{b}}_{i} $、$ {{b}}_{c} $、$ {{b}}_{o} $为相应的偏置项。该门控结构使得LSTM能够在建模过程中动态保留对颜色判别具有贡献的关键测量点信息,同时削弱噪声点或局部异常值的影响,从而提高模型对果皮颜色类别的整体判别能力。如图3-B所示,将单个果实果皮上连续获取的30个颜色测量点视为一维空间序列(X1~X30),每个测量点包含CIE Lab颜色空间中的L、a、b 3个特征值。序列特征依次输入LSTM网络进行递归建模,最终通过全连接层(FC)输出果皮颜色类别(y)预测结果。
-
如图4-A所示,在以L–a、L–b及a–b为坐标轴的二维特征平面散点图中,白色与墨绿色的分布区分度较高,而浅绿色、绿色和黄绿色等相邻类别在局部区域存在明显重叠,表明苦瓜果皮颜色具有明显的连续性特征。图4-B显示,各颜色类别在三维空间中整体呈现一定的分层结构,与二维分析结果保持一致,但不同类别之间的空间边界并非完全清晰。
-
基于每份苦瓜种质果皮颜色的Lab均值特征,分别采用支持向量机(SVM)、随机森林(RF)、决策树(DT)、K近邻(KNN)及逻辑回归(Softmax)5种经典机器学习算法构建颜色分类模型。在205份样本的数据集上,各模型在独立测试集上的分类准确率如表1所示。结果表明,在仅使用单一颜色均值特征的条件下,SVM模型取得了最优分类效果,测试集准确率为73.68%。SVM在农业作物颜色或表型分类任务中被广泛用于中小样本条件下的特征判别,其在高维特征空间中构建最优分割超平面的能力,使其在颜色重叠度较高的样本中仍能保持较稳定的分类性能[17]。
表 1 传统机器学习模型分类性能对比
Table 1. Comparison of classification performance among traditional machine learning models
分类模型
Classification
models训练集准确率 /%
Training set
accuracy/%测试集准确率 /%
Test set accuracy/%SVM 73.49 73.68 RF 100.00 73.68 DT 70.48 71.05 KNN 75.30 68.42 Softmax 70.48 68.42 随机森林模型在训练集上达到100%的分类准确率,但在测试集上的性能明显下降,未表现出相应优势,表明模型存在明显的过拟合现象。决策树与KNN模型在测试集上的分类准确率相对较低,表明单一均值颜色特征对复杂颜色类别的判别能力有限。Softmax回归模型整体表现一般,进一步说明线性分类方法难以有效刻画苦瓜果皮颜色类别之间的非线性边界。
总体而言,传统机器学习模型在基于Lab均值特征的苦瓜果皮颜色分类任务中具有一定可行性,但其性能受限于特征表达能力,难以充分反映果皮颜色在空间分布上的细微差异。
-
为进一步提升苦瓜果皮颜色分类的准确性与稳定性,本研究引入K-means聚类与CIE 1976ΔE色差量化方法,对颜色分类标准进行系统优化。以2024年采集的205份样本为优化数据集,以各颜色类别的Lab均值作为初始标准值,在设定的参数浮动范围内对标准色进行迭代优化,并以分类准确率作为评价指标筛选最优参数组合。
在ΔE阈值设定为12的条件下,基于初始标准值的颜色匹配总体准确率为71.20%。经多轮参数迭代优化后,各颜色类别的标准Lab值逐步收敛,颜色分类准确率提升至76.47%。
在此基础上,将优化得到的标准色体系应用于2025年采集的同批205份苦瓜种质资源样本,作为独立验证集进行测试,在最终颜色判定阶段,当样本与标准色之间的ΔE≤12时,样本被归入对应的颜色类别,最终分类准确率达到76.09%,较优化阶段略有下降。该差异可能与两年试验在环境、光照条件等方面存在差异有关。然而,两阶段分类准确率整体水平接近,表明该颜色标准体系在跨年份数据集上仍具有较好的稳定性与泛化能力。
在ΔE = 12条件下获得的7种苦瓜果皮颜色标准色如表2所示。结果表明,通过构建并优化客观、可量化的颜色标准体系,在不依赖复杂机器学习模型的前提下,亦可实现较高且稳定的颜色分类效果,验证了基于ΔE色差的颜色标准化方法在苦瓜果皮颜色精准鉴定中的有效性与应用潜力。
表 2 ΔE阈值设定为12条件下构建的7种苦瓜果皮颜色标准色
Table 2. Standard colors of bitter gourd peel constructed under the condition of ΔE threshold set to 12
部位
PartLab 白色
White白绿色
White green黄绿色
Yellow green浅绿色
Light green绿色
Green深绿色
Heavy green墨绿色
Dark green果皮
PericarpL 79.99 69.54 62.99 63.44 50.03 41.90 33.96 a −6.40 −17.11 −25.41 −26.39 −29.50 −25.22 −15.56 b 14.95 28.52 43.22 39.19 38.74 27.52 14.64 -
基于保留空间测量信息构建的原始序列数据集,进一步采用卷积神经网络(CNN)模型开展苦瓜果皮颜色的分类研究。CNN模型在测试集上的分类准确率为65.85%,宏平均AUC值为
0.9261 。从模型训练过程曲线可以看出,测试损失由1.0255 降至0.8836 ;训练准确率由55.33%提升至58.04%,测试准确率由57.72%提升至65.85%,表明模型具备一定的学习能力,但整体性能提升幅度有限(图5)。
图 5 CNN模型在苦瓜果皮颜色分类任务中的训练与测试过程
Figure 5. Training and testing process of the CNN model in bitter melon peel color classification task
ROC曲线分析显示,不同颜色类别的分类性能存在明显差异。其中,墨绿色(AUC =
0.9843 )、白色(AUC =0.9797 )和深绿色(AUC =0.9659 )表现出较高的判别能力,而浅绿色类别的AUC值仅为0.8401 (图6)。
图 6 CNN模型在苦瓜果皮颜色分类任务中的ROC曲线
Figure 6. ROC curve of the CNN model in the bitter melon peel color classification task
混淆矩阵进一步揭示了模型的误差分布,浅绿色类别的召回率仅为48.39%,存在较多漏检;绿色类别精确率为50.00%,但召回率达到84.21%,表明存在较多误判。白色类别表现最佳,精确率达100.00%,F1-score为0.888 9(图7)。这些结果表明,CNN模型在处理颜色相似度较高的类别时,区分能力较弱。
-
LSTM模型在苦瓜果皮颜色分类任务中表现出较好的性能。训练过程曲线显示模型具有优秀的学习能力,训练损失从初始的
1.0274 快速下降至0.3456 ,测试损失从0.9615 降至0.6638 ;训练准确率从56.85%显著提升至86.13%,测试准确率由60.98%稳步提升,在最终Epoch200时达到76.42%,表明模型具有较好的泛化能力(图8)。在整个训练过程中,LSTM模型在测试集上获得的最佳分类准确率为82.11%。
图 8 LSTM模型在苦瓜果皮颜色分类任务中的训练与测试过程
Figure 8. Training and testing process of the LSTM model in bitter melon peel color classification task
ROC曲线分析表明所有颜色类别的AUC值均在
0.9229 以上,其中深绿色(AUC=0.9919 )、白绿色(AUC=0.9817 )和墨绿色(AUC=0.9786 )达到卓越分类水平,宏平均AUC值为0.9645 (图9)。
图 9 LSTM模型在苦瓜果皮颜色分类任务中的ROC曲线
Figure 9. ROC curve of the LSTM model in the bitter melon peel color classification task
混淆矩阵结果表明,LSTM模型在各类别上的分类性能更加均衡,深绿色类别的召回率达到100.00%,浅绿色类别的召回率由CNN模型的48.39%显著提升至80.65%,黄绿色类别的F1-score达到
0.7761 (图10)。 -
通过对比CNN与LSTM两种模型的分类性能,可以发现LSTM模型在整体分类效果上明显优于CNN模型。LSTM在测试集上的分类准确率、宏平均AUC以及宏平均F1-score均高于CNN,表明其在不同颜色类别上的综合判别能力和分类稳定性更强(表3)。
表 3 CNN与LSTM模型在苦瓜果皮颜色分类任务中的性能对比
Table 3. Comparison of classification performance between CNN and LSTM models for bitter melon peel color identification
评估指标
Evaluation indexCNN模型
CNN modelLSTM模型
LSTM model提升幅度
Improvement amplitude测试准确率
Test accuracy65.85% 82.11% +16.26% 宏平均AUC
Macro-average AUC0.9261 0.9645 +4.15% 宏平均F1-score
Macro-average F1-score0.6713 0.7892 +17.56% 从类别层面分析,LSTM模型在浅绿色、绿色等颜色连续性较强类别上的分类性能提升尤为明显,有效降低了相邻颜色类别之间的混淆现象。同时,在样本量相对较少的墨绿色和深绿色类别上,LSTM仍保持了较高的识别性能,体现出其在类别分布不均衡条件下较好的鲁棒性。
结合模型训练过程可以看出,LSTM在训练过程中测试性能提升更为显著,整体收敛过程较为稳定。上述结果表明,在保留果皮颜色空间测量序列信息的条件下,基于序列建模的LSTM模型能够更充分利用多测量点颜色信息,从而在苦瓜果皮颜色分类任务中取得更优的分类效果。
-
果实皮色作为重要的外观表型性状,在作物种质资源评价、品种鉴别及商品分级中被广泛应用。然而,从表型本质上看,果皮颜色并非严格离散的分类变量,而是一种连续变化的综合色度特征,其类别边界往往具有一定模糊性。这一特征已在多种果蔬作物中得到验证,如番木瓜[19]、猕猴桃[20]等果实在不同成熟阶段或品种间均表现出明显的颜色渐变现象。苦瓜果皮颜色从白色逐步过渡至墨绿色,尤其在绿色系内部呈现出连续分布特征,使得人工目测分级在主观性和一致性方面存在天然局限。因此,需要建立一种基于客观颜色分类参数的苦瓜果皮颜色精准评价方法,以降低人工判读的主观性,提高鉴定结果的一致性与可靠性。
本研究在Lab颜色空间中对苦瓜果皮颜色进行可视化分析,结果显示不同颜色类别在整体趋势上呈现由亮至暗、由浅至深的梯度变化,但浅绿色、绿色和黄绿色等相邻类别在局部区域存在明显重叠。这一结果从客观数据层面验证了人工初步分级的合理性,同时也揭示了仅依赖单一颜色阈值或经验判断难以实现苦瓜果皮颜色鉴定评价的精准性和一致性。因此,苦瓜果皮颜色精准鉴定的关键并非简单“划界”,而在于如何在连续表型背景下构建兼具区分能力与稳定性的评价体系。这一认识构成了本研究方法体系设计的逻辑起点。
基于颜色均值特征构建的SVM、随机森林、决策树、KNN及Softmax回归模型为果皮颜色分类提供了性能参考基线。其中,SVM模型在中小样本、低维特征条件下表现相对稳定[21],而随机森林模型在训练集与测试集间的性能差异提示其在样本规模有限时容易产生过拟合[22]。整体而言,传统机器学习方法更适合作为颜色分类的初步判别工具。
针对人工判读主观性强及模型可解释性不足的问题,本研究进一步构建了一套基于CIE ΔE色差的苦瓜果皮颜色标准化方法。通过对标准Lab值进行多轮迭代优化,在ΔE=12条件下形成了稳定的7类颜色标准,并在独立年份样本中取得了较为理想的分类效果。已有相关研究表明,色差阈值方法在果实成熟度判别[23]及颜色主导型产品质量评价[24]中具有较好的稳定性和可重复性,该方法更适合用于种质资源评价和颜色标准制定等应用场景。
近年来,计算机视觉与深度学习方法已被广泛应用于植物病害识别、果实外观表型分析及品质评价等研究领域,显示出在复杂图像特征自动提取方面的优势[26]。CNN模型在农产品外观品质识别领域已得到广泛应用,其优势通常依赖于颜色、纹理和形态等多维信息的综合表达[18]。本研究中,CNN模型在颜色差异较大的类别上取得了较好分类效果,但在浅绿色、绿色和黄绿色等颜色相近类别之间仍存在一定混淆。这一现象与已有研究中在核桃仁等颜色连续表型分析任务中的观察结果一致,即当类别主要由颜色渐变特征构成时,基于深度图像特征的模型在连续区间内的判别稳定性有限,而基于颜色阈值或标准化方法反而表现出更高的一致性[25]。
相比之下,LSTM模型在本研究中有效提升了苦瓜果皮颜色分类的整体性能。通过将果皮不同空间位置的颜色测量点构建为一维序列,LSTM能够有效建模颜色在空间分布上的依赖关系,从而更准确地区分连续变化的颜色类别。已有研究表明,LSTM在处理农业表型中的时序或空间序列数据方面具有明显优势,例如在小麦叶片水分含量检测中,PCA-LSTM模型能够有效捕捉多点测量数据之间的相关性[10];在蔬菜新鲜度与表型性状建模研究中,LSTM模型通过挖掘表型随时间变化的规律,显著提升了分类与预测精度[27]。本研究中LSTM模型通过对果皮不同空间位置颜色测量点的序列建模,有效降低了浅绿色、绿色与黄绿色等相邻类别之间的混淆现象,提高了绿色系内部颜色类别的区分度,进一步验证了序列建模方法在复杂颜色表型分析中的适用性。综合比较不同方法可以发现,面对样本规模受限且类别边界模糊的农业表型数据,单一模型往往难以兼顾精度与鲁棒性,多策略融合将成为未来发展的重要方向[28]。
在苦瓜育种实践与种质资源评价中,苦瓜果皮颜色不仅是重要的外观商品性状,也直接关系到市场分级与消费者选择偏好。在生产消费中,不同消费群体的需求不同,例如高端市场偏好白色或浅色系品种,而绿色至深绿色类型在大众市场应用更广泛。基于本研究构建的苦瓜果皮颜色精准鉴定评价体系,可在育种早期或材料筛选阶段,对大量材料的果皮颜色进行统一、可重复的量化评价,为颜色性状的定向选择提供客观依据;同时可与其他农艺性状指标结合,提高种质资源评价与分类的一致性,并作为人工目测分级的辅助工具。需要指出的是,无论是基于基于ΔE阈值的标准色方法还是LSTM模型,在颜色高度相近的个别样本中仍可能存在判别误差。本研究所构建的评价体系仍有进一步优化空间,后续可通过扩大样本规模、引入多环境和多种质数据,对模型进行持续训练和完善,进一步提升体系的分类精度与泛化能力。总体而言,该研究为苦瓜果皮颜色的精准鉴定评价体系构建提供了一种具有应用前景的研究框架,为连续性颜色表型的精准鉴定提供了一种可行思路。
-
本研究针对苦瓜果皮颜色这一典型连续性表型特征,构建了一套基于颜色标准化与序列深度学习相结合的精准鉴定评价体系。在固定阈值ΔE = 12条件下构建的果皮颜色标准体系具有良好的一致性与可解释性,适用于种质资源评价、颜色标准制定及多年份、多环境条件下的果皮颜色统一判定。在实际应用中,当样本与对应标准色之间的ΔE≤12时,可实现稳定且可重复的颜色类别归属判定,当样本与多个标准色的ΔE均满足阈值条件时,以ΔE值最小者对应的颜色类别作为最终判定结果,因其与标准色的颜色距离最近、匹配度最高。当相邻颜色类别间难以明确归类时,基于多测量点序列特征的LSTM模型可进一步提高判别的精细化水平,更适用于对分类精度要求较高的应用场景。
Construction of a precise identification and evaluation system for peel color in bitter melon (Momordica charantia)
-
摘要: 为构建基于图像分析与深度学习的苦瓜果皮颜色精准鉴定评价体系,本研究针对苦瓜果皮颜色这一典型连续性表型特征,构建了一套基于颜色标准化与序列深度学习相结合的鉴定评价体系。首先基于Lab颜色均值特征构建传统机器学习模型,基线分类准确率为73.68%;通过K-means聚类与CIE1976ΔE色差量化优化分类标准,将准确率提升至76.09%。进一步构建颜色序列数据集并对比CNN与LSTM模型,结果表明,LSTM模型可有效建模颜色序列依赖关系,最高分类准确率达82.11%,宏平均AUC为
0.9645 。研究表明,颜色标准化结合序列深度学习可有效应对颜色连续表型的分类难题。本研究提出的方法可为作物种质资源果皮颜色的高通量、精准鉴定评价提供了可靠的理论依据和技术参考。-
关键词:
- 苦瓜 /
- 果皮颜色 /
- 图像分析 /
- 长短期记忆网络(LSTM) /
- 卷积神经网络(CNN)
Abstract: To establish an accurate identification and evaluation system for bitter melon peel color based on image analysis and deep learning, peel color was used as a typical continuous phenotypic trait to develop an integrated system combining color standardization and sequential deep learning. A traditional machine learning model was constructed using Lab color mean features, yielding a baseline classification accuracy of 73.68%. By optimizing the classification criteria through K-means clustering and CIE1976 ΔE color difference quantification, the accuracy was improved to 76.09%. Furthermore, a color sequence dataset was established, and convolutional neural network (CNN) and long short-term memory (LSTM) models were compared. The results demonstrated that the LSTM model effectively captured the dependencies in color sequences, achieving a maximum classification accuracy of 82.11% and a macro-average AUC of 0.9645. These results indicate that the combination of color standardization and sequential deep learning can effectively address the classification challenges caused by continuous color phenotypes. The proposed method provides a reliable theoretical basis and technical reference for high-throughput and accurate identification of peel color in crop germplasm resources. -
图 6 CNN模型在苦瓜果皮颜色分类任务中的ROC曲线
注:曲线下方面积(AUC)用于评价各颜色类别的分类判别能力;DG:墨绿色,WG:白绿色,LG:浅绿色,HG:深绿色,WT:白色,GN:绿色,YG:黄绿色;Random 为随机分类器。下同。
Fig. 6 ROC curve of the CNN model in the bitter melon peel color classification task
Note: The area under the curve (AUC)is used to evaluate the classification discriminative ability for each color category;DG: Dark green, WG: White green, LG: Light green, HG: Heavy green, WT: White, GN: Green, YG: Yellow green; Random represents the random classifier.The same below.
图 7 CNN模型在测试集上的苦瓜果皮颜色分类混淆矩阵
注:矩阵中数值表示对应类别样本数量,颜色深浅表示样本数大小,颜色越深表示样本数越多。对角线元素代表被正确分类的样本,非对角线元素表示不同颜色类别之间的误判情况;DG:墨绿色,WG:白绿色,LG:浅绿色,HG:深绿色,WT:白色,GN:绿色,YG:黄绿色。下同。
Fig. 7 Confusion matrix of bitter melon peel color classification using the CNN model on the test set
Note: The values in the matrix indicate the number of samples for each category, and the color intensity reflects the sample size, with darker colors indicating more samples. Diagonal elements represent correctly classified samples, while off-diagonal elements indicate misclassification between different color categories. DG: Dark green; WG: White green; LG: Light green; HG: Heavy green; WT: White; GN: Green; YG: Yellow green. Similarly hereinafter.
表 1 传统机器学习模型分类性能对比
Table 1 Comparison of classification performance among traditional machine learning models
分类模型
Classification
models训练集准确率 /%
Training set
accuracy/%测试集准确率 /%
Test set accuracy/%SVM 73.49 73.68 RF 100.00 73.68 DT 70.48 71.05 KNN 75.30 68.42 Softmax 70.48 68.42 表 2 ΔE阈值设定为12条件下构建的7种苦瓜果皮颜色标准色
Table 2 Standard colors of bitter gourd peel constructed under the condition of ΔE threshold set to 12
部位
PartLab 白色
White白绿色
White green黄绿色
Yellow green浅绿色
Light green绿色
Green深绿色
Heavy green墨绿色
Dark green果皮
PericarpL 79.99 69.54 62.99 63.44 50.03 41.90 33.96 a −6.40 −17.11 −25.41 −26.39 −29.50 −25.22 −15.56 b 14.95 28.52 43.22 39.19 38.74 27.52 14.64 表 3 CNN与LSTM模型在苦瓜果皮颜色分类任务中的性能对比
Table 3 Comparison of classification performance between CNN and LSTM models for bitter melon peel color identification
评估指标
Evaluation indexCNN模型
CNN modelLSTM模型
LSTM model提升幅度
Improvement amplitude测试准确率
Test accuracy65.85% 82.11% +16.26% 宏平均AUC
Macro-average AUC0.9261 0.9645 +4.15% 宏平均F1-score
Macro-average F1-score0.6713 0.7892 +17.56% -
[1] 杨子涵, 胡烁苒, 朱会霞. 苦瓜功能成分的药用价值及研究进展[J]. 中国瓜菜, 2025, 38(9): 9−14. https://doi.org/10.16861/j.cnki.zggc.2025.0055 doi: 10.16861/j.cnki.zggc.2025.0055 [2] 孙凯, 王娜, 程艳, 等. 苦瓜育种方法的研究现状及展望[J]. 吉林农业, 2017(15): 72−73. https://doi.org/10.14025/j.cnki.jlny.2017.15.031 doi: 10.14025/j.cnki.jlny.2017.15.031 [3] 李丽琼, 阳世莹, 麻继仙, 等. 85份苦瓜种质资源农艺性状的遗传多样性分析[J]. 西南农业学报, 2023, 36(12): 2621−2630. https://doi.org/10.16213/j.cnki.scjas.2023.12.006 doi: 10.16213/j.cnki.scjas.2023.12.006 [4] Huang H Y, Hsieh C H. Genetic research on fruit color traits of the bitter gourd (Momordica charantia L. ) [J]. The Horticulture Journal, 2017, 86(2): 238−243. https://doi.org/10.2503/hortj.MI-159 doi: 10.2503/hortj.MI-159 [5] Yoshioka Y, Fukino N. Image-based phenotyping: use of colour signature in evaluation of melon fruit colour [J]. Euphytica, 2010, 171(3): 409−416. https://doi.org/10.1007/s10681-009-0071-9 doi: 10.1007/s10681-009-0071-9 [6] 吴俊雄. 基于Lab颜色空间的分类器研究与设计[J]. 北京信息科技大学学报(自然科学版), 2021, 36(1): 93−96. https://doi.org/10.16508/j.cnki.11-5866/n.2021.01.018 doi: 10.16508/j.cnki.11-5866/n.2021.01.018 [7] Qiu D K, Guo T H, Yu S Q, et al. Classification of apple color and deformity using machine vision combined with CNN [J]. Agriculture, 2024, 14(7): 978. https://doi.org/10.3390/agriculture14070978 doi: 10.3390/agriculture14070978 [8] Zhu L, Li Z B, Li C, et al. High performance vegetable classification from images based on AlexNet deep learning model [J]. International Journal of Agricultural and Biological Engineering, 2018, 11(4): 217−223. https://doi.org/10.25165/j.ijabe.20181104.2690 doi: 10.25165/j.ijabe.20181104.2690 [9] 李伟, 黄鹤鸣, 武风英, 等. 基于深度多特征融合的自适应CNN图像分类算法[J]. 计算机工程, 2021, 47(9): 235−239. https://doi.org/10.19678/j.issn.1000-3428.0058387 doi: 10.19678/j.issn.1000-3428.0058387 [10] 赵东东, 赵雅丽, 赵秉强, 等. 基于PCA-LSTM小麦叶片水分检测研究[J]. 中国农机化学报, 2019, 40(3): 154−158. https://doi.org/10.13733/j.jcam.issn.2095-5553.2019.03.28 doi: 10.13733/j.jcam.issn.2095-5553.2019.03.28 [11] Dubey R K, Choubey D K. Adaptive feature selection with deep learning MBi-LSTM model based paddy plant leaf disease classification [J]. Multimedia Tools and Applications, 2023, 83(9): 25543−25571. https://doi.org/10.1007/s11042-023-16475-7 doi: 10.1007/s11042-023-16475-7 [12] 侯田莹, 王福东, 郑淑芳. 套袋对黄瓜产量和品质的影响及经济效益分析[J]. 北方园艺, 2011(1): 32−35. [13] Lino A C L, Sanches J, Dal Fabbro I M. Image processing techniques for lemons and tomatoes classification [J]. Bragantia, 2008, 67(3): 785−789. https://doi.org/10.1590/S0006-87052008000300029 doi: 10.1590/S0006-87052008000300029 [14] Ropelewska E, Rady A M, Watson N J. Apricot stone classification using image analysis and machine learning [J]. Sustainability, 2023, 15(12): 9259. https://doi.org/10.3390/su15129259 doi: 10.3390/su15129259 [15] 任凯丽, 孔维萍, 唐桃霞, 等. 基于Lab表色系统的甜瓜果实颜色多样性分析[J]. 园艺学报, 2022, 49(9): 2017−2022. https://doi.org/10.16420/j.issn.0513-353x.2021-0601 doi: 10.16420/j.issn.0513-353x.2021-0601 [16] Jia Z H, Liu Y H, Xiao H W. Deep learning prediction of moisture and color kinetics of apple slices by long short-term memory as affected by blanching and hot-air drying conditions [J]. Processes, 2024, 12(8): 1724. https://doi.org/10.3390/pr12081724 doi: 10.3390/pr12081724 [17] Peng H X, Shao Y Y, Chen K Y, et al. Research on multi-class fruits recognition based on machine vision and SVM [J]. IFAC-PapersOnLine, 2018, 51(17): 817−821. https://doi.org/10.1016/j.ifacol.2018.08.094 doi: 10.1016/j.ifacol.2018.08.094 [18] 李鑫. 基于深度学习的农产品品质识别研究[D]. 北京: 北京印刷学院, 2025. https://doi.org/10.26968/d.cnki.gbjyc.2025.000004 [19] 何应对, 井涛, 王丽霞, 等. 番木瓜贮藏期果实品质及果皮色素的变化[J]. 热带生物学报, 2016, 7(3): 332−337. https://doi.org/10.15886/j.cnki.rdswxb.2016.03.009 doi: 10.15886/j.cnki.rdswxb.2016.03.009 [20] 郝明星. 基于猕猴桃果皮颜色的分级方法及品质评价[D]. 咸阳: 西北农林科技大学, 2025. https://doi.org/10.27409/d.cnki.gxbnu.2025.002747 [21] Patel A K, Chatterjee S, Gorai A K. Development of machine vision-based ore classification model using support vector machine (SVM) algorithm [J]. Arabian Journal of Geosciences, 2017, 10(5): 107. https://doi.org/10.1007/s12517-017-2909-0 doi: 10.1007/s12517-017-2909-0 [22] 张毅. 基于表型检测与机器学习的西瓜幼苗弱苗早期识别研究[D]. 武汉: 华中农业大学, 2023. https://doi.org/10.27158/d.cnki.ghznu.2023.000796 [23] Costa A G, de Sousa D A G, Paes J L, et al. Classification of Robusta coffee fruits at different maturation stages using colorimetric characteristics [J]. Engenharia Agrícola, 2020, 40(4): 518−525. https://doi.org/10.1590/1809-4430-eng.agric.v40n4p518-525/2020 doi: 10.1590/1809-4430-eng.agric.v40n4p518-525/2020 [24] 蒋存波, 贾猛, 李昕烨, 等. 基于珍珠数字图像的颜色特征提取及检测方法研究[J]. 电子测量技术, 2023, 46(4): 137−141. https://doi.org/10.19651/j.cnki.emt.2210440 doi: 10.19651/j.cnki.emt.2210440 [25] Lee S H, McDowell S, Leslie C, et al. Comparison of Mask-R-CNN and thresholding-based segmentation for high-throughput phenotyping of walnut kernel color [J]. Plants, 2025, 14(21): 3335. https://doi.org/10.3390/plants14213335 doi: 10.3390/plants14213335 [26] 孙亮, 柯宇航, 刘辉, 等. 计算机视觉技术在植物病害识别上的研究进展[J]. 热带生物学报, 2022, 13(6): 651−658. https://doi.org/10.15886/j.cnki.rdswxb.2022.06.016 doi: 10.15886/j.cnki.rdswxb.2022.06.016 [27] 何梦雨. 基于光谱成像技术和深度学习的蔬菜新鲜度诊断方法和模型应用[D]. 湖州: 湖州师范学院, 2024. doi: 10.27946/d.cnki.ghzsf.2024.000101 [28] Zhang R J, Liu Q F. Learning with few samples in deep learning for image classification, a mini-review [J]. Frontiers in Computational Neuroscience, 2023, 16: 1075294. https://doi.org/10.3389/fncom.2022.1075294 doi: 10.3389/fncom.2022.1075294 -
点击查看大图
计量
- 文章访问数: 7
- HTML全文浏览量: 6
- 被引次数: 0
下载: