留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于机器学习算法预测香蕉产量

黄思豪 王丽霞 刘永霞 姜成君 宋可欣 赵艳 何应对

黄思豪, 王丽霞, 刘永霞, 姜成君, 宋可欣, 赵艳, 何应对. 基于机器学习算法预测香蕉产量[J]. 热带生物学报, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031
引用本文: 黄思豪, 王丽霞, 刘永霞, 姜成君, 宋可欣, 赵艳, 何应对. 基于机器学习算法预测香蕉产量[J]. 热带生物学报, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031
HUANG Sihao, WANG Lixia, LIU Yongxia, JIANG Chengjun, SONG Kexin, ZHAO Yan, HE Yingdui. Banana yield prediction based on machine learning algorithm[J]. Journal of Tropical Biology, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031
Citation: HUANG Sihao, WANG Lixia, LIU Yongxia, JIANG Chengjun, SONG Kexin, ZHAO Yan, HE Yingdui. Banana yield prediction based on machine learning algorithm[J]. Journal of Tropical Biology, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031

基于机器学习算法预测香蕉产量

doi: 10.15886/j.cnki.rdswxb.20240031
基金项目: 

“中国热科院基本科研业务费专项”(1630092022001)

海南省重点研发项目“海南特色蕉自育新品种提质增效关键技术的研发与示范”(ZDYF2022XDNY270)

国家香蕉产业技术体系“三亚综合试验站”(CARS-31-25)

详细信息
    第一作者:

    黄思豪(1998-),男,海南大学热带农林学院硕士研究生。E-mail:1870168248@qq.com

    通信作者:

    赵艳(1981-),博士,副教授。研究方向:土壤肥力与养分资源管理。E-mail:yanbo315@126.com

    何应对(1981-),博士,副研究员。研究方向:养分代谢及综合管理。E-mail:heyingdui@itbb.org.cn

  • 中图分类号: S11+9;S606

Banana yield prediction based on machine learning algorithm

  • 摘要: 基于机器学习算法对皇帝蕉产量进行预测,明确最优预测模型及产量影响因素,为海南省澄迈县皇帝蕉的养分综合管理及产量预测等提供技术支撑。结合相关性分析和逐步回归分析法对输入变量进行筛选,然后采用随机森林(RF)、支持向量机(SVM)、K近邻(KNN)和人工神经网络(ANN)4种机器学习算法建立皇帝蕉产量预测模型,利用Shapley加法解释(SHAP)法解释模型,揭示影响皇帝蕉产量的主导因素,并量化分析其对产量的影响。结果表明:ANN模型预测性能最佳,R2为0.98,RMSE和MAE分别为0.16和0.10 kg·株-1,预测值基本无偏差。ANN模型在100样本数据量左右下误差已得到收敛,更小的成本也能获得优良预测效果。虽然SVM模型预测性能只是稍差于ANN模型,但其有欠拟合风险。KNN和RF模型预测性能欠佳,有过拟合问题,且在当前样本量下误差还没收敛。SHAP法对ANN模型预测结果解释是:速效钾、碱解氮、交换性钙、交换性镁是影响皇帝蕉产量的主导因素,当蕉园速效钾含量大于100 mg·kg-1,碱解氮含量大于100 mg·kg-1,交换性钙含量大于600 mg·kg-1,交换性镁含量大于60 mg·kg-1时对皇帝蕉产量起促进作用。在土壤交换性钙、镁缺乏时,增加土壤有效锰、有效锌的含量可能会缓解蕉园缺素胁迫。
  • [1] 曾鸿运,吴元立,黄秉智.中国香蕉育种研究进展[J]. 果树学报, 2023, 40(11):2446-2465.

    DOI: 10.13925/j.cnki.gsxb.20230151.
    [2] 梁张慧,吴宇军,刘绍钦,等.皇帝蕉优质高产高效栽培技术[J]. 广东农业科学, 2010, 37(9):79-80.
    [3] 王芳,谢江辉.我国香蕉产业“十三五”回顾与“十四五”展望[J]. 中国热带农业, 2022(3):15-22.
    [4] 刘雪红,吴坤林,陈国华,等.“金手指”香蕉的组织培养和快速繁殖[J]. 中国南方果树, 2006(1):34-35.
    [5] 冷张玲.“中国皇帝蕉之乡”-海南澄迈县[J]. 中国果菜, 2017, 37(8):83-84.
    [6] 唐文,李凯,李羽佳,等.优质绿色皇帝蕉栽培管理技术[J]. 分子植物育种, 2018, 16(8):2730-2735.
    [7] EVSTATIEV B I, GABROVSKA-EVSTATIEVA K G. A review on the methods for big data analysis in agriculture[C] //proceedings of the IOP Conference Series Materials Science and Engineering, 2021.
    [8] BENOS L, TAGARAKIS A C, DOLIAS G, et al. Machine Learning in Agriculture:a Comprehensive Updated Review[J]. Sensors(Basel, Switzerland), 2021, 21(11):3758-3812.
    [9] OLIVARES B O, VEGA A, CALDERÓN M A R, et al.Identification of Soil Properties Associated with the Incidence of Banana Wilt Using Supervised Methods[J]. Plants, 2022, 11(15):2070-2088.
    [10] ALABI T R, ADEWOPO J, DUKE O P, et al. Banana Mapping in Heterogenous Smallholder Farming Systems Using High-Resolution Remote Sensing Imagery and Machine Learning Models with Implications for Banana Bunchy Top Disease Surveillance[J]. Remote Sensing,2022, 14(20):5206-5227.
    [11] CHAUDHARI V, PATIL M P. Detection and Classification of Banana Leaf Disease Using Novel Segmentation and Ensemble Machine Learning Approach[J]. Applied Computer Systems, 2023, 28(1):92-99.
    [12] OLIVARES B O, CALERO J, REY J C, et al. Correlation of banana productivity levels and soil morphological properties using regularized optimal scaling regression[J]. Catena,2022, 208:105718-105728.
    [13] ANGELA V D S, ALFREDO B N, JHONATAN C P, et al. Artificial neural network modelling in the prediction of bananas'harvest[J]. Scientia Horticulturae, 2019,257:108724-108730.
    [14] CYNTHIA R. Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead[J]. Nature Machine Intelligence,2019, 1(5):206-215.
    [15] STROBL C, BOULESTEIX A-L, KNEIB T, et al.Conditional variable importance for random forests[J]. BMC bioinformatics, 2008, 9:1-11.
    [16] ALTMANN A, TOLOŞI L, SANDER O, et al. Permutation importance:a corrected feature importance measure[J]. Bioinformatics, 2010, 26(10):1340-1347.
    [17] PATRICK F, BRETT M W, R. W V, et al. Mid-season empirical cotton yield forecasts at fine resolutions using large yield mapping datasets and diverse spatial covariates[J]. Agricultural Systems, 2020, 184:102894-1028104.
    [18] SCOTT M L, LEE S-I. A unified approach to interpreting model predictions[C]; proceedings of the Proceedings of the 31st International Conference on Neural Information Processing Systems, Long Beach, California, USA, 2017.Curran Associates Inc.
    [19] SHAPLEY L S. A value for n-person games[J]. Contributions to the Theory of Games, 1953:1-15.
    [20] JONES E J, BISHOP T F A, MALONE B P, et al. Identifying causes of crop yield variability with interpretive machine learning[J]. Computers and Electronics in Agriculture, 2022, 192:106632-106641.
    [21] ATTIA A, GOVIND A, QURESHI A S, et al. Coupling Process-Based Models and Machine Learning Algorithms for Predicting Yield and Evapotranspiration of Maize in Arid Environments[J]. Water, 2022, 14(22):3647-3662.
    [22] 季鹏,袁星.基于多种机器学习模型的西北地区蒸散发模拟与趋势分析[J]. 大气科学学报, 2023, 46(1):69-81.
    [23] 袁雨珍,杜衍红,周燕敏.涡旋提取-电感耦合等离子体发射光谱(ICP-OES) 法测定酸性和中性土壤中交换性盐基总量[J]. 中国无机分析化学, 2023:13(2):1408-1413.
    [24] 唐碧玉,阳兆鸿,陈祝炳,等.超声浸提-电感耦合等离子体原子发射光谱内标法测定离子型稀土矿区土壤中有效硫[J]. 冶金分析, 2020, 40(3):57-61.
    [25] 陈波,马玲,王金云.电感耦合等离子体原子发射光谱法同时测定复垦土壤中有效铜、锌、铁、锰、硫的含量[J]. 理化检验-化学分册, 2022, 58(2):166-172.
    [26] BRAY M, HAN D W. Identification of support vector machines for runoff modelling[J]. Journal of Hydroinformatics, 2004, 6(4):265-280.
    [27] HOOGENBOOM G, PORTER C H, BOOTE K J, et al.The DSSAT crop modeling ecosystem[M]. America:Advances in crop modelling for a sustainable agriculture,2019.
    [28] SABAS P, SILAS M, ISAMBI M, et al. Time series and ensemble models to forecast banana crop yield in Tanzania, considering the effects of climate change[J]. Resources, Environment and Sustainability, 2023, 14:100138-100148.
    [29] OLIVARES B O, ANDRÉS V, RUEDA C M A, et al. Prediction of Banana Production Using Epidemiological Parameters of Black Sigatoka:An Application with Random Forest[J]. Sustainability, 2022, 14(21):14123-14123.
    [30] SOARES J D R, PASQUAL M, LACERDA W S, et al.Comparison of techniques used in the prediction of yield in banana plants[J]. Scientia Horticulturae, 2014, 167:84-90.
    [31] BARLIN O O, MIGUEL A A, CESAR A O, et al. Relationship Between Soil Properties and Banana Productivity in the Two Main Cultivation Areas in Venezuela[J]. Journal of Soil Science and Plant Nutrition, 2020, 20:2512-2524.
    [32] RAMEZANPOUR M R, FARAJPOUR M. Application of artificial neural networks and genetic algorithm to predict and optimize greenhouse banana fruit yield through nitrogen, potassium and magnesium[J]. PloS one, 2022,17(2):1-12.
    [33] KENNETH N. Diagnosis and management of nutrient constraints in bananas(Musa spp.) [J]. Fruit Crops, 2020,651-659.
    [34] 赵学强,潘贤章,马海艺,等.中国酸性土壤利用的科学问题与策略[J]. 土壤学报, 2023, 60(5):1248-1264.
  • [1] 赵阳, 刘爽, 王志彪, 伍俊宇, 陈代朋, 郑丽.  香蕉枯萎病菌候选效应蛋白FoSSP80能抑制植物免疫反应 . 热带生物学报, 2025, 16(1): 87-97. doi: 10.15886/j.cnki.rdswxb.20240019
    [2] 陆问, 徐文娴, 苏天燕, 于磊, 蒋亚敏, 鲁静丽, 刘文杰, 杨秋.  有机肥替代化学氮肥的不同比例对海南橡胶林土壤养分和酶活性的影响 . 热带生物学报, 2024, 15(6): 745-755. doi: 10.15886/j.cnki.rdswxb.20240007
    [3] 王庆萱, 阮云泽, 赵鹏飞.  基于因子-聚类分析的火龙果园土壤养分状况评价 . 热带生物学报, 2024, 15(2): 150-156. doi: 10.15886/j.cnki.rdswxb.20230078
    [4] 吕荣婷, 刘新月, 伍巧慧, 龚文坤, 王蓓蓓.  香蕉间作绿肥对土壤氮转化及叶片酶活性的影响 . 热带生物学报, 2024, 15(4): 407-413. doi: 10.15886/j.cnki.rdswxb.20240004
    [5] 李炳韵, 程云飞, 唐浩真, 张晓波, 阮云泽, 王蓓蓓, 赵艳, 吕烈武, 王朝弼.  配施生物有机肥与无机肥对连作菠萝土壤的影响 . 热带生物学报, 2021, 12(2): 192-201. doi: 10.15886/j.cnki.rdswxb.2021.02.008
    [6] 程云飞, 李炳韵, 胡英宏, 赵艳, 阮云泽, 张晓波, 王蓓蓓, 吕烈武.  不同连作年限对菠萝园土壤养分及可培养微生物数量的影响 . 热带生物学报, 2021, 12(2): 185-191. doi: 10.15886/j.cnki.rdswxb.2021.02.007
    [7] 徐亚, 杨振, 李琼亮, 李新国.  2009—2018年国家自然科学基金资助香蕉相关研究的情况 . 热带生物学报, 2020, 11(4): 487-491. doi: 10.15886/j.cnki.rdswxb.2020.04.012
    [8] 高刘, 余雪标, 李然, 杨青青, 崔喜博, 李思远, 王牌.  沼液配方肥对香蕉产量、品质及香蕉园土壤质量的影响 . 热带生物学报, 2017, 8(2): 209-215. doi: 10.15886/j.cnki.rdswxb.2017.02.014
    [9] 贺瑞, 彭赟, 刘扬, 曾灿彬, 徐敏, 齐钊, 闫臻, 骆娟, 阮云泽, 何朝族, 汤华.  低氮胁迫下香蕉硝酸盐转运蛋白MaNRT2基因的克隆与表达分析 . 热带生物学报, 2016, 7(1): 76-81. doi: 10.15886/j.cnki.rdswxb.2016.01.013
    [10] 彭赟, 龙海飞, 贺瑞, 徐敏, 曾灿彬, 骆娟, 齐钊, 闫臻, 阮云泽, 何朝族, 汤华.  香蕉miRNA及其靶基因的生物信息学预测 . 热带生物学报, 2016, 7(2): 237-245. doi: 10.15886/j.cnki.rdswxb.2016.02.017
    [11] 李佳潼, 黄绵佳, 吴岚芳, 张瑜文, 谢学立.  诱导香蕉离体叶片衰老过程转化酶基因和衰老基因的分子表达 . 热带生物学报, 2015, 6(4): 444-448. doi: 10.15886/j.cnki.rdswxb.2015.04.014
    [12] 黄旭, 王安邦, 苗红霞, 刘菊华, 贾彩红, 金志强, 徐碧玉.  香蕉辐射诱变抗寒株系果实中淀粉和糖含量的变化 . 热带生物学报, 2015, 6(3): 269-272. doi: 10.15886/j.cnki.rdswxb.2015.03.008
    [13] 赵惠, 周雪娟, 穆雷, 谢俊, 韦双双, 夏幽泉, 吴繁花, 阮云泽, 汤华.  香蕉愈伤组织诱导培养中褐化抑制剂的筛选 . 热带生物学报, 2014, 5(2): 127-131. doi: 10.15886/j.cnki.rdswxb.2014.02.012
    [14] 周开兵, 汤加燕, 洪常强, 何亚强, 邹露露.  9个香蕉品系在琼西北部产区的栽培表现 . 热带生物学报, 2013, 4(3): 236-241. doi: 10.15886/j.cnki.rdswxb.2013.03.011
    [15] 薛玉潇, 贾慧升, 王国芬, 刘磊, 黄俊生.  接种生防菌和病原菌对香蕉抗枯萎病的诱导 . 热带生物学报, 2012, 3(1): 62-65,68. doi: 10.15886/j.cnki.rdswxb.2012.01.007
    [16] 王亚, 谭昕, 汪军, 黄俊生.  体内定殖木霉H6对香蕉苗生长的影响 . 热带生物学报, 2012, 3(2): 142-146. doi: 10.15886/j.cnki.rdswxb.2012.02.015
    [17] 彭铁成, 徐芳, 罗静瑶, 陈云云, 汤华.  基于叶绿体基因的香蕉遗传多样性研究 . 热带生物学报, 2012, 3(4): 293-297. doi: 10.15886/j.cnki.rdswxb.2012.04.013
    [18] 王芳, 过建春.  香蕉专业合作社绩效评价研究 . 热带生物学报, 2011, 2(2): 178-186. doi: 10.15886/j.cnki.rdswxb.2011.02.004
    [19] 谢俊, 张旭一, 陈银华, 陈彩燕, 韦双双, 夏幽泉, 汤华.  香蕉枯萎病菌的分离鉴定与形态学研究 . 热带生物学报, 2010, 1(4): 337-341. doi: 10.15886/j.cnki.rdswxb.2010.04.010
    [20] 林明光, 刘福秀, 李伟东, 徐卫.  海南省香蕉作物病害调查与鉴定 . 热带生物学报, 2010, 1(1): 59-61. doi: 10.15886/j.cnki.rdswxb.2010.01.016
  • 加载中
  • 计量
    • 文章访问数:  39
    • HTML全文浏览量:  4
    • PDF下载量:  0
    • 被引次数: 0
    出版历程
    • 收稿日期:  2024-02-22
    • 修回日期:  2024-07-01
    • 刊出日期:  2025-03-15

    基于机器学习算法预测香蕉产量

    doi: 10.15886/j.cnki.rdswxb.20240031
      基金项目:

      “中国热科院基本科研业务费专项”(1630092022001)

      海南省重点研发项目“海南特色蕉自育新品种提质增效关键技术的研发与示范”(ZDYF2022XDNY270)

      国家香蕉产业技术体系“三亚综合试验站”(CARS-31-25)

      作者简介:

      黄思豪(1998-),男,海南大学热带农林学院硕士研究生。E-mail:1870168248@qq.com

      通讯作者: 赵艳(1981-),博士,副教授。研究方向:土壤肥力与养分资源管理。E-mail:yanbo315@126.com; 何应对(1981-),博士,副研究员。研究方向:养分代谢及综合管理。E-mail:heyingdui@itbb.org.cn
    • 中图分类号: S11+9;S606

    摘要: 基于机器学习算法对皇帝蕉产量进行预测,明确最优预测模型及产量影响因素,为海南省澄迈县皇帝蕉的养分综合管理及产量预测等提供技术支撑。结合相关性分析和逐步回归分析法对输入变量进行筛选,然后采用随机森林(RF)、支持向量机(SVM)、K近邻(KNN)和人工神经网络(ANN)4种机器学习算法建立皇帝蕉产量预测模型,利用Shapley加法解释(SHAP)法解释模型,揭示影响皇帝蕉产量的主导因素,并量化分析其对产量的影响。结果表明:ANN模型预测性能最佳,R2为0.98,RMSE和MAE分别为0.16和0.10 kg·株-1,预测值基本无偏差。ANN模型在100样本数据量左右下误差已得到收敛,更小的成本也能获得优良预测效果。虽然SVM模型预测性能只是稍差于ANN模型,但其有欠拟合风险。KNN和RF模型预测性能欠佳,有过拟合问题,且在当前样本量下误差还没收敛。SHAP法对ANN模型预测结果解释是:速效钾、碱解氮、交换性钙、交换性镁是影响皇帝蕉产量的主导因素,当蕉园速效钾含量大于100 mg·kg-1,碱解氮含量大于100 mg·kg-1,交换性钙含量大于600 mg·kg-1,交换性镁含量大于60 mg·kg-1时对皇帝蕉产量起促进作用。在土壤交换性钙、镁缺乏时,增加土壤有效锰、有效锌的含量可能会缓解蕉园缺素胁迫。

    English Abstract

    黄思豪, 王丽霞, 刘永霞, 姜成君, 宋可欣, 赵艳, 何应对. 基于机器学习算法预测香蕉产量[J]. 热带生物学报, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031
    引用本文: 黄思豪, 王丽霞, 刘永霞, 姜成君, 宋可欣, 赵艳, 何应对. 基于机器学习算法预测香蕉产量[J]. 热带生物学报, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031
    HUANG Sihao, WANG Lixia, LIU Yongxia, JIANG Chengjun, SONG Kexin, ZHAO Yan, HE Yingdui. Banana yield prediction based on machine learning algorithm[J]. Journal of Tropical Biology, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031
    Citation: HUANG Sihao, WANG Lixia, LIU Yongxia, JIANG Chengjun, SONG Kexin, ZHAO Yan, HE Yingdui. Banana yield prediction based on machine learning algorithm[J]. Journal of Tropical Biology, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031
    参考文献 (34)

    目录

      /

      返回文章
      返回