留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于机器学习算法预测香蕉产量

黄思豪 王丽霞 刘永霞 姜成君 宋可欣 赵艳 何应对

黄思豪, 王丽霞, 刘永霞, 姜成君, 宋可欣, 赵艳, 何应对. 基于机器学习算法预测香蕉产量[J]. 热带生物学报, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031
引用本文: 黄思豪, 王丽霞, 刘永霞, 姜成君, 宋可欣, 赵艳, 何应对. 基于机器学习算法预测香蕉产量[J]. 热带生物学报, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031
HUANG Sihao, WANG Lixia, LIU Yongxia, JIANG Chengjun, SONG Kexin, ZHAO Yan, HE Yingdui. Banana yield prediction based on machine learning algorithm[J]. Journal of Tropical Biology, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031
Citation: HUANG Sihao, WANG Lixia, LIU Yongxia, JIANG Chengjun, SONG Kexin, ZHAO Yan, HE Yingdui. Banana yield prediction based on machine learning algorithm[J]. Journal of Tropical Biology, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031

基于机器学习算法预测香蕉产量

doi: 10.15886/j.cnki.rdswxb.20240031
基金项目: 

“中国热科院基本科研业务费专项”(1630092022001)

海南省重点研发项目“海南特色蕉自育新品种提质增效关键技术的研发与示范”(ZDYF2022XDNY270)

国家香蕉产业技术体系“三亚综合试验站”(CARS-31-25)

详细信息
    第一作者:

    黄思豪(1998-),男,海南大学热带农林学院硕士研究生。E-mail:1870168248@qq.com

    通信作者:

    赵艳(1981-),博士,副教授。研究方向:土壤肥力与养分资源管理。E-mail:yanbo315@126.com

    何应对(1981-),博士,副研究员。研究方向:养分代谢及综合管理。E-mail:heyingdui@itbb.org.cn

  • 中图分类号: S11+9;S606

Banana yield prediction based on machine learning algorithm

  • 摘要: 基于机器学习算法对皇帝蕉产量进行预测,明确最优预测模型及产量影响因素,为海南省澄迈县皇帝蕉的养分综合管理及产量预测等提供技术支撑。结合相关性分析和逐步回归分析法对输入变量进行筛选,然后采用随机森林(RF)、支持向量机(SVM)、K近邻(KNN)和人工神经网络(ANN)4种机器学习算法建立皇帝蕉产量预测模型,利用Shapley加法解释(SHAP)法解释模型,揭示影响皇帝蕉产量的主导因素,并量化分析其对产量的影响。结果表明:ANN模型预测性能最佳,R2为0.98,RMSE和MAE分别为0.16和0.10 kg·株-1,预测值基本无偏差。ANN模型在100样本数据量左右下误差已得到收敛,更小的成本也能获得优良预测效果。虽然SVM模型预测性能只是稍差于ANN模型,但其有欠拟合风险。KNN和RF模型预测性能欠佳,有过拟合问题,且在当前样本量下误差还没收敛。SHAP法对ANN模型预测结果解释是:速效钾、碱解氮、交换性钙、交换性镁是影响皇帝蕉产量的主导因素,当蕉园速效钾含量大于100 mg·kg-1,碱解氮含量大于100 mg·kg-1,交换性钙含量大于600 mg·kg-1,交换性镁含量大于60 mg·kg-1时对皇帝蕉产量起促进作用。在土壤交换性钙、镁缺乏时,增加土壤有效锰、有效锌的含量可能会缓解蕉园缺素胁迫。
  • [1] 曾鸿运,吴元立,黄秉智.中国香蕉育种研究进展[J]. 果树学报, 2023, 40(11):2446-2465.

    DOI: 10.13925/j.cnki.gsxb.20230151.
    [2] 梁张慧,吴宇军,刘绍钦,等.皇帝蕉优质高产高效栽培技术[J]. 广东农业科学, 2010, 37(9):79-80.
    [3] 王芳,谢江辉.我国香蕉产业“十三五”回顾与“十四五”展望[J]. 中国热带农业, 2022(3):15-22.
    [4] 刘雪红,吴坤林,陈国华,等.“金手指”香蕉的组织培养和快速繁殖[J]. 中国南方果树, 2006(1):34-35.
    [5] 冷张玲.“中国皇帝蕉之乡”-海南澄迈县[J]. 中国果菜, 2017, 37(8):83-84.
    [6] 唐文,李凯,李羽佳,等.优质绿色皇帝蕉栽培管理技术[J]. 分子植物育种, 2018, 16(8):2730-2735.
    [7] EVSTATIEV B I, GABROVSKA-EVSTATIEVA K G. A review on the methods for big data analysis in agriculture[C] //proceedings of the IOP Conference Series Materials Science and Engineering, 2021.
    [8] BENOS L, TAGARAKIS A C, DOLIAS G, et al. Machine Learning in Agriculture:a Comprehensive Updated Review[J]. Sensors(Basel, Switzerland), 2021, 21(11):3758-3812.
    [9] OLIVARES B O, VEGA A, CALDERÓN M A R, et al.Identification of Soil Properties Associated with the Incidence of Banana Wilt Using Supervised Methods[J]. Plants, 2022, 11(15):2070-2088.
    [10] ALABI T R, ADEWOPO J, DUKE O P, et al. Banana Mapping in Heterogenous Smallholder Farming Systems Using High-Resolution Remote Sensing Imagery and Machine Learning Models with Implications for Banana Bunchy Top Disease Surveillance[J]. Remote Sensing,2022, 14(20):5206-5227.
    [11] CHAUDHARI V, PATIL M P. Detection and Classification of Banana Leaf Disease Using Novel Segmentation and Ensemble Machine Learning Approach[J]. Applied Computer Systems, 2023, 28(1):92-99.
    [12] OLIVARES B O, CALERO J, REY J C, et al. Correlation of banana productivity levels and soil morphological properties using regularized optimal scaling regression[J]. Catena,2022, 208:105718-105728.
    [13] ANGELA V D S, ALFREDO B N, JHONATAN C P, et al. Artificial neural network modelling in the prediction of bananas'harvest[J]. Scientia Horticulturae, 2019,257:108724-108730.
    [14] CYNTHIA R. Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead[J]. Nature Machine Intelligence,2019, 1(5):206-215.
    [15] STROBL C, BOULESTEIX A-L, KNEIB T, et al.Conditional variable importance for random forests[J]. BMC bioinformatics, 2008, 9:1-11.
    [16] ALTMANN A, TOLOŞI L, SANDER O, et al. Permutation importance:a corrected feature importance measure[J]. Bioinformatics, 2010, 26(10):1340-1347.
    [17] PATRICK F, BRETT M W, R. W V, et al. Mid-season empirical cotton yield forecasts at fine resolutions using large yield mapping datasets and diverse spatial covariates[J]. Agricultural Systems, 2020, 184:102894-1028104.
    [18] SCOTT M L, LEE S-I. A unified approach to interpreting model predictions[C]; proceedings of the Proceedings of the 31st International Conference on Neural Information Processing Systems, Long Beach, California, USA, 2017.Curran Associates Inc.
    [19] SHAPLEY L S. A value for n-person games[J]. Contributions to the Theory of Games, 1953:1-15.
    [20] JONES E J, BISHOP T F A, MALONE B P, et al. Identifying causes of crop yield variability with interpretive machine learning[J]. Computers and Electronics in Agriculture, 2022, 192:106632-106641.
    [21] ATTIA A, GOVIND A, QURESHI A S, et al. Coupling Process-Based Models and Machine Learning Algorithms for Predicting Yield and Evapotranspiration of Maize in Arid Environments[J]. Water, 2022, 14(22):3647-3662.
    [22] 季鹏,袁星.基于多种机器学习模型的西北地区蒸散发模拟与趋势分析[J]. 大气科学学报, 2023, 46(1):69-81.
    [23] 袁雨珍,杜衍红,周燕敏.涡旋提取-电感耦合等离子体发射光谱(ICP-OES) 法测定酸性和中性土壤中交换性盐基总量[J]. 中国无机分析化学, 2023:13(2):1408-1413.
    [24] 唐碧玉,阳兆鸿,陈祝炳,等.超声浸提-电感耦合等离子体原子发射光谱内标法测定离子型稀土矿区土壤中有效硫[J]. 冶金分析, 2020, 40(3):57-61.
    [25] 陈波,马玲,王金云.电感耦合等离子体原子发射光谱法同时测定复垦土壤中有效铜、锌、铁、锰、硫的含量[J]. 理化检验-化学分册, 2022, 58(2):166-172.
    [26] BRAY M, HAN D W. Identification of support vector machines for runoff modelling[J]. Journal of Hydroinformatics, 2004, 6(4):265-280.
    [27] HOOGENBOOM G, PORTER C H, BOOTE K J, et al.The DSSAT crop modeling ecosystem[M]. America:Advances in crop modelling for a sustainable agriculture,2019.
    [28] SABAS P, SILAS M, ISAMBI M, et al. Time series and ensemble models to forecast banana crop yield in Tanzania, considering the effects of climate change[J]. Resources, Environment and Sustainability, 2023, 14:100138-100148.
    [29] OLIVARES B O, ANDRÉS V, RUEDA C M A, et al. Prediction of Banana Production Using Epidemiological Parameters of Black Sigatoka:An Application with Random Forest[J]. Sustainability, 2022, 14(21):14123-14123.
    [30] SOARES J D R, PASQUAL M, LACERDA W S, et al.Comparison of techniques used in the prediction of yield in banana plants[J]. Scientia Horticulturae, 2014, 167:84-90.
    [31] BARLIN O O, MIGUEL A A, CESAR A O, et al. Relationship Between Soil Properties and Banana Productivity in the Two Main Cultivation Areas in Venezuela[J]. Journal of Soil Science and Plant Nutrition, 2020, 20:2512-2524.
    [32] RAMEZANPOUR M R, FARAJPOUR M. Application of artificial neural networks and genetic algorithm to predict and optimize greenhouse banana fruit yield through nitrogen, potassium and magnesium[J]. PloS one, 2022,17(2):1-12.
    [33] KENNETH N. Diagnosis and management of nutrient constraints in bananas(Musa spp.) [J]. Fruit Crops, 2020,651-659.
    [34] 赵学强,潘贤章,马海艺,等.中国酸性土壤利用的科学问题与策略[J]. 土壤学报, 2023, 60(5):1248-1264.
  • [1] 王梦月, 康立, 赵平娟, 谢贵水, 刘钊, 张盈盈, 刘子凡, 安锋.  割面铝处理对橡胶树胶乳产量及生理参数的影响 . 热带生物学报, 2025, 16(): 1-10. doi: 10.15886/j.cnki.rdswxb.20240185
    [2] 陈媚, 张荣萍, 高玲, 刘迪发, 徐丽, 冯红玉, 赵亚南.  不同农用酵素对百香果品质及产量的影响 . 热带生物学报, 2025, 16(): 1-8. doi: 10.15886/j.cnki.rdswxb.20250008
    [3] 赵阳, 刘爽, 王志彪, 伍俊宇, 陈代朋, 郑丽.  香蕉枯萎病菌候选效应蛋白FoSSP80能抑制植物免疫反应 . 热带生物学报, 2025, 16(1): 87-97. doi: 10.15886/j.cnki.rdswxb.20240019
    [4] 张逸杰, 王思琦, 陆小静, 宋记明, 王睿, 曹敏, 张瑞, 王红刚, 吴金山.  木薯块根灰分和水分近红外光谱预测模型的构建与优化 . 热带生物学报, 2024, 15(3): 259-267. doi: 10.15886/j.cnki.rdswxb.20230031
    [5] 王田, 符俐盈, 赵阳, 刘爽, 张玉芳, 陈代朋, 郑丽.  香蕉枯萎病菌候选效应蛋白FoSSP20的鉴定和功能初探 . 热带生物学报, 2024, 15(1): 85-93. doi: 10.15886/j.cnki.rdswxb.20230045
    [6] 王庆萱, 阮云泽, 赵鹏飞.  基于因子-聚类分析的火龙果园土壤养分状况评价 . 热带生物学报, 2024, 15(2): 150-156. doi: 10.15886/j.cnki.rdswxb.20230078
    [7] 吕荣婷, 刘新月, 伍巧慧, 龚文坤, 王蓓蓓.  香蕉间作绿肥对土壤氮转化及叶片酶活性的影响 . 热带生物学报, 2024, 15(4): 407-413. doi: 10.15886/j.cnki.rdswxb.20240004
    [8] 周运陆, 张龙, 陈仕迁, 项再华, 孙鸿蕊, 符天锋, 张永发.  不同施镁水平对哈密瓜产量和品质的影响 . 热带生物学报, 2022, 13(5): 514-518. doi: 10.15886/j.cnki.rdswxb.2022.05.013
    [9] 李涛, 王猛, 李佳雪, 王周雯, 丁一, 胡文斌, 李洪立, 汤华.  火龙果果实与种子产量性状的相关性研究 . 热带生物学报, 2022, 13(3): 259-263. doi: 10.15886/j.cnki.rdswxb.2022.03.008
    [10] 冀春花, 黄艳艳, 杨红竹, 赵家连, 茶正早.  不同施肥处理下橡胶苗对土壤养分吸收和分配的化学计量特征 . 热带生物学报, 2022, 13(5): 519-523. doi: 10.15886/j.cnki.rdswxb.2022.05.014
    [11] 杜艳楠, 王萌, 马建强, 张宇, 梁晓宇.  植物病原真菌早期检测技术及其在橡胶树炭疽病预测预报中的应用 . 热带生物学报, 2021, 12(1): 124-131. doi: 10.15886/j.cnki.rdswxb.2021.01.018
    [12] 扶艳萍, 漆艳香, 谢艺贤, 彭军, 曾凡云, 张欣.  香蕉灰纹病的病原鉴定及其生物学特性 . 热带生物学报, 2021, 12(1): 63-71. doi: 10.15886/j.cnki.rdswxb.2021.01.009
    [13] 刘满意, 王禹童, 孙铭泽, 李荣, 王蓓蓓.  套作白三叶草对香蕉枯萎病发病率及土壤微生物群落的影响 . 热带生物学报, 2021, 12(2): 219-227. doi: 10.15886/j.cnki.rdswxb.2021.02.011
    [14] 孙鹏, 刘满意, 王蓓蓓.  香蕉秸秆不同还田模式对土壤微生物群落的影响 . 热带生物学报, 2021, 12(1): 57-62. doi: 10.15886/j.cnki.rdswxb.2021.01.008
    [15] 李炳韵, 程云飞, 唐浩真, 张晓波, 阮云泽, 王蓓蓓, 赵艳, 吕烈武, 王朝弼.  配施生物有机肥与无机肥对连作菠萝土壤的影响 . 热带生物学报, 2021, 12(2): 192-201. doi: 10.15886/j.cnki.rdswxb.2021.02.008
    [16] 程云飞, 李炳韵, 胡英宏, 赵艳, 阮云泽, 张晓波, 王蓓蓓, 吕烈武.  不同连作年限对菠萝园土壤养分及可培养微生物数量的影响 . 热带生物学报, 2021, 12(2): 185-191. doi: 10.15886/j.cnki.rdswxb.2021.02.007
    [17] 童璐, 成善汉, 居利香, 徐艺, 雷欣, 倪苗, 汪志伟, 朱国鹏, 陈艳丽.  赤霉素处理对芥蓝主侧薹产量和品质的影响 . 热带生物学报, 2020, 11(1): 7-10, 19. doi: 10.15886/j.cnki.rdswxb.2020.01.002
    [18] 符春敏, 尹黎燕, 邓燕, 兰超杰, 韩忠钰, 金鑫, 李长江, 黄家权.  施肥模式对菠萝产量及农田氧化亚氮排放的影响 . 热带生物学报, 2020, 11(3): 331-340. doi: 10.15886/j.cnki.rdswxb.2020.03.011
    [19] 梁峻玮, 曾凡云, 漆艳香, 彭军, 张欣, 谢培兰, 谢艺贤.  香蕉枯萎病菌4号生理小种中性海藻糖酶NTH1基因敲除和功能分析 . 热带生物学报, 2020, 11(2): 200-209, 216. doi: 10.15886/j.cnki.rdswxb.2020.02.010
    [20] 徐亚, 杨振, 李琼亮, 李新国.  2009—2018年国家自然科学基金资助香蕉相关研究的情况 . 热带生物学报, 2020, 11(4): 487-491. doi: 10.15886/j.cnki.rdswxb.2020.04.012
  • 加载中
  • 计量
    • 文章访问数:  13
    • HTML全文浏览量:  0
    • PDF下载量:  0
    • 被引次数: 0
    出版历程
    • 收稿日期:  2024-02-22
    • 修回日期:  2024-07-01
    • 刊出日期:  2025-03-15

    基于机器学习算法预测香蕉产量

    doi: 10.15886/j.cnki.rdswxb.20240031
      基金项目:

      “中国热科院基本科研业务费专项”(1630092022001)

      海南省重点研发项目“海南特色蕉自育新品种提质增效关键技术的研发与示范”(ZDYF2022XDNY270)

      国家香蕉产业技术体系“三亚综合试验站”(CARS-31-25)

      作者简介:

      黄思豪(1998-),男,海南大学热带农林学院硕士研究生。E-mail:1870168248@qq.com

      通讯作者: 赵艳(1981-),博士,副教授。研究方向:土壤肥力与养分资源管理。E-mail:yanbo315@126.com; 何应对(1981-),博士,副研究员。研究方向:养分代谢及综合管理。E-mail:heyingdui@itbb.org.cn
    • 中图分类号: S11+9;S606

    摘要: 基于机器学习算法对皇帝蕉产量进行预测,明确最优预测模型及产量影响因素,为海南省澄迈县皇帝蕉的养分综合管理及产量预测等提供技术支撑。结合相关性分析和逐步回归分析法对输入变量进行筛选,然后采用随机森林(RF)、支持向量机(SVM)、K近邻(KNN)和人工神经网络(ANN)4种机器学习算法建立皇帝蕉产量预测模型,利用Shapley加法解释(SHAP)法解释模型,揭示影响皇帝蕉产量的主导因素,并量化分析其对产量的影响。结果表明:ANN模型预测性能最佳,R2为0.98,RMSE和MAE分别为0.16和0.10 kg·株-1,预测值基本无偏差。ANN模型在100样本数据量左右下误差已得到收敛,更小的成本也能获得优良预测效果。虽然SVM模型预测性能只是稍差于ANN模型,但其有欠拟合风险。KNN和RF模型预测性能欠佳,有过拟合问题,且在当前样本量下误差还没收敛。SHAP法对ANN模型预测结果解释是:速效钾、碱解氮、交换性钙、交换性镁是影响皇帝蕉产量的主导因素,当蕉园速效钾含量大于100 mg·kg-1,碱解氮含量大于100 mg·kg-1,交换性钙含量大于600 mg·kg-1,交换性镁含量大于60 mg·kg-1时对皇帝蕉产量起促进作用。在土壤交换性钙、镁缺乏时,增加土壤有效锰、有效锌的含量可能会缓解蕉园缺素胁迫。

    English Abstract

    黄思豪, 王丽霞, 刘永霞, 姜成君, 宋可欣, 赵艳, 何应对. 基于机器学习算法预测香蕉产量[J]. 热带生物学报, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031
    引用本文: 黄思豪, 王丽霞, 刘永霞, 姜成君, 宋可欣, 赵艳, 何应对. 基于机器学习算法预测香蕉产量[J]. 热带生物学报, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031
    HUANG Sihao, WANG Lixia, LIU Yongxia, JIANG Chengjun, SONG Kexin, ZHAO Yan, HE Yingdui. Banana yield prediction based on machine learning algorithm[J]. Journal of Tropical Biology, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031
    Citation: HUANG Sihao, WANG Lixia, LIU Yongxia, JIANG Chengjun, SONG Kexin, ZHAO Yan, HE Yingdui. Banana yield prediction based on machine learning algorithm[J]. Journal of Tropical Biology, 2025, 16(1): 21-30. doi: 10.15886/j.cnki.rdswxb.20240031
    参考文献 (34)

    目录

      /

      返回文章
      返回