内容一览:联合国预测,2050年世界人口预计达到91亿,全球对粮食的需求量将增加70%。然而,由于世界农业发展不均衡,很多地区的粮食产量尚无法被准确统计,因此无法对这些区域的农业发展做出合理规划。现有的粮食产量统计方法则难以推广或是需要较高的科技水平。为此,京都大学的研究者通过卷积神经网络(CNN)对农田照片进行分析,高效准确地对当地的粮食产量进行了统计,为促进全球农业发展提供了新方法。
作者|雪菜
编辑|三羊
受人口增长、收入增加以及生物燃料广泛使用的影响,2050年全球对粮食的需求量将增加70%。
然而,由于全球气候变暖和生物多样性下降,世界各地粮食产量极易受环境变化影响,且区域间发展不均衡。
图1:2020年全球谷物产量地图
可以看到,中国、美国、印度和巴西是主要的产粮地,而南半球的粮食产量相对较低。而且,由于南半球的农业生产力较低,其粮食产量很难被准确统计。因此,我们很难对当地的农业生产力进行有效评估,更无法提供有效的增产手段。
目前有3种常用的粮食产量统计方法,包括自我汇报、实割实测和遥感统计。前两种方法很难大规模推广,而遥感技术的使用则会受到当地科技水平的制约。
为此,京都大学的研究者利用卷积神经网络(CNN),对实地拍摄的农田照片进行分析,进而对当地的粮食产量进行统计。结果显示,CNN模型可以对不同光照条件下的收割期和成熟后期的水稻产量进行迅速、准确的统计。这一成果已发表于《PlantPhenomics》。
论文链接:
实验过程
建立数据库:水稻冠层照片+粮食产量
研究人员在7个国家的20块农田中采集了水稻照片和粮食产量。水稻成熟后,用数码相机在水稻冠层上0.8至0.9米的高度,垂直向下拍摄,得到面积1m2水稻的RGB照片。
注:水稻的冠层是水稻枝叶稠密的顶层,是植物进行光合作用的主要部位。
实验中粮食产量为粗粒产量,包括水稻实粒和空粒的总重。统计得到的粮食产量在0.1t/ha(吨每公顷)和16.1t/ha之间,呈现正态分布,平均产量约5.8t/ha。
图2:水稻冠层图像及粮食产量分布
A:7个国家的粗粒产量分布;
B:不同国家平均粗粒产量饼状图;
C:粗粒产量最高的水稻图像;
D:粗粒产量最低的水稻图像。
产量预测:冠层照片+CNN→粮食产量
CNN模型、丢失函数和优化器使用Python语言和PyTorch框架进行部署。随后,研究人员通过组合不同的BatchSize和LearningRate,计算模型训练完成时的验证损失和相对均方根误差(rRMSE),得到了模型的最佳BatchSize(32)和LearningRate(0.0001)。
CNN模型在MainStream(MS)中有5个卷积层,BranchingStream(BS)中有4个卷积层。模型的池化层包括平均池化层(AveragePooling)和最大池化层(MaxPooling)。激活函数主要为整流线性单元(ReLU),在某些部分使用指数线性单元(ELU)。最后MS和BS汇合,通过ReLU层输出预估的粮食产量。
图3:CNN模型示意图
图4:CNN模型预测结果与GSD的关系
A:CNN模型的R2与验证集、测试集照片GSD的关系;
B:CNN模型预测产量与实际产量的散点图;
C&D:GSD为0.2cm/pixel和3.2cm/pixel的示意照片。
进一步的,研究人员用预测集的数据对CNN模型进行了测试。CNN模型可以分辨出在东京的高成(Takanari)水稻和越光(Koshihikari)水稻产量的差异,且预测数据接近实际数据。
图5:高成水稻和越光水稻的实际产量(A)和预测产量(B)
随后,团队对图片进行了遮挡,以探究CNN模型分析图片并预测粮食产量的机制。他们用灰色块遮挡了照片的特定区域,并计算了遮挡前后CNN模型预测产量的差值。
图6:遮挡实验示意图
A:遮挡前的照片;
B:遮挡后的照片;
C:照片不同区域对预测产量的权重。
于是,研究人员通过花序移除实验,验证了花序在产量预测中的作用。他们从每株水稻上摘下两个花序,拍照并统计粗粒产量,直到花序被全部摘下。
图7:花序移除实验及结果
A:花序移除实验示意图;
B:花序移除后的照片;
C:预计产量和实际产量折线图;
D:花序移除过程中预计产量和实际产量之间的关系。
随着花序数量减少,CNN模型的产量预测结果不断降低,最后降至1.6t/ha。这一实验说明,CNN模型主要是基于照片内花序的数量对粮食产量进行判断的。
照片的拍摄角度在20°-90°之间,测试间隔为10°。**结果显示,CNN模型的预测精度随拍照角度的增大而提高。**当拍摄误差为20°时,CNN模型的预测结果为-3.7-2.4t/ha。拍摄角度为60°时,预测误差在-0.45-2.44t/ha之间,与90°时的预测结果接近。
图8:拍摄角度测试及结果
A:拍摄角度实验示意图;
B:不同拍摄角度得到的照片;
C:不同拍摄角度照片预测产量与实际产量的差距。
最后,研究人员探究了拍摄时期对CNN模型预测结果的影响。在水稻50%抽穗之后,他们每周去农田收集照片,并用CNN模型进行分析。在水稻成熟初期,CNN模型的预测产量低于收获期的实际产量,因为此时花序尚未完全成熟。
图10:拍摄时期测试及结果
A:不同拍摄时期得到的照片,DAH代表抽穗后天数,DBH代表收割前天数;
智慧农业:AI助力农业规划
据联合国预测,2050年全球人口将达到约91亿。随着全球人口增长和收入提高,人们对于粮食的需求量也在不断增加。
同时,农业生产的集约化、数字化和智能化使粮食亩产量不断提高。2000年至2019年,全球农业用地面积降低了3%,而主要作物的产量增加了52%,水果蔬菜产量也增加了20%左右。
大型收割机、无人机等专业设备投入使用,使农户可以精准便捷地对自己的农田进行规划。大数据、物联网等技术帮助农户对农田状况实时感知,还能够对大棚内的环境进行自动调整。深度学习和大模型对天气的提前预测能够防范极端天气于未然,缓解传统农业「靠天吃饭」的难题。
图11:智慧农业系统示意图
然而,截至2021年,全球受饥饿影响的人数较前一年增加约4600万人,达到8.28亿。农业生产不均衡、体系不健全的问题依然存在,甚至更加突出。
在AI的帮助下,我们可以对当地的农业发展做出更好的规划,推动世界农业生产均衡发展,为解决全球饥饿问题交出一份满意的答卷。