有了深度学习模型后,菜价走势也变得清晰可见。
近日,北京市农业农村局官网公布了根据深度学习模型所预测的菜价结果。“白菜12月预测价格1.08元/公斤,预计同比升幅13%;白萝卜明年2月预测价格1.15元/公斤,同比升幅-20%。”
据此款菜价模型的研发人员介绍,这是一款深度学习模型,所有蔬菜品种误差值小于2元,大部分小于1元。“预测误差非常小,具有突破性”。接下来,他们将针对播种指数进行预测,让农民看到作物的已播种人数、面积等信息。
主要蔬菜品种2024年12月—2025年2月价格定量预测,以北京菜价为例。图/菜篮子市场信息公众号
【1】分析十多万条数据,预测菜价精确到几分钱
12月24日,九派新闻记者联系到中国农业科学院农业信息研究所农业大数据挖掘研究室主任崔运鹏研究员。
他表示,菜价预测由来已久。在国外,每个农产品都有专业的分析师预测价格走势。我国也有相关部门在做这件事。
九派新闻记者在网上检索发现,现有的菜价预测相对模糊,只体现“上升”“下降”以及“幅度大小”等总体趋势。而农科院给出的菜价预测,精确到变化幅度百分比,价格则精确到小数点后两位。
他认为,做菜价预测模型,既能保障农民的利益,又有助于稳产保供。对政府来说,可以提前调控哪些蔬菜适合投入市场。在理想情况下,普通民众能感受到的就是菜价稳定,生活物资充足。
目前,他们跟北京市数字农业农村促进中心合作,以北京市近20年的菜价数据为依据进行预测。后者也对预测数据进行了数月的验证和比对,整体误差比较小,除非有些特殊性预测不到,数据整体较为可信。
他们以周报或月报的形式告知公众,企业和农户都可以查询到价格信息。现在,其他省市也向他们咨询,希望开发本地版的“菜价预测大模型”。
【2】最大难点在于准确性,“好用的大模型是实践出来的”
崔运鹏认为,做这个模型最大的难点就是准确性。深度学习模型的核心要素是基础模型架构和数据,只要数据质量好,此模型可以化身为“长沙菜价预测”“武汉菜价预测”等版本。
怎么保证准确性呢?他说,首先要拿到数据,然后对数据进行清洗和加工,保证数据处于比较精良的状态。
他们处理过的数据约十多万条,这些数据会根据不同模型的特点被同步测试,得到最优结果。他们尝试的模型有几十种,常用的模型也有十几种,为了达到精确的目标,要不断优化模型,每一次加入新数据就重新学习一次,“可以说,模型就是越用越准”。
他认为,深度学习模型就是学习数据当中的规律,每个数据蕴含的规律可能不一样,需要不同的模型来判定。有的模型是单变量,有的模型是多变量。多变量虽然可能会更准确,但有时间限制。比如加入气象数据更能准确预测菜价,但可惜气象数据超过一周就不准确了。另外,获取困难的外生变量如果不准确,反而会对模型运行造成干扰。
崔运鹏说,接下来,他们一方面会测试多变量的模型,提高精准度。他们也将开发其他形式的模型,例如针对播种指数进行预测。播种指数可以让农民看到作物的已播种人数、面积等信息,为农民播种决策带来极大帮助。
他认为,各行各业的大模型越来越多,但是真正好用的大模型是实践出来的。想要做出符合国情的大模型,模型架构和高质量数据是关键。他们训练的深度模型不仅可以预测菜价,对于有规律的时间序列数据都可以进行预测,例如气象、旅游人数、用电量等等。
来源:九派新闻