据中国互联网络信息中心(CNNIC)发布的第49次《中国互联网络发展状况统计报告》显示,截至2021年12月我国网络购物用户规模达8.42亿,已经逐步占领消费市场,成为当今社会消费的主流。因此,对B2C电商公司而言,产品库存量预测是一种提高中心区域销售配送时效性的有效措施,不仅可以及时进行补货调节商品种类数量满足顾客购买需求,且能够降低库存成本,把握商品的市场需求,进而保障盈利。然而,仓库商品库存量的预测过程是一个信息不完全的动态过程,需要对商品的库存量进行动态的分析和决策。
目前已有的研究主要集中在仓库安全库存量、预测模型和线性回归组合模型在各领域的应用,李化,等
以上四种方法在产品市场预测中各有优劣,单一的预测方法对预测的精度影响比较大,需要对方法中的优势进行整合,投入到产品市场的预测中。
针对产品预测,国内研究多数聚焦在解决预测精度上,并且获得了很多研究成果。在仓库库存量的预测中,研究内容主要集中在仓库安全库存的研究上,利用的方法仅是线性回归方法,精度与实际存在较大差距。另外一部分研究主要集中在利用线性回归组合模型和其它预测模型对单一商品销售量进行预测,相比之下线性回归组合的预测精度明显高于单一预测模型。目前的研究中,较少有文献提及灰色线性回归组合模型在电商仓库库存量研究中的应用。
基于此,本文采用的灰色线性回归组合模型是一种将灰色模型GM(1,1)与线性回归模型组合的模型,以天为基准时间划分单位,用部分数据进行模型参数的计算。研究表明,该组合模型弥补了线性回归模型中没有指数增长趋势和灰色GM(1,1)模型中没有线性因素的不足,因此更适合用于既有线性趋势又有指数增长趋势的时间序列数据,用此组合模型来预测电商平台未来的商品销售量能够得到可信度较高的预测结果。
灰色线性回归组合模型
灰色预测模型在信息不完全或不对称情况下建立,并不关注数据中其他复杂的相互关系,只注重系统本身的白色信息,发现数据隐匿规律并利用已知、完全明确的白色信息,把系统灰色信息白色化,故将其用于商品销售量的预测具有可行性和一定的现实意义。灰色预测模型GM(1,1)建模所需样本数据少,只需四个以上的数据即可,且不要求数据有明显的数据特征,计算简便、易于掌握,模型的拟合精度较高。但GM(1,1)模型主要适用于单一的指数增长数据序列,对时间序列数据出现异常的情况往往无能为力。在目前实际应用中,大部分时间序列数据由于各种波动,预测结果偏差比较大。线性回归分析方法要考虑到各种影响因素,且要收集大量信息,会导致计算量增大,建模困难,尤其部分信息难以量化,难以确定模型参数,从而导致无法实现预测。为克服单一模型的缺陷,排除不确定因素的影响,本文将灰色模型和线性回归模型进行结合,构建灰色线性回归组合模型,对仓库商品销售量进行预测。
假定样本数据是一组具备线性趋势和指数趋势的数据,灰色线性回归组合模型是一种很好的数据预测模型,其建模过程一共分为六步,如图1所示。
根据流程制定具体的建模过程,如下:
(1)列出原始数据(k),该原始数据的要求是非负的时间序列。
(2)对销售数据一次累加生成新序列。将原始数据按顺序进行一次迭代累加排序,得到:
(3)按照传统GM(1,1)建模。对新序列数据建立一阶微分方程模型,其中a为发展系数,b为灰色作用变量。由此得到此微分方程的解:
为了表示方便,将此形式记为:
(4)灰色线性组合拟合累积。用指数方程、线性方程之和进行拟合累加,生成序列为:
其中,参数u、S1、S2、S3待定。
(5)确定组合模型参数。在此过程中需要确定参数u的值,设参数序列:
将式(2)带入得:
另设Qi(m)=y(m+i)-y(m),将式(3)带入得:
同样有:
利用式(5)与式(4)的比值取对数求解u,由于实际操作中Qi(m+1)与Qi(m)会出现0数据,而这在数学计算中是不被允许的,因此将0与1进行比较,重新取值后进行计算,得到u的计算公式如下:
取不同的i可得到不同的u值,计算个数为:
然后,以它们的平均值作为u的估计值u■,则估计值u■的计算公式为:
根据上面的公式确定参数S1、S2、S3的值,并利用最小二乘法求解估算值。
令:
则式(2)可变为:
令:
则有X(1)=AS,即:
(6)计算预测值。将式(7)和式(9)计算得出的参数值代入式(2),得出一次累加预测值,利用公式
本文选取某电商仓库2020-2021两年部分商品的销售数量及相关促销信息,一共有2 127 485条数据,数据已经过脱敏处理,数据格式见表2,数据中item_sku_id代表每个商品的编号,dc_id代表每个仓库的编号,date表示日期,quantity表示销售数量,vendibility表示库存量,1代表有库存,original_price表示处理后的原始价格,discount表示商品的折扣。数据中一共包含1 000种商品,并且每种商品在各仓库销量并不相同。由于电商“618”“双十一”优惠活动大于其余月份,则销量也高于其余月份,所以数据中已剔除6月和11月的销售量。通过剔除后数据对2022年1月的各个仓库每种商品的销售量进行预测。
由于原始数据分布没有一定的规律性,无法直接输入模型进行求解,因此必须对数据进行预处理。本文采取的预处理工具为Excel,处理步骤如下:
(1)商品分仓。对原始数据进行筛选,从0号仓到5号仓分别进行处理,得到分仓库数据。以0号仓为例,筛选后的数据格式见表3。
(2)时间排序。对分仓后的数据利用数据透视表按时间排序,列标签设置为商品序号,一共包括1 000种商品,行标签为时间,从2020年1月1日开始到2021年12月31日。处理后的数据部分效果见表4。
(3)得到模型矩阵。对表4中的数据进行处理,空白位置补0,并且除去行标签和列标签按年分别新建表格,存储为模型需要的1 000*305矩阵。部分矩阵形式见表5。
将上面处理好的矩阵导入到MATLAB中,依照模型构建过程中提出的算法编写MATLAB程序,采用程序分别运行上面的数据,进而预测2022年1月份的销售量。通过运行以上程序,得到0号仓库1月份1 000种商品预测销售量,结果显示为1 000*31的矩阵。由于矩阵显示不太直观,对结果矩阵进行编程转换,调用MATLAB程序对结果矩阵进行重新排序。
排序结束即可得到2022年1月0号仓库的销售量预测值,对数据进行统一处理,用date表示1月具体日期,dc_id表示所在仓库,item_sku_id表示商品编号,quantity表示当天销售数量。预测数据部分结果见表6。
利用上述分析方法截取数据中1号仓库2021年的数据预测12月的库存量,分别利用线性回归预测、灰色指数预测、灰色线性回归组合模型预测三种方法进行对比分析,对比结果见表7。
通过以上的预测结果对比可以发现,线性预测出现的结果误差最大,灰色预测出现的结果误差次之,组合模型预测的结果优于以上两种方法。灰色线性回归组合模型在电商仓库库存量预测中具有明显的优势,通过仓库商品的销售量数据对商品未来的库存量进行预测,可以进一步优化仓库库存管理。
本文基于需求预测对电商库存量进行研究,将灰色模型与线性回归模型组合建立灰色线性回归组合模型,通过模型对电商平台商品销售量进行预测,合理地预测下月的商品销售量,也可根据商品整年的销售情况,定期地进行备货,降低仓库库存费用,对优化仓库库存管理起到很好的指导作用。同时与常用方法对比发现,该模型简单易懂,操作方便,能够很大程度上降低预测难度,对于数据容量较大的数据批量处理时速度也比较快。模型在不考虑商品促销的情况下,可以广泛应用于大数据环境下的商品仓库库存量预测中。在今后的研究中,主要考虑打折因素、季节因素等多方面的促销信息,对该模型进行优化,进一步提高预测结果的拟合精度。
【本文标签】
【责任编辑】平文云仓