2023年数学建模C题论文及处理数据代码
注:代码过多,因此需要处理数据代码请私聊博主
一、问题重述
1.1问题背景
由于蔬菜类商品品种繁多,产地不同,生鲜商超一般在凌晨3:00-4:00进行蔬菜的进货交易。但是,蔬菜类产品具有易腐烂的特点,在规定时间内卖不出去,这些蔬菜就会发生变质损耗[1]。由此,生鲜商超可能会在不知具体单品和批发价格的情况下,对当天的各蔬菜品类进行补货,这会大大提高生鲜超市的成本。成本加成定价法是商超对蔬菜进行定价的常用方法,生鲜商超一般会对运输损坏以及新鲜度降低的蔬菜类商品进行打折销售。
1.2问题重述
蔬菜类商品的销售量与时间可能存在关联关系,同时商超销售空间的限制也会对蔬菜类商品的销售量产生影响,因此制定合理的销售组合十分重要。附件1为某商超销售的6个蔬菜品类的商品信息;附件2和附件3为商超从2020年7月1日至2023年6月30日各蔬菜商品的销售明细以及批发价格数据。附件4为各蔬菜商品近期损耗率数据。根据上述信息,我们需要解决以下四个问题:
问题一:根据附件数据,分析蔬菜各品类销售量以及单品销售量的分布规律和相关性。
问题二:当商超以品类为单位进行补货时,根据附件中数据,分析各蔬菜品类的销售总量和成本加成定价之间的关系。为使商超的收益最大,制定各蔬菜商品品类在2023年7月1日至7月7日的日补货总量以及定价决策。
问题三:当商超以单品为单位进行补货时,为使商超收益最大化,在尽量满足市场对各品类蔬菜商品需求的前提下,根据2023年6月24-30日的可售单品,制定7月1日的单品补货量和定价决策。补货要求如下:
- 可售单品总数为27-33个。
(2)每个单品订购量达到最小陈列量2.5千克的要求。
问题四:写出为使商超制定更好的补货和定价决策而需要采集的其他相关数据,并给出理由解释这些数据对解决上述问题的帮助。
二、问题分析
本文主要研究蔬菜类商品由于损耗而产生的补货决策以及定价策略。我们首先需要对数据进行预处理,需要将附件2中的单品编码与附件1中的单品名称以及分类名称相对应。
2.1问题一的分析
我们需要描述蔬菜各品类销售量以及单品销售量的分布规律和相互关系。首先我们分析蔬菜各品类销售量的分布规律和相互关系,将日期划分为2020年7月1日至2021年6月30日,2021年7月1日至2022年6月30日,2022年7月1日至2023年6月30日这三个阶段,然后再将这三个阶段分别划分为52周。之后我们可以通过处理后的数据计算每个蔬菜单品每一周的销售量,继而我们可以计算每个品类每一周的销售量。最后绘制每个阶段蔬菜各品类周销售量与时间(以周为单位)的分布图,得出分布规律。由于销售量为定量数据,因此可以对六种蔬菜品类的销售量进行Pearson相关性分析,得出六种蔬菜品类销售量之间的相关性。
蔬菜单品种类繁多,我们可以选择蔬菜各品类中具有代表性的蔬菜单品进行分布规律与相关关系的分析。首先我们可以对每个蔬菜品类中蔬菜单品的销售量进行排序,得出每个蔬菜品类中销售量最大的销售单品,绘制每一阶段这六个蔬菜单品的周销售量与时间(以周为单位)的分布图,得出分布规律。对这六种蔬菜单品的销售量进行Pearson相关性分析,得出六种蔬菜单品销售量之间的相关性。
2.2问题二的分析
对本题第一小问我们需要分析各蔬菜品类的销售总量和成本加成定价之间的关系,首先需要确定各蔬菜品类的当日销售价格,由于各蔬菜品类所包含的蔬菜单品数量众多,每个蔬菜单品的当日销售价格均不同,因此可以根据题目给出的2020年7月1日至2023年6月30日的蔬菜单品销售价格,计算各蔬菜品类的当日销售价格。将求出的各蔬菜品类的当日平均销售价格与各蔬菜品类的日销售总量进行最小二乘回归分析,得出各蔬菜品类的销售总量和成本加成定价之间的关系。
对本题第二小问我们需要制定各蔬菜商品品类在2023年7月1日至7月7日的日补货总量以及定价决策。首先,蔬菜类商品的销售量与时间可能存在一定关联关系,因此考虑使用时间序列模型来预测各蔬菜商品品类在2023年7月1日至7月7日的日补货总量。商超利润与各蔬菜品类的日补货量,日批发成本,日损耗率有关。使用时间序列将各蔬菜品类的日批发价进行预测,再根据销售总量和成本加成定价之间的关系建立利润关于定价的优化模型。
2.3问题三的分析
本题需要根据附件中数据,按照已知要求制定2023年7月1日的单品补货量和定价决策。首先需要对数据进行筛选,题目要求根据2023年6月24日至30日的可售单品进行补货与定价,筛选出2023年6月24日至30日所有可售单品以及计算这些单品的日销售总量,然后根据这些销售单品的日销售总量预测2023年7月1日这些单品的日补货量,引入0-1变量使所有可售单品总数的和符合题目要求,最后建立商超利益最大化模型。
2.4问题四的分析
本题是对问题二与问题三的完善,我们需要为商超更好的制定补货和定价策略提出建议,我们可以从影响补货和定价的因素出发,并对其进行解释。
三、模型假设
1.假设蔬菜的损耗仅发生在进货物流过程中。
2.假设所有蔬菜的定价方法采用成本加成定价法。
3.假设不同供货源的蔬菜质量无明显差异。
4. 假设2023年7月1-7日蔬菜损耗率不变。
四、符号说明
符号 |
意义 |
单位 |
i |
令i=1表示水生根茎,i=2表示花菜,i=3表示花叶,i=4表示辣椒,i=5表示茄,i=6表示食用菌,i=1,2,…6 |
|
j |
表示7月j日,j=1,2,…,7 |
|
aij | i类蔬菜的2023年7月j日日补货量 |
kg |
bij | i类蔬菜的2023年7月j日日批发价格 |
元/kg |
cij | i类蔬菜的2023年7月j日日损耗率 |
|
yij | i类蔬菜的2023年7月j日日销售总量 |
kg |
xij | i类蔬菜的2023年7月j日日销售价格 |
元 |
yi | i类蔬菜日销售总量 |
kg |
xi | i类蔬菜当日销售价格 |
元 |
Am | 第m种蔬菜单品7月1日补货量,m=1,2,…,42 |
kg |
Bm | 第m种蔬菜单品7月1日批发价格m=1,2,…,42 |
元/kg |
Cm | 第m种蔬菜单品7月1日损耗率m=1,2,…,42 |
|
Xm | 第m种蔬菜单品7月1日销售价格m=1,2,…,42 |
元 |
Ym | 第m种蔬菜单品7月1日销售总量m=1,2,…,42 |
kg |
Hm | 0-1变量,m=1,2,…,42 |
|
W |
商超利润 |
元 |
五、模型建立与求解
5.1问题一模型的建立与求解
5.1.1 数据预处理
由于附件1表示单品编码所对应的单品名称和品类名称,为使附件2中数据能够直观表示销售蔬菜的单品名称以及品类名称,可以使用Python将附件2中的单品编码与附件1中单品编码所对应的单品名称和品类名称一一对应,整合得到单品名称和品类名称两列。之后将相同销售日期的单品的销量求和可得到各蔬菜单品的日销售量,将日期划分为2020年7月1日至2021年6月30日,2021年7月1日至2022年6月30日,2022年7月1日至2023年6月30日这三个阶段,再将这三个阶段分别划分为52周,最后计算各个单品和各个品类的周销售量以及各个单品的总销售量及销售占比。
(一)品类。。。。。。
5.1.2 蔬菜各品类销售量分布规律
(1)第一年水生根茎类
(2)其余5个品类个、
根据上述数据处理,可以得到各个品类的周销售量,使用Python软件绘制在,2021年7月1日至2022年6月30日,2022年7月1日至2023年6月30日这三个阶段六种蔬菜品类的周销售量与时间的折线图。(在此列出一部分折线图,具体六种蔬菜品类的周销售量与时间的折线图见支撑材料)
图1:水生根茎类
由图1可知,水生根茎类蔬菜的周销售量在每个阶段的28周前具有较大浮动,但基本呈现上升趋势,在28-32周内迅速升高达到顶峰,在32周后呈现快速下降趋势。
图2:花菜类
由图2可知,花菜类蔬菜的周销售量在每个阶段都在小范围内平稳浮动,在28-32周内会有明显的小峰值。
花叶类蔬菜的周销售量在每个阶段的1-8周内会呈现上升趋势,之后在一定的范围内平稳波动。
辣椒类蔬菜的周销售量在每一阶段的1-8周和28-32周呈现迅速上升趋势,在32周后呈现明显下降趋势。
茄类蔬菜的周销售量在每一阶段的1-8周呈现上升趋势,在8到16周迅速下降,在16-28周呈现平稳波动,在28-32周迅速上升达到峰值,在32-36周迅速下降,在36-52周呈现平稳上升趋势。
食用菌类蔬菜的周销售量在每一阶段的1-12周比较稳定,在12-32周迅速上升,波动较大,在32周之后销量回归到之前并趋于稳定。
5.1.3 蔬菜各品类销售量相关性分析
由于蔬菜各品类销售量为定量数据,可以进行Pearson相关性分析,使用SPSSPRO对2020年7月1日至2023年6月30日的各品类蔬菜周销售量进行Pearson相关性分析,得到结果如下表1:
表1:Pearson相关性检验结果
根据表1信息可知,花叶类与花菜类的相关系数为0.672,P值为0.000***,因此花叶类与花菜类具有强相关性且相关性显著。花叶类与辣椒类的相关系数为0.629,P值为0.000***,因此花叶类与辣椒类具有强相关性且相关性显著。水生根茎类与食用菌类的相关系数为0.633,P值为0.000***,因此水生根茎类与食用菌类具有强相关性且相关性显著。辣椒类与食用菌类的相关系数为0.61,P值为0.000***,因此辣椒类与食用菌类具有强相关性且相关性显著。
花叶类与食用菌类的相关系数为0.557,P值为0.000***,因此花叶类与食用菌类具有中等相关性且相关性显著。水生根茎类与辣椒类的相关系数为0.515,P值为0.000***,因此水生根茎类与辣椒类具有中等相关性且相关性显著。水生根茎类与花叶类的相关系数为0.499,P值为0.000***,因此水生根茎类与花叶类具有中等相关性且相关性显著。辣椒类与花菜类的相关系数为0.479,P值为0.000***,因此辣椒类与花菜类具有中等相关性且相关性显著。食用菌类与花菜类的相关系数为0.452,P值为0.000***,因此花叶类与食用菌类具有中等相关性且相关性显著。
水生根茎类与茄类的相关系数为-0.259,P值为0.001***,因此花叶类与食用菌类具有负向弱相关性且相关性显著。
(二)单品分布规律和相关性分析
5.1.4 蔬菜各单品销售量分布规律
蔬菜单品种类繁多,求解每个蔬菜单品销售量的分布规律并不现实,因此我们可以在每个蔬菜品类中挑选最具有代表性的蔬菜单品来分析这些蔬菜单品的销售量分布规律。首先我们可以对每个蔬菜品类中蔬菜单品的销售量进行排序,同时可以计算每个蔬菜单品销售量在所有蔬菜总销售量中的占比,选出每个蔬菜品类中销售量占比最大的蔬菜单品。根据计算,水生根茎类中销售量占比最大的蔬菜单品为净藕(1),花叶类中销售量占比最大的蔬菜单品为大白菜,花菜类中销售量占比最大的蔬菜单品为西兰花,茄类中销售量占比最大的蔬菜单品为紫茄子(2),辣椒类中销售量占比最大的蔬菜单品为芜湖青椒(1),食用菌类中销售量占比最大的蔬菜单品为金针菇(盒)。然后绘制在2020年7月1日至2021年6月30日,2021年7月1日至2022年6月30日,2022年7月1日至2023年6月30日这三个阶段六种蔬菜单品的周销售量与时间的折线图。(在此列出一部分折线图,具体六种蔬菜单品的周销售量与时间的折线图见支撑材料)
图3:净藕(1)
由图3可知,净藕(1)的周销售量在每一阶段的1-28周呈现上升趋势,在28周以后呈现迅速下降趋势。