2023年第十一届泰迪杯数据挖掘挑战赛B题:产品订单的数据分析与需求预测建模及python代码详解问题一

丰富的线上&线下活动,深入探索云世界

做任务,得社区积分和周边

最真实的开发者用云体验

让每位学生受益于普惠算力

让创作激发创新

资深技术专家手把手带教

遇见技术追梦人

技术交流,直击现场

海量开发者使用工具、手册,免费下载

极速、全面、稳定、安全的开源镜像

开发手册、白皮书、案例集等实战精华

为开发者定制的Chrome浏览器插件

(1)建模方案

一.问题背景

近年来企业外部环境越来越不确定,复杂多变的外部环境,让企业供应链面临较多难题。

需求预测作为企业供应链的第一道防线,重要程度不言而喻,然而需求预测受多种因素的影响,导致预测准确率普遍较低,因此需要更加优秀的算法来解决这个问题。需求预测是基于历史数据和未来的预判得出的有理论依据的结论,有利于公司管理层对未来的销售及运营计划、目标,资金预算做决策参考;其次,需求预测有助于采购计划和安排生产计划的制定,减少受业务波动的影响。如果没有需求预测或者预测不准,公司内部很多关于销售、采购、财务预算等决策都只能根据经验而来了,会导致对市场预测不足,产生库存和资金的积压或不足等问题,增加企业库存成本。

二.数据说明

附件中的训练数据(order_train1.csv)提供了国内某大型制造企业在2015年9月1日至2018年12月20日面向经销商的出货数据(格式见表1),反应了该企业产品在不同销售区域的价格和需求等信息,包括:order_date(订单日期)、sales_region_code(销售区域编码)、item_code(产品编码)、first_cate_code(产品大类编码)、second_cate_code(产品细类编码)、sales_chan_name(销售渠道名称)、item_price(产品价格)和ord_qty(订单需求量)。

其中“订单日期”为某个需求量的日期;一个“产品大类编码”会对应多个“产品细类编码”;“销售渠道名称”分为online(线上)和offline(线下),“线上”是指淘宝和京东等电商平台,“线下”是指线下实体经销商。

附件中的预测数据(predict_sku1.csv)提供了需要预测产品的销售区域编码、产品编码、产品品类和产品细品类(格式见表2)。

三.需要解决的问题

题。

(1)产品的不同价格对需求量的影响;

(2)产品所在区域对需求量的影响,以及不同区域的产品需求量有何特性;

(3)不同销售方式(线上和线下)的产品需求量的特性;

(4)不同品类之间的产品需求量有何不同点和共同点;

(6)节假日对产品需求量的影响;

(7)促销(如618、双十一等)对产品需求量的影响;

(8)季节因素对产品需求量的影响。

(1)产品的不同价格对需求量的影响

首先,读取数据并提取item_price和ord_qty两列数据;然后,根据item_price进行分组统计,计算每个价格区间的平均需求量;最后,通过散点图将不同价格区间的平均需求量进行可视化展示。

从图表中可以看出,产品价格与平均订单需求量之间呈现出U形关系,即价格较低或较高时,订单需求量较高;而当价格处于中间区间时,订单需求量较低。这可能是因为价格过低会让消费者觉得产品质量不高,而价格过高则会让消费者觉得不值得购买。因此,合理的定价策略可以在一定程度上提高产品的销售量。

也可以使用回归模型(例如线性回归、多项式回归等)对产品价格和需求量之间的关系进行建模和预测,从而确定价格对需求量的影响。

importpandasaspdimportnumpyasnpimportseabornassnsimportmatplotlib.pyplotaspltfromsklearn.linear_modelimportLinearRegression#读取数据df=pd.read_csv('order_train1.csv')#绘制散点图sns.scatterplot(x='item_price',y='ord_qty',data=df)#绘制箱线图sns.boxplot(x='item_price',y='ord_qty',data=df)#使用线性回归模型拟合x=df[['item_price']]y=df[['ord_qty']]model=LinearRegression()model.fit(x,y)#输出模型系数和截距print('Coefficients:',model.coef_)print('Intercept:',model.intercept_)(2)产品所在区域对需求量的影响,以及不同区域的产品需求量有何特性

可以通过对不同区域的需求量进行可视化分析,例如绘制直方图、箱线图等,查看需求量的分布情况。也可以使用ANOVA方差分析等方法来判断不同区域之间的需求量是否存在显著差异,从而确定产品所在区域对需求量的影响。

(3)不同销售方式(线上和线下)的产品需求量的特性

可以通过绘制不同销售方式的需求量直方图、箱线图等方法来查看产品需求量的分布情况和差异。也可以使用t检验等方法来确定不同销售方式之间的需求量是否存在显著差异。

然后,我们可以按照销售渠道名称(sales_chan_name)将数据分为线上和线下两类,计算它们的订单需求量(ord_qty)的基本统计量,包括均值、中位数、最大值、最小值、标准差等,以了解它们的分布情况和差异性。

除了计算订单需求量的基本统计量之外,我们还可以通过可视化方式更加直观地了解不同销售方式下产品需求量的特性。在Python中,我们可以使用Matplotlib或者Seaborn库进行数据可视化。

运行上述代码,可以得到一个箱线图,展示了线上和线下订单需求量的分布情况。通过比较箱线图的位置、大小和形状等特征,我们可以了解不同销售方式下产品需求量的差异性和分布情况。例如,如果线上订单需求量的中位数明显高于线下订单需求量的中位数,那么我们可以判断线上销售渠道对产品需求量的贡献较大。

核密度图可以更加直观地展示数据的分布情况,它可以通过对数据进行平滑处理,得到一条连续的曲线,反映了数据的概率密度分布情况。

importseabornassns#提取线上和线下订单需求量online_ord_qty=data[data["sales_chan_name"]=="online"]["ord_qty"]offline_ord_qty=data[data["sales_chan_name"]=="offline"]["ord_qty"]#绘制线上和线下订单需求量核密度图sns.kdeplot(online_ord_qty,shade=True,label="Online")sns.kdeplot(offline_ord_qty,shade=True,label="Offline")plt.legend(loc="upperright")plt.title("DistributionofOrderQuantitybySalesChannel")plt.xlabel("OrderQuantity")plt.ylabel("Density")plt.show()从核密度图中可以看出,线下销售方式下的产品需求量分布相对于线上销售方式更加集中,呈现出一个明显的峰态;而线上销售方式下的产品需求量分布比较平滑,没有出现明显的峰态。同时,线下销售方式下的产品需求量整体偏高,而线上销售方式下的产品需求量整体偏低。

从散点图中可以看出,线下销售方式下产品价格与需求量之间的关系似乎比线上销售方式下更加紧密,而且线下销售方式下有一些高价格、高需求量的异常值。但是需要注意的是,由于数据中的产品价格和需求量都是离散值,所以散点图中的点是会有重叠的。

(6)节假日对产品需求量的影响:

节假日通常会对消费者的购买行为产生影响,因此对产品需求量也会有影响。在此问题中,我们可以选取国内的法定节假日,对节假日和非节假日进行对比分析。

为了分析节假日对产品需求量的影响,可以先对数据进行处理,找出所有的节假日以及对应的日期。在本数据集中,可以通过观察订单日期(order_date)列来确定节假日日期,例如春节、国庆节等。然后,可以计算出每个节假日的平均需求量,将其与普通日的需求量进行比较,从而分析节假日对产品需求量的影响。

(7)促销对产品需求量的影响:

促销活动通常可以提高产品的销售量,因此对产品需求量也会有影响。在此问题中,我们可以选取一些促销活动,对促销期和非促销期进行对比分析。

比较促销期和非促销期的平均订单需求量,以分析促销对产品需求量的影响。

从条形图中可以看出,参与促销的产品平均需求量比没有参与促销的产品平均需求量要高。这表明促销活动对产品需求量有积极的影响。

THE END
1.10.12每天练习一题PTE#PTE考试##pte备考...来自PTE柒加10.12 每天练习一题PTE#PTE考试##pte备考##英语学习#?♀今天练习的题型是 fibrw敲黑板!每期的正确答案将在第二天公布在最新一条微博,参与的同学记得查看答案哦今日题目: An early example is Richard Rodgers On Your Toes(1936) in which the story about classical ballet meeting the world...https://weibo.com/7335912129/OFUzd9hVG
2.“泰迪杯”数据分析大赛B题学生校园消费行为分析2019 年“泰迪杯”数据分析职业技能大赛B题 学生校园消费行为分析 一、 背景 二、 目标 三、 任务 任务1 数据导入与预处理 任务1.1 任务1.2 任务2 食堂就餐行为分析 任务2.1 任务2.2 任务2.3 任务3 学生消费行为分析 任务3.1 任务3.2 任务3.3 文件“...https://www.heywhale.com/mw/project/5f69e2a071c700003078aca3
3.2023年高教社杯全国大学生数学建模竞赛b题竞赛参考答案Word模板...2023年高教社杯全国大学生数学建模竞赛B题竞赛参考答案由设计师熊猫办公用户(ID: 10012) 在2023-10-28完成设计制作并上传,欢迎下载使用! 2023竞赛大学生答案全国数学建模参考2023年泰迪杯b题论文高教如认为平台内容涉嫌侵权,可通过邮件:tousu@tukuppt.com提出书面通知,我们将及时处理。 https://www.tukuppt.com/muban/qbebmyky.html
1.2024年泰迪杯b题文章浏览阅读24次。泰迪杯数据分析技能赛。https://blog.csdn.net/2301_76206264/article/details/143711710
2.第五届“泰迪杯”数据分析技能赛赛前指导泰迪云课堂该课程属于 第七届泰迪杯技能赛赛前指导 请加入后再学习 目录 笔记(0) 介绍 第四届技能赛A题解题思路及方法 排序: 最新笔记 暂无笔记第六届“泰迪杯”数据分析技能赛赛前指导 1533 0 第五届“泰迪杯”数据分析技能赛赛前指导 2208 0 第四届“泰迪杯”技能赛 赛前培训直播 2689 0 第三届“泰迪杯”...https://edu.tipdm.org/course/19975/notes?sort=latest&task=473489
3.2017博普杯东北大学邀请赛(B.Drinktoomuchwater)(贪心+树链...给出一棵n个结点的树,然后给出树上的一些路径进行覆盖,然后要求选取最少的点,能够把这些线段都占有 (或者说:一开始树上每个结点权值都为0,选取最少的点,把它们的权重变成1,使得询问的每一条路径上有含有权值为1的结点) 题解: 类似线段覆盖(线段覆盖是按照右端点贪心) ...https://www.u72.net/daima/nw2a1.html
4.我校学生在第二届“泰迪杯”数据分析职业技能大赛中荣获佳绩数据分析、数据可视化的熟练程度,数学与计算机学院·曙光大数据学院组织学生参加了由中国产学研合作促进会指导,中国高校大数据教育创新联盟主办,广州泰迪智能科技有限公司、人民邮电出版社联合承办,广东省工业与应用数学学会、网易联合创新中心协办的面向全国本科、职业类院校学生的科技竞赛活动的第二届“泰迪杯”数据分析职业...https://www.hbun.edu.cn/zxfz/info/1027/1400.htm
5.89个数据分析实战项目,有数据集,有代码,还不来拿!“泰迪杯”数据分析大赛B题 学生校园消费行为分析 https://www.heywhale.com/mw/project/5f69e2a071c700003078aca3 数据分析和建模的方法,挖掘数据中所蕴含的信息,分析学生在校园内的学习生活行为,为改进学校服务并为相关部门的决策提供信息支持。 信贷风险评估 ...https://www.360doc.cn/article/1073788917_1073788917.html
6.泰迪杯数据挖掘竞赛2021泰迪杯数据挖掘竞赛2022B题泰迪杯数据挖掘竞赛2021 泰迪杯数据挖掘竞赛2022B题 仅以本文记录我和另外两位小伙伴参加的本次数模比赛,聊表纪念 电力系统负荷预测是一个影响因素众多,意义巨大的重要问题。本文通过建 立 LSTM 电力预测模型与 ARIMA(p,d,q)预测模型,将深度学习算法与统计学方法 结合,给出了系统负荷预测值并与传统预测模型对比分析...https://blog.51cto.com/u_16099185/7816578
7.第十届“泰迪杯”数据挖掘挑战赛B题完整解题代码后端第十届“泰迪杯”数据挖掘挑战赛B题 完整解题代码 点赞(0) 踩踩(0) 反馈 所需:30 积分 电信网络下载 MCAV 2024-11-06 19:37:45 积分:1 CWT-MCA-FMCW-IM 2024-11-06 19:37:16 积分:1 制造业类通用产品报价模板 2024-11-06 19:13:44 积分:1 前端Cookie.js 文件 2024-11-06 19:06:41...https://www.coder100.com/index/index/content/id/2215022
8.第十届“泰迪杯”数据挖掘挑战赛B题:电力系统负荷预测分析...【第十届“泰迪杯”数据挖掘挑战赛】B题:电力系统负荷预测分析问题二时间突变分析Python实现.pdf,【第?届“泰迪杯”数据挖掘挑战赛】B题:电?系统负荷预测分析问题?时间突 变分析Python实现 ?录 更新时间:2022年3?18? 20:30 相关链接 (1) (2) (3 https://max.book118.com/html/2022/1106/7163032143005011.shtm