pandas数据分析案例:利用python进行汽车数据分析可视化实例–帆软

最近我一在杭州做外贸生意的老表让我给他推荐一辆车,自己的宝来开了5年多,感觉不香了,这次要我给他从BBA中选一个,落地35万以内落地。我想这做生意稳重一点,35万以内差不多就是奔驰C,宝马3和奥迪A4中选了。至于选哪一个就很头疼了。

我们知道每辆车都有它的特点和受众群体,特别是对于这种有上百年品牌积淀的BBA。奔驰的高逼格,宝马的驾驶感,奥迪的科技感等,但是这些特点不一定是你买它的理由。

每辆车肯定都有缺点,如果这些缺点你无法忍受,那一定是你不买的理由。与其打破脑袋做选择题,不如换个思维方式,用排除法,做“不选”题。

按照这个思路,我就想着怎么样把这三个车的问题搜集出来,对比看看哪个更加无法接受。最后在做出选择。思路有了,问题就有了解决方案了:

搜集各个车型的问题

搜集完后做数据清洗聚合

问题点生成词云对比,更具有视觉效果

好了,说干就干。第一步,问题搜集。要搜集问题,自然要找投诉网站。有个12365车质网就是让用户上报投诉信息的,我们也可以按照车型搜索投诉信息,如图:

搜索后,得到详细的投诉信息列表,很全很强大!

我们只要把这些信息写个爬虫爬下来就可以了。这个简单。按照我们之前写过的爬虫,5分钟,总共不超过20行代码,就把这些数据拿下了。没办法,python爬虫就是这么强大!特别是对于这种第三方机构的网页,基本上没有什么反爬虫措施。爬取后的数据如下,大概10000条:

每一行为一个投诉,每个投诉有车型车款投诉信息和投诉日期等字段,完全够用了。

原材料有了,接下来就开始做菜了。按照需求:“分析每个车型的主要缺点,看看哪个更加无法接受”来搭建数据分析的指标和方法。

我的思路:第一,总体观:先看看哪个车型故障比较多第二,细化到每个车型在看看每个车型的主要问题

总体分析简单,直接用pandas聚合,看看每个车型的投诉总数和占比:

可视化:

这里有一家网站,车主之家,可以按照车型查找到每个月的销量:

同样的,我们用爬虫爬取了2009-2019共11年三个品牌的销量数据:

OK,把这个数据和投诉数据放到一起:

销量可视化:

我靠,这下死的明白了!

宝马11年共卖了近140万辆3系,在三者中最高,但是投诉数量却是最少,从数据上看似乎质量比另外两个可靠。

奥迪A4在销量方面比宝马3系稍逊一筹,超过120万辆,但是投诉数量确是宝马4倍左右。

奔驰的销量和两外两兄弟不在一个级别上,但其实投诉也不少。

我们再来看一下按月份销量走势图:

2009-2015,宝马3系的历年销量都是最高,但是2015年之后不知道发生了什么,这种优越感荡然无存。特别是2019年下半年开始,销量大幅下滑,现在处于稳步复苏阶段。

最近几年(2015-2019),三个车型的销量非常接近,竞争越来越激烈。

再来看一下按照月份的投诉量统计:

基本上每个月奥迪的投诉总量都是最高,宝马最低。

但是要看到宝马和奔驰的投诉数量近几年有增长的趋势

奥迪在2015年前后和2017-2019年有个投诉集中爆发的阶段,其实如果把这些非常高的离群点处理掉,奥迪投诉量没有那么夸张。

综上,从整体数据来看:

宝马3系的投诉总量最低,而且是在销量最高的前提下。但是要看到宝马3系的黄金时期是在2009-2015年间。销量大幅领先且投诉少。最近几年投诉量有上升趋势。

奔驰随着产量销量的上升,投诉量也在增长。

从数据上来看,最不推荐的是奥迪A4,投诉量一直居高不下。

但是:

第一,这只是一家网站的数据,是否全面需要商榷;第二,每个品牌的车主是否都有上网投诉的习惯,这个也是未知。后期打算做一个各个品牌车主的人物画像在深入分析。

这里在此强调以上只是通过数据就事论事。

第二步:各个品牌的缺点画像。

这里的内容主要是用jieba分词来对统计投诉问题做词频统计,之后利用词云工具来展示。因为python有这些第三方库,做这些事情无比简单。别人做好了工具直接调用即可。

首先先看一下总体的情况:

下面我们在分车型看一下:

按照字母顺序,奥迪先来:

异味和烧机油问题突出。看来烧机油是大众的通病。我们在把词分的更细一点看看:

可以看到除了异响异味以外,防冻液和轮胎也很突出。

在看一下奔驰C:

对比奥迪,奔驰C发动机故障灯亮和4S商家服务问题突出一点。细分在看一下可以看到提到比较多有故障灯,凸轮轴等

最后看一下宝马:

宝马和奥迪一样,都有严重的烧机油问题,但是宝马的似乎和气门机构有关系,这里漏油。

宝马车主还提到发动机控制模块故障和高速熄火问题,这个挺严重

综上:

有了这些问题,在怎么选择,就看个人了。

制作各种复杂报表,搭建数据决策分析系统

企业级数据分析平台,人人都是数据分析师

全方位高时效融合各种数据,打破数据孤岛

轻松制作管理驾驶舱,可视化经营决策监控

提供500+BI模板,20+业务分析体系方案,快速打造高效美观的业务报告与可视化仪表板,一站式解决您的数据分析需求!

THE END
1.SPSS数据分析实例.pptSPSS数据分析实例 :某克山病区测得11例克山病患者与13名健康人的oup两个框内分别输入1和2,点击ok 结果浏览窗口两组的基本情况描述和t检验结果 上面是方差齐性检验,用于判断两总体方差是否齐;第二部分分别给出两组所在总体方差齐和不齐时的t检验结果 https://www.taodocs.com/p-735739326.html
2.SPSS数据分析实例详解20240110172242.pdfSPSS数据分析实例详解.pdf 137页VIP内容提供方:微传科技 大小:23.79 MB 字数:约15.94万字 发布时间:2024-01-13发布于河北 浏览人气:120 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)SPSS数据分析实例详解.pdf 关闭预览 想预览更多内容,点击免费在线预览全文 免费在线...https://m.book118.com/html/2024/0110/7015126003006030.shtm
3.SPSS行业案例SPSS数据分析软件行业案例本文将介绍SPSS描述性分析怎么剔除没用的数据,SPSS描述性分析怎么看分析结果的相关内容。 2024-11-25 SPSS数据降维是什么意思 SPSS数据降维方法 SPSS是一款功能强大的,应用范围广泛的统计分析软件,支持用户的多样化操作,支持数据分析、数据统计和数据可视化等功能。很多用户在使用SPSS时可能会遇到不知道SPSS数据降维是...https://spss.mairuan.com/hangye/
4.数据科学实战第2 章 统计推断、探索性数据分析和数据科学工作流程 在本章,我们首先讨论统计推断和统计学的思考方式,然后我们将目光转向每一位数据科学家都会从事的工作:探索性数据分析。我们还将详细了解研究数据科学的工作流程,在本章的结尾,是我们的“思维实验”环节和一个案例学习。 https://www.ituring.com.cn/book/tupubarticle/512
5.手把手教你操作Tableau——真实公司数据分析项目实例(完整详细...1.打开tableau,将所需要的的数据导入到tableau中 2.数据源连接这边可以看到tableau可以连接多种文件格式和数据库 3.tableau中对数据文件的两种处理方式有实时live和提取extract 实时连接的好处是直接连接的是数据源,如果数据源(excel或者SQL类数据库)发生变化,tableau里的数据也会相应的自动调整 坏处在于实时的速度会随着...https://blog.nowcoder.net/n/40fb3adebfb648e0a3e91f3fa6b9a7fb
1.精选30个数据分析案例,建议收藏!腾讯云开发者社区这就涉及到,你必须要有思维能力,去支撑你在看到数据时,会从多维度去分析,而不是只看到表面数字这么简单而已,否则就是抓瞎。 数据时代,无论你是做产品,运营,还是做研发,系统架构,乃至于安全风控,都会发现,数据思维是考验你能力提升的重要指标。 但其实,很多人只是掌握了数据分析的工具和技能,却做不好数据分析,无...https://cloud.tencent.com/developer/article/1966722
2.5个Github上的大数据分析案例!大数据项目开发案例文章列举了GitHub上的数据科学资源,包括AwesomeDataScience和DataScienceProjects等项目,提到了Kaggle竞赛平台以及使用Python和SQL进行大数据分析的重要性。此外,还强调了数据分析师应掌握的技能,如Excel和数据可视化工具,并推荐了学习资源和学习路径。 摘要由CSDN通过智能技术生成 ...https://blog.csdn.net/itcast_cn/article/details/131772550
3.五个Pandas实战案例带你分析操作数据pythonpandas是基于NumPy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas纳入了大量库和一些标准的数据模型,提供了高效操作大型数据集的工具。pandas提供大量快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python强大而高效的数据分析环境的重要因素之一...https://www.jb51.net/article/235878.htm
4.矩阵数据分析法实例矩阵数据解析法案例2.实例: 在推荐系统中,最重要的数据是用户对商品的打分数据,数据形式如下所示: 其中,U1?U5表示的是5个不同的用户,D1?D4表示的是4个不同的商品,这样便构成了用户—商品矩阵,在该矩阵中,用户对每一件商品的打分,其中“-”表示的是用户未对该商品进行打分。 https://blog.51cto.com/u_13229/8815184
5.数据挖掘聚类分析实例【数据挖掘】聚类分析实例 技术标签:数据挖掘机器学习聚类 在之前,我们已经学过了四大类聚类分析及其典型算法。本文,我们将使用划分方法中的k-均值算法和层次聚类方法以一个实例进行完整的聚类分析演示。 1. 问题描述 例题: 为研究我国31个省、市、自治区2007年的城镇居民生活消费的规律,根据调查资料作区域消费类型...https://www.pianshen.com/article/74271139769/
6.Python数据分析与挖掘实战(豆瓣)此外,他精通Java EE企业级应用开发,是广东工业大学、华南师范大学、华南农业大学、贵州师范学院、韩山师范学院、广东技术师范学院兼职教授,著有《神经网络实用教程》、《数据挖掘:实用案例分析》、《MATLAB数据分析与挖掘实战》《R语言数据分析与挖掘实战》等畅销书。https://book.douban.com/subject/26677686/
7.工具Orange3:机器学习入门神器澎湃号·湃客澎湃新闻Orange3(https://orangedatamining.com/)是一款基于Python的数据挖掘和可视化工具,它提供了丰富的数据分析、机器学习和数据挖掘算法,同时也支持可视化分析和交互式数据探索。Orange3提供了友好的界面和丰富的示例工程,使得新手用户也可以快速上手,同时也支持Python脚本,可以满足高级用户的需求。 https://www.thepaper.cn/newsDetail_forward_24193195?commTag=true