Python+大数据开发课程大纲Python+大数据开发培训课程体系传智Python+大数据开发课程表

教育行业A股IPO第一股(股票代码003032)

全国咨询/投诉热线:400-618-4000

本课程适合于:应届大学毕业生,工资待遇不理想,想要突破转行,或对数据开发和数据分析感兴趣的人员

Python+大数据开发基础班课程大纲

所处阶段

01_数据分析行业技能及课程介绍02_Excel简介和基本使用03_Excel数据处理和计算04_Excel图表05_Excel透视表06_Excel分析项目

01_数据库概念和作用02_MySQL数据类型03_数据完整性和约束04_数据库/表基本操作命令05_表数据操作命令06_Where子句07_分组聚合08_链接查询09_外键的使用10_SQL数据分析实战

01_数据图表基础02_故事和仪表板初探03_数据分析报告04_Tableau电商项目

Python+大数据开发就业班课程大纲

01_变量02_标识符和关键字03_输入和输出04_数据类型转换05_PEP8编码规范06_比较/关系运算符07_if语句语法格式08_三目运算符09_while语句语法格式10_while循环嵌套11_break和continue12_while循环案例13_for循环

01_字符串定义语法格式02_字符串遍历(while)03_下标和切片04_字符串常见操作05_列表语法格式06_列表的遍历(for)07_列表常见操作08_列表嵌套09_列表推导式10_元组语法格式11_单元素元组12_元组操作13_字典语法格式14_字典常见操作15_字典的遍历

01_函数概念和作用、函数定义、调用02_不定长参数函数03_函数的返回值04_函数的说明文档05_函数的嵌套调用06_可变和不可变类型07_局部变量08_全局变量09_组包和拆包、引用

01_面向对象介绍02_类的定义和对象的创建03_添加和获取对象属性04_self参数05_init方法06_私有方法和私有属性07_继承08_子类方法重写09_类属性和实例属性11_类方法、实例方法、静态方法

01_异常概念02_异常捕获03_异常的传递04_自定义异常模块和包01_模块介绍02_模块的导入03_包的概念04_包的导入05_模块中的__all__06_模块中__name__的作用

01_闭包02_装饰器03_深浅拷贝04_正则

1.miniweb

01_视图的概念与使用02_Mysql窗口函数03_Mysql变量04_Mysql实战项目

01_Pandas数据组合_concat连接02_Pandas数据组合_merge数据03_Pandas数据组合_join04_缺失值处理介绍05_缺失值处理_缺失值数量统计06_缺失值处理_缺失值可视化07_缺失值处理_删除缺失值08_缺失值处理_填充缺失值09_melt整理数据10_stack整理数据11_wide_to_long整理数据12_unstack和小结13_Pandas数据类型简介14_数据类型转换15_分类数据category16_Series和DataFrame的apply方法17_apply使用案例18_向量化函数和lambda表达式

01_Python数据可视化介绍02_matplotlib绘图03_matplotlib绘制统计图04_Pandas绘图_柱状图05_Pandas绘图_折线图直方图饼图06_Pandas双变量可视化07_Seaborn绘图简介&单变量可视化08_Seaborn双变量可视化09_Seaborn多变量可视化和样式10_pyechars案例

01_AppStore项目_数据处理02_AppStore项目_单变量分析03_AppStore项目_可视化和结论04_AppStore项目_可视化和结论代码实现05_优衣库项目_案例介绍及简单数据探索06_优衣库项目_业务问题解读07_优衣库案例_代码实现08_RFM概念介绍09_RFM项目_数据加载和数据处理10_RFM项目_RFM计算11_RFM项目_RFM可视化12_RFM项目_业务解读和小结

01_人工智能概述02_机器学习开发流程和用到的数据介绍03_特征工程介绍和小结04_机器学习算法分类05_机器学习模型评估06_数据分析与机器学习

01_线性回归简介02_线性回归API使用初步03_导数回顾04_线性回归的损失函数和优化方法05_梯度下降推导06_波士顿房价预测案例07_欠拟合和过拟合08_模型的保存和加载09_线性回归应用-回归分析

01_逻辑回归简介02_逻辑回归API应用案例03_分类算法评价方法04_逻辑回归应用_分类分析

01_聚类算法的概念02_聚类算法API的使用03_聚类算法实现原理04_聚类算法的评估05_聚类算法案例

01_决策树算法简介02_决策树分类原理03_特征工程-特征提取04_决策树算法api05_决策树案例

01集成学习算法简介02Bagging和随机森林03随机森林案例04Boosting介绍05GBDT介绍

01_常用指标计算02_数据推断03_基于Kmeans的用户分群04_LTV用户生命周期05_购物篮分析06_用户标签

01_用户行为分析02_用户价值分析03_用户复购分析04_库存分析05_销售预测06_AB测试

01_互联网金融风控体系介绍02_风控建模流程概述03_风控建模流程_项目准备04_风控建模流程_特征工程05_风控建模流程_模型构建06_风控建模流程_上线运营07_业务规则挖掘案例

01_建模流程_实验设计02_建模流程_样本设计03_建模流程_模型训练与评估04_评分映射05_逻辑回归评分卡06_lightGBM特征筛选07_输出模型报告08_评分映射09_集成学习评分卡_xgboost10_集成学习评分卡_lightGBM11集成学习评分卡模型创建13_建模流程梳理

01_变量02_表达式03_常见符号04_流程控制

1.Java语言概述2.Java开发环境搭建3.IDEA的安装和配置4.HelloWorld案例5.注释,关键字,常量,变量,数据类型转换.6.for循环.while循环,循环嵌套,控制跳转语句,break和continue7.数组的概述和创建,数组的常见操作.8.方法的概述和定义,方法重载,方法形参类型,方法练习

1.面向对象介绍2.类和对象讲解3.对象的内存图4.成员变量和局部变量的区别5.private关键字,封装,this关键字,构造方法,继承,super关键字6.方法重写,多态,final,.static,抽象类,接口,包(package)

1.API解释2.Object类讲解3.String类讲,StringBuilder类讲解,冒泡排序4.Arrays工具类包装类5.自动拆装箱,Date类讲解6.SimpleDateFormat类讲解

1.Lambda表达式2.集合类,Collection,ArrayList3.列表迭代器,增强for,数据结构4.Set集合之HashSet,Map集合之HashMap5.File类,字节流,序列化流,字符流

1.大数据的特点2.分布式存储概念3.分布式计算的概念4.服务器种类介绍、机架、交换机5.网络拓扑、Raid、IDC数据中心6.Linuxshell编程、awk、sed、cut、ssh、scp、expect、yum、nestat、top、iostat等高级命令使用

1.Zookeeper的应用场景2.架构和原理3.存储模型4.选举机制5.客户端操作

1.HDFS设计的特点2.Master-Slave架构3.Block块存储、RF拷贝因子、机架感知4.Block拷贝策略、读写流程5.HDFSFederation、HDFSSnapshots、NameNodeHA架构和原理6.HDFS管理员常用操作、HDFS权限控制

1.MapReduce架构和原理2.Split机制3.MapReduce并行度4.Combiner机制5.Partition机制、自定义Partition6.MapReduce序列化、自定义排序、数据压缩

1.Yarn原理和架构2.Yarn高可用3.Container资源的封装(CPU、内存和IO)4.资源调度策略(FIFO、Fair和Capacity)

1.HQL操作2.数据类型3.分区、分桶、临时表4.explain执行计划详解

1.Hive原理和架构2.MetaStore服务3.HiveServer内置函数4.自定义UDF和UDAF5.数据压缩、存储格式、自动化脚本、常见性能优化

1.Hive滴滴出行案例实战

1.Hive亚马逊电商案例实战

1.大数据部署运维:ClouderaManager2.分析决策需求:数据仓库3.数据采集:sqoop4.数据分析:hive5.历史数据快照:拉链表6.数据更新后的统计分析:拉链表7.数据调度:oozie+shell8.OLAP系统存储:mysql9:数据展现:帆软BI

1.掌握离线数仓的分层与建模,从需求、设计、研发、测试到落地上线的完整项目流程2.大量教育大数据的真实业务逻辑,共涉及20多个主题,100多个指标,提升学员在教育行业中的核心竞争力3.包括海量数据场景下如何优化配置4.拉链表的具体应用5.新增数据和更新数据的抽取和分析6.hive函数的具体应用7.ClouderaManager可视化、自动部署和配置、Git、CodeReview功能

1.Redis原理及架构2.RedisCluster原理及架构3.Redis常用操作

1.HBase原理及架构2.预分区、LSM结构3.BloomFilter,co-processor,结合Phoneix进行优化查询

1.Kafka原理及架构分析2.分布式实时计算架构和思想

1.陌陌社交场景实战2.社交大数据架构剖析3.数据采集4.数据ETL5.数据分析

1.Scala函数式编程基础2.集合、Iterator、构造器、伴生对象、Akka编程3.Scala语言重点API编程

1.Spark架构和原理(运行机制、Driver和Executor、spark任务提交流程)2.RDD开发和原理(Partition、Task、RDD的依赖关系、RDD的容错机制、RDD的存储级别、RDD的缓存机制)广播变量3.DAG原理(DAG思想、DAG的生成、DAG的处理过程)

1.SparkSQL架构和原理2.DataFrame、DataSetDSL和SQL开发3.Spark多数据源整合(txt、CSV、Json、parquet、JDBC、Hive)4.SparkSQL执行计划原理5.SparkSQL性能调优

1.StructuredStreaming开发(input、output、window、watermark、过期数据操作、去重等)2.StructuredStreaming多数据源整合(socket、Kafka)3.Flume+kafka+StructuredStreaming案例实战

1.教育大数据场景案例实战

1.基于HDP快速搭建大数据平台2.基于Hive+SparkSQL搭建离线数据仓库3.基于StructuredStreaming构建高吞吐实时处理4.基于ECharts实现可视化

1.使用主流的Hive+Spark构建离线数仓2.使用StructureStreaming构建实时异常告警系统3.基于完整的工业业务背景实现的离线和实时大数据业务丰富地地图展示可视化开发4.学会使用SparkSQL处理复杂业务完整的离线采集+实时采集方案5.掌握如何使用调度平台调度T+1批处理任务Spark离线任务和实时任务整合,统一由YARN做资源管理

1.面试题必备SQL实战2.SQL优化加强

1.Hive基础2.Hive拉链表3.Hive数据仓库构建示例4.Hive面试题

1.Spark基础2.Spark拉链表3.Spark数据仓库构建示例4.Spark面试题

1.Kafka基础2.Hbase基础3.Kafka&Hbase面试题

1.数据分析流程2.大数据架构剖析3.多行业大数据架构设计4.大数据存储,调度等解决方案

1.Flink基础

1.FlinkDataStream的使用、2.Kafka+Flink

1.FlinkSQL开发2.Hive+FlinkSQL

1.Watermark2.Checkpoint3.任务调度与负载均衡4.状态管理

1.Flink性能监控2.Flink调优3.FlinkSQL执行计划

1.Flume+Kafka+Flink+Hbase+Sqoop+Canal+MySQL实战

1.离线数据分析:flinkbatch、hive2.实时在线分析:flink、hbase3.消息队列:kafka4.驾驶行程分析:flink、hbase5.实时在线故障分析:mongodb6.车型指标分析:hive、shell7.实时指标查询:phoenix8.后台数据服务接口:springboot、swagger-ui、echarts9.多数据源加载:flinkjdbc10.车辆告警规则分析:flink、zeppelin11.离线任务调度:azkaban12.报表:superset13.页面展示:echarts、javascript

1.海量数据处理,系统15分钟内收集的新能源车辆的数据超过千万条2.基于Hive、HBase、HDFS数据存储3.基于Kafka数据传输4.基于Flink全栈数据处理5.基于Nginx做反向代理、LSV和Keepalived负载均衡和高可用

备注:该课程大纲仅供参考,实际课程内容可能在授课过程中发生更新或变化,具体授课内容最终以各班级课表为准。

每晚对学员当天知识的吸收程度、老师授课内容难易程度进行评分,老师会根据学员反馈进行分析,对学员吸收情况调整授课内容、课程节奏,最终让每位学员都可以跟上班级学习的整体节奏。

为了能辅助学员掌握所学知识,黑马程序员自主研发了6大学习系统,包括教学反馈系统、学习难易和吸收分析系统、学习测试系统、在线作业系统、学习任务手册、学员综合能力评定分析等。

从学员学习中的心态调整,到生活中的困难协助,从课上班级氛围塑造到课下多彩的班级活动,班主任360度暖心鼓励相伴。

小到五险一金的解释、面试礼仪的培训;大到500强企业面试实训及如何针对性地制定复习计划,帮助学员拿到高薪Offer。

THE END
1.年度电商大数据竞争策略分析报告.docx前言在动荡不定的商业环境中,精准的电商大数据市场分析及创新的竞争策略对于企业的生存与发展至关重要。本报告深入调研各种市场因素,如需求动态、供给状况、技术革新及政策限制等,继而构建一套综合的市场分析框架。结合案例研究与数据统计,报告提出了针对性的竞争策略,以指导企业在复杂多变的市场中顺利导航。特此声明,本...https://www.renrendoc.com/paper/358912362.html
2.大数据分析案例基于RFM模型对电商客户价值分析(聚类)大数据分析案例-基于RFM模型对电商客户价值分析(聚类) 1.项目背景 随着电商的不断发展,网上购物变得越来越流行。更多电商平台崛起,对于电商卖家来说增加的不只是人们越来越高的需求,还要面对更多强大的竞争对手。面对这些挑战,就需要能够及时发现店铺经营中的问题,并且能够有效解决这些实际的问题,从而提升自身的竞争力。https://developer.aliyun.com/article/1123861
3.有关大数据营销的案例分享(教科书式的10大经典案例)电商是最早利用大数据进行***营销的行业,除了***营销,电商可以依据客户消费习惯来提前为客户备货,并利用便利店作为货物中转点,在客户下单15分钟内将货物送上门,提高客户体验。马云的菜鸟网络宣称的24小时完成在***境内的送货,以及京的刘强东宣传未来京东将在15分钟完成送货上门都是基于客户消费习惯的大数据分析和预测。https://www.55xw.net/show-254885.html
1.6个大数据应用案例能源公司利用大数据优化能源生产和分配,识别消费模式,提高能源效率。 让我们进一步详细了解不同行业的关键大数据用例,以了解这些行业如何利用大数据的潜力。 医疗保健领域的顶级大数据使用案例 大数据分析已经改变了医疗行业的游戏规则,彻底改变了医疗服务的提供方式,提高了患者的治疗效果,并推动了医疗创新。例如,在抗击新冠的...https://blog.csdn.net/u014674420/article/details/136387632
2.电商大数据项目实战(四):电商典型案例分析电商大数据项目实战(四):电商典型案例分析 时长6 小时 16 分钟 · 评分5.0 本章内容主要是结合HDP知识点来学习电商常见的需求,以及面对需求,我们应该如何进行分析和解决。 本课程收录在以下学习路径 电商大数据项目实战 查看详情 6 阶段 · 6 课程 · 0 文档 · 0 Codelabs · 0 考试 · 21.7...https://developer.huawei.com/consumer/cn/training/course/introduction/101629879622387368
3.基于HiveSQL的电商数仓之交易主题大数据分析数据交易例子基于Hive SQL的电商数仓之交易主题大数据分析 数据交易例子,案例分析练习:电商交易数据分析#加载数据分析需要使用的库importnumpyasnpimportpandasaspdimportmatplotlib.pyplotasplt一、首先明确分析的目标1、加载数据文件,以id列为索引使用read_csv方法加载csv数据文件https://blog.51cto.com/u_16213718/8712316
4.电商大数据——用数据驱动电商和商业案例解析(豆瓣)在《电商大数据——用数据驱动电商和商业案例解析》的目录中给出了200 组客户67 个维度指标的真实数据,这些源数据是非常珍贵的资源,为客户行为研究提供了不可或缺的基础资料... (展开全部) 作者简介· ··· 雪鹰传奇真名李必文,国内电商“数据驱动学”的倡导者和领跑者,数据分析“AVSM法则”的创始人。知名电商...https://book.douban.com/subject/25852289/
5.跨境电商大数据报告精读跨境电商大数据可以帮助企业优化自身的运营过程,例如制订更为高效的销售和营销策略、更佳的物流规划和最优化的库存管理等。这些都有助于企业提高运营效率、节约成本。 跨境电商大数据的案例 亚马逊 作为全球最大的电子商务公司之一,亚马逊通过大数据分析,对消费者进行行为识别。在推荐引擎、广告精准投放等方面的应用,亚马逊...https://m.vzkoo.com/read/2023051506a2af58b65eca807861f68f.html
6.解析电商大数据,成功的电商商家都在监控哪些数据?电商数据分析...若需了解更多解决方案的细节与全面的电商指标体系梳理,您可以点击下方链接,查看帆软零售与电商解决方案,也可以点击图片,直接获得帆软为您量身打造的解决方案咨询、免费产品与Demo试用和同行业标杆案例参考。 解决方案页面 帆软新零售解决方案 帆软一站式电商自助数据分析平台 ...https://www.fanruan.com/bw/dsdsj-2
7.艾媒报告2020报告介绍:《2020-2021年中国直播电商行业运行大数据分析及趋势研究报告》主要对中国直播电商的现状进行总结和前景分析,通过对相关企业分布及规模、行业业态、运营模式等进行了数据监测,通过草莓派数据调查与计算系统进行抽样调研(调研样本为1983个),以及通过淘宝直播、蘑菇街等典型案例的深度分析,对2020年中国直播电商行业进...https://www.iimedia.cn/c400/68945.html
8.跨境电商电商大数据跨境数据分析跨境电商大数据解决方案网宿基于亚马逊云科技数据湖、数据分析、机器学习等产品方案,为跨境电商企业提供云上数据分析系统架构咨询与设计、快速实施上云与持续优化,满足多数据源离线/实时分析与机器学习应用需求,助力跨境电商企业实现数据敏捷、高效分析,赋能业务营销增长与运营创新。 https://www.wangsu.com/product/219