课程名称
Python+大数据开发课程
课程推出时间
2023.08.21
课程版本号
4.0
技术课程
Hadoop3.3,Spark3.4,阿里云Flink(FlinkCDC、FlinkCEP、FlinkSQL),StarRocks,Paimon,ElasticSearch
课程介绍
● Python大数据V4.0课程全新升级,紧贴各类企业招聘需求,升级阿里云平台全套大数据技术栈,全程采用六项目制驱动技术学习,助力国家数字化转型对数字人才的大量需求。
● 多位Apache社区贡献者联袂授课,从原理、实战到源码,带你迈入高级开发工程师行列。
● 课程覆盖企业级大数据六大主流解决方案,包括离线数仓解决方案、流批一体解决方案和湖仓一体解决方案、用户画像解决方案、推荐系统解决方案、数据治理解决方案,再现公司中真实的开发场景,目标不止于就业,而是成为各类企业争抢的大数据开发工程师。
● 课程升级主流大数据技术栈,全新Hadoop3.3,Spark3.4,阿里云实时计算Flink技术剖析和新特性使用,推出黑马甄选业务的全套解决方案课程,不仅可以学习到企业真实完整的业务场景,将六大技术解决方案应用到黑马甄选泛电商业务中,能胜任企业级离线数仓、实时数仓、用户画像、推荐系统、数据治理等核心大数据开发工作。
● 项目课程实施“讲A练B”与"看图说话"新模式, 以思路分析为导向提高学员独立开发能力,并推动学员在逻辑思维与语言表达能力方向的持续提升,为学员在面试中以及在企业独立开发中打下坚实的基础
1
新增数据治理解决方案,结合包括元数据管理、数据标准、指标系统、数据建模等在内的数据治理能力,聚焦企业数字化转型,深挖数据价值,提升企业数据生产力。满足就业市场中中高级数据工程师需求,提升学生就业竞争力。
1
新增通过AIGC助力编程效率提升,完成数据开发和数据分析任务。
1
新增Paimon、StarRocks新技术,将技术应用到实时项目中,更加全面提升通过技术解决业务问题能力。
1
新增新版面试加强课,内容集成了大厂架构解析、SQL专项面试宝典,以及不断滚动更新的全网大数据岗位面试题讲解,助力学员高起点就业。
1
更新由Apache Flink1.17课程升级为阿里云实时计算Flink版,通过阿里云全套大数据组件学习,贴近中小型企业大数据开发真实环境,提升学生就业竞争力。
1
新增黑马甄选实时计算项目由阿里云实时计算Flink全栈开发,从FlinkCDC数据采集,Kafka实时数仓分层,Paimon数据湖构建湖仓一体架构,将数据接入Starrocks进行OLAP分析和查询,最后通过DataV完成企业级业务大屏展示。
1
新增大数据BI报表开发项目实战阶段,通过Python+SQL+FineReport完成电商业务统计分析和大屏展示。
1
友情提示更多学习视频+资料+源码,请加QQ:2632311208。
课程名称
Python+大数据开发课程
课程推出时间
2023.01.01
课程版本号
3.2
主要使用开发工具
PyCharm,IDEA,DataGrip,FinalShell
课程介绍
● 优势1:课程升级深度调研市场需求,针对行业解决方案:离线数仓解决方案、用户画像解决方案、湖仓一体解决方案,打造多行业多场景大数据开发工程师。
● 优势2:6项目制,2大项目实战,新增PB级内存计算项目实战,应对企业级大数据开发工程师需求。
● 优势3:研究院精心研发基于实时技术栈全新架构的出行行业和电商行业大数据项目,让学生具备更强项目经验要求。
● 优势4:最短路径教会企业最实用的技术,案例练习促进吸收;每日作业夯实学习成果;阶段项目实战,学以致用。
1
新增基于Flink的悠游出行大数据平台
1
新增基于Flink的优购电商优选项目
1
新增用户画像解决方案项目,包含了新零售、电商、金融保险等多行业画像解决方案
1
升级Spark内存计算阶段项目实战
1
新增大数据Java语言基础,为Flink技术栈提供语言支持
1
新增SQL大厂面试题,贯穿课堂每日一练,提升SQL技术能力
1
新增Hudi数据湖,Hudi on Hive构建湖仓一体架构
1
新增Python版NoSQL课程,达到企业级万亿级数据存储目标
1
新增Doris、ClickHouse多维数据分析
1
优化亿品新零售项目中数仓建模理论基础,强化数仓建模工具使用
1
优化车联网项目全新架构升级
1
优化Flink技术课程版本更新至1.16,丰富实时计算新特性
1
优化Spark技术课程版本更新至3.3.0,增加Spark新特性讲解
1
优化优化Hadoop模块,增强Hive模块
1
优化优化Python编程内容,为Spark提供语言支持
1
优化ETL项目增加从HDFS到Hive的数据抽取、转换、加载方式
1
优化ETL项目增加DataX数据采集
1
优化ETL项目增加Apache DolphinScheduler调度全流程数据处理过程
1
优化Flink技术栈突出以FlinkSQL为主核心技术
课程名称
Python+大数据开发课程
课程推出时间
2022.06.01
课程版本号
3.0
主要针对
技术课程:ETL开发、NoSQL中间件课程、新版Flink课程
主要使用开发工具
PyCharm、DataGrip、FinalShell
课程介绍
● Python大数据V3.0课程全新升级,紧贴各类企业招聘需求,采用六项目制驱动技术学习,助力国家数字化转型对数字人才的大量需求
● 多位Apache社区贡献者联袂授课,从原理、实战到源码,带你迈入高级开发工程师行列
● 课程覆盖企业级大数据四大主流解决方案,包括离线数仓解决方案、用户画像解决方案、流批一体解决方案和湖仓一体解决方案,再现公司中真实的开发场景,目标不止于就业,而是成为各类企业争抢的大数据开发工程师。
● 课程升级主流大数据技术栈,全新Hadoop3.2,Spark3.2,Flink1.15技术剖析和新特性使用,推出Python全栈ETL开发课程,不仅可以学习到完整的基础ETL流程、工具,更能胜任千亿级、亚秒级等复杂数据源情况下的工作。
● 新增基于Python和SQL的Flink课程,满足就业市场中,大数据开发岗位更多的依赖SQL、Python的需求变化。
● 新增 基于Python的Kafka、Elasticsearch等全新课程,夯实实时计算开发基础能力,帮助学员掌握数据开发工程师重要技能。
● 新增 新版面试加强课,内容集成了大厂架构解析、SQL专项面试宝典,以及不断滚动更新的全网大数据岗位面试题讲解,助力学员高起点就业。
1
新增基于Python的全栈ETL开发课程,助力学员胜任ETL中高级开发岗位
1
新增全网基于PySpark技术栈的用户画像项目,替换原有旧项目,提升简历含金量
1
新增知行教育项目实战,学习完整企业级项目实战流程,让学生真正掌握大数据开发精髓
1
升级Spark技术课程为20223.2版本、Flink技术课程为20221.15版本,全网率先加入Pandas on Spark数据开发内容
1
新增FlinkSQL湖仓一体项目、FlinkSQL流批一体课程,进阶Flink高阶工程师,助力突破年薪50W
1
新增SparkSQL底层执行原理,StructuredStreaming结构化流内容
1
升级Spark3.2整合Hive3.1.2版本兼容问题
1
新增Pandas_udf函数,通过Apache Arrow框架优化数据处理速度;Pandas技术栈,能够处理中小型数据量
1
新增Python版NoSQL课程,达到企业级万亿级数据存储目标
1
新增Kafka-Python完成企业级消息队列流量削峰, 异步通信等任务
1
新增ElasticSearch技术栈,达到企业级大数据搜索工程师目标
1
升级PySpark的DataFrame操作、Flink任务调度机制以及Flink内存模型、Flink table&sql的整体概述
1
新增FlinkSQL的原理和调优、Flink on Yarn的多种部署方式、Flink transformation的八大物理分区的原理和实现、Flink的window窗口操作,以及内置水印函数的操作
1
新增Hadoop3.x新特性、Hive3.x新特性,以及数据压缩、存储格式等内容
1
升级Python基础,增加PyEcharts等BI内容,实现可视化大屏
1
新增Presto对接多数据源实现企业级大数据OLAP分析、Presto加速对Hive数仓之上数据构建大数据分析引擎,实现多维指标计算
1
新增企业级BI工具FineBI,适用于多行业项目BI大屏展示,助力企业数字决策
1
新增Flink table&sql概念和通用api介绍、sqlclient工具的使用、catalogs知识点的学习、流处理中的概念介绍
1
新增FlinkSQL中的窗口使用、FlinkSQL函数操作、Flinksql连接到外部系统
1
新增Flink源码前置基础、源码的编译和部署、Flink启动脚本的解读、yarn-per-job模式解析
1
升级车联网Web展示部分、车联网离线Hive数仓构建部分
课程名称
Python+大数据开发课程
课程推出时间
2021.06.01
课程版本号
2.0
主要针对
新零售数仓项目、云上服务器集群
主要使用开发工具
新零售数仓项目、云上服务器集群
课程介绍
● 经过不断的版本迭代,正式推出新零售数仓项目课程,替换原有的旧项目,打造过硬的项目实战经验
● 新增价值百万的UCcloud云上集群生产环境用于学习,完全云服务开发环境体验
● 新增项目实战环节,再现企业中真实工作场景,夯实开发实战能力
1
升级PySpark执行流程
1
新增Spark3.x新特性以及性能调优九项原则
1
升级Hive版本为新的3.x版本
1
新增自动导入oracle数据,自动创建hive表,自动创建hive分区,自动关联hdfs数据,自动创建文件目录,并记录自动化过程日志
1
升级Flink版本为新版
1
新增FlinkSQL&Table理论部分比重,使用新版API,使用新增FlinkSQL整合Kafka案例
1
新增美团、平安、小米大数据架构,以及百度广告业务场景大数据架构解决方案
1
新增flink的global window的操作、内置水印函数的操作
1
升级 flink的window的ReduceFunction、AggregateFunction、ProcessWindowFunction、具有增量聚合的ProcessWindowFunction、在 ProcessWindowFunction 中使用每个窗口状态
1
新增flink的state的ttl机制、state的数据结构的api升级、Queryable State知识点
1
新增Flink异步io的vertx框架实现、flink的join操作(Tumbling Window Join、Sliding Window Join、Session Window Join)
1
新增Streaming File Sink连接器的小文件操作
1
新增数据类型及序列化的原理和实现案例
1
新增Flink Action综合练习:热门销售排行TopN的使用案例、布隆过滤器结合TTL的使用案例
课程名称
Python+大数据开发课程
课程推出时间
2021.01.01
课程版本号
1.6
主要针对
Spark3.x
主要使用开发工具
Pycharm、Idea、Datagrip、FinalShell
课程介绍
● 针对Spark3.x版本的重大更新,应对就业岗位需求的快速变化,大数据课程推出基于Python的Spark课程
● 新增大数据工程师必备的SQL面试进阶强化内容,提升大数据开发工程师核心SQL能力
● 新增大厂数仓架构专题内容,提升数据仓库建设能力
1
升级Hadoop为3.3.0版本、Hive版本为3.1.2版本、HIve3.x架构
1
新增使用Python实现MR原理机制、OLAP、OLTP区别
1
新增MapReduce计算PI原理、MapReduce Python接口调用、Hadoop Streaming提交程序、ETL、ELT区别
1
新增HIve3新特性、Hive3数据压缩,存储格式、Hive CTE表达式
1
升级union联合查询、Hive知识点案例 同步为Hive3版本、Linux课程、Mysql RPM安装方式以支持hive3
1
升级Spark语言为官方推荐使用的Python语言、版本更新为Spark3.1.2发行版、adoop3.3.0、Hive3.1.2版本
1
新增PySpark的安装、任务提交方式、多种模式spark-submit、实现wordcount案例实战
1
新增Python实现RDD操作、DataFrame操作、实现Sougou分词案例、IP热度分析案例、PV-UV-TOPK案例
1
新增PySparkSQL实现基础统计操作、底层Dataframe转化RDD原理操作、实现电影评分数据集分析、离线教育案例、新零售分析案例
1
新增PySparkSQL的优化方式、分布式引擎实现、与HIve整合
课程名称
Python+大数据开发课程
课程推出时间
2020.06.01
课程版本号
1.0
主要针对
大数据引入Python语言、Pandas数据分析
主要使用开发工具
Pycharm、Idea、Datagrip
课程介绍
● 8.1版本以前的数据开发课程,需要一定Java基础和工作经验,为了帮助进入数据开发行业的零基础学员找到适宜的入门途径,大数据引入Python语言,全新升级为Python+大数据开发1.0版本。
● 学习Python大数据开发,以Python技术栈处理中小型数据集,以大数据技术栈处理海量大规模数据,成为全能企业级数据开发人才。
● 其特点适合零基础学员,从完全没有编程经验开始;课程内容宽并且深,技术大牛亲自授课;面向市场,学即可用,能让学员高薪就业。
1
新增Python基础语言课程
1
新增Python高级语言进阶课程
1
新增Python爬虫课程
1
新增Pandas数据分析课程
1
新增多场景案例分析,应对中小型数据统计分析
课程名称
云计算大数据实战班
课程推出时间
2020.01.01
课程版本号
8.0
主要针对系统
Windows、Linux、MacOS
主要使用开发工具
DataGrip、IDEA
课程介绍
● 根据大量的行业调研分析,本次课程更新以大数据开发为主线,在7.0基础上再次缩减Java课程占比,弱化各类组件安装。
● 针对大数据技术深度和广度进行升级,例如新增Spark内存管理、Flink性能优化及反压、背压原理等同时为提高学员的就业薪资,推出多行业项目解决方案,例如证券、物流等。
● 以周为单位进行课程更新升级,新增Elastic Stack、 出行、电商、视频、社交等领域大数据解决方案、 一线大厂技术架构、 新零售大数据项目实战,离线实时全覆盖。
1
新增数据仓库、ETL、BI开发
1
新增Oracle及PLSQL编程、数据微服务开发
1
新增Spark的内存管理、avro序列化数据源
1
新增continuous processing、偏移量管理机制
1
新增KafkaStreams编程、exactly-once、Kafka事务、metrics监控
1
新增Hbase的协处理器和phoneix的二级索引实现、布隆过滤器、LSM树、StoreFiles结构剖析
1
新增FLink性能优化及反压、背压指标计算原理、FlinkSQL On Hive、Flink HistoryServer、Flink的UDF、UDAF、UDTF的实现
1
新增在线教育行业、物流行业、物联网行业、证券行业项目
1
升级分布式缓存系统, 万亿级NoSQL海量数据存储, 分布式流处理平台、电商行业项目
1
删除删减 JavaWeb
课程名称
云计算大数据实战班
课程推出时间
2019.07.22
课程版本号
7.0
主要针对版本
CDH5.14、Spark2.2.0、Flink1.8、Kafka0.11.0.2、ELK6.0
主要使用开发工具
IntelliJ IDEAA
课程介绍
● 大数据技术目前在企业里面使用的越来越广泛,对大数据人才的需求越来越多,大数据的整个课程体系是由来自大型互联网、外企等具有5年以上的一线大数据高级工程师、架构师和高级机器学习工程师设计出来的,内容含金量非常高。
● 课程体系涉及的技术以企业需求为导向,课程涉及的项目也是企业里面真实的项目,通过理论、实践和真实的项目相结合,让学员能够快速、深刻的掌握大数据常用的核心技术和开发应用,同时可以满足企业对中、高端大数据人才的需求。
● 大数据课程体系除了包含常用的Hadoop、Hive、Hbase、ELK、Sqoop、Flume、Kafka、Spark等技术和项目,还新增了目前互联网比较流行的Flink、Druid、Kylin等技术和项目,同时引入了机器学习和深度学习Spark Mllib和Tensorflow等技术和项目实战。
1
新增Impala即席查询组件、Kudu列存储服务、Structured Streaming结构化数据流处理
1
新增spark MLlib数据挖掘、spark graphX图计算
1
升级Flink的基础课程和案例实战
1
新增Flink高级特性CEP、Kylin数据OLAP分析、Druid时序数据实时分析、Kettle数据ETL工具
1
新增深度学习框架Tensorflow
1
新增用户画像、数据仓库大型企业实战型项目
课程名称
云计算大数据实战班
课程推出时间
2018.09.10
课程版本号
6.0
主要针对版本
JDK1.8\CDH2.7.4\Storm1.1.1\Spark 2.1
主要使用开发工具
IntelliJ IDEA
课程介绍
● 本课程是基于V5.0的一次重大更新,汇总并收集了大数据学科一年以来15个零基础班级的授课信息、学习信息、就业信息。
● 重新调整了课程的分布情况,新增了大数据综合项目,新增了第四代大数据处理框架FLink,新增了数据库优化,新增了JVM基础及原理,新增了Spark性能调优等内容。
● 课程升级方面,主要对机器学习课程进行了升级,推荐系统项目后置变成7天的丰富课程,提升学员进入机器学习的竞争力,从而更好的从事人工智能领域相关的工作。
● 整体而言,课程在培养中高级大数据工程师的方向上又前进了一大步。
1
新增Hadoop 2.7.2\Storm1.1.1\Spark 2.1
1
新增Java virtual machine原理分析、Java高并发核心知识
1
新增数据库优化及调优、第四代大数据处理框架Apache Flink、Spark原理深入剖析及生产调优
1
新增互联网反欺诈项目实战、广告系统业务模型及CTR预估
1
新增用户画像、数据仓库大型企业实战型项目
1
升级用户画像概述/数据/建模/算法实战、推荐系统协同过滤算法实战、基于内容的推荐系统实战、基于关联规则推荐系统实战
1
升级混合推荐与CTR点击预估
1
升级Hadoop版本为CDH
课程名称
云计算大数据实战班
课程推出时间
2017.07.01
课程版本号
5.0
主要针对版本
JDK1.8\Hadoop 2.7.2\Storm1.1.1\Spark 2.1
主要使用开发工具
Eclipse、IDEA
课程介绍
● Java基础、JavaWeb核心编程、JavaWeb三大框架、网络爬虫、分布式电商网站开发等课程模块。培养学生编程能力,让零基础学员能够更好的学习大数据项目。
● 大数据方面方面,新增点击流日志收集系统、用户日志分析报表系统、用户画像系统等案例。让学员不仅仅学习到大数据技术点,能够使用大数据解决实际问题。
● 扩充机器学习课程为10天。该课程历时一年研发,深入浅出,能够让学员更好的入门机器学习,成为人工智能开发的初级工程师。
1
升级Hadoop 2.7.2\Storm1.1.1\Spark 2.1
1
新增网络爬虫开发
1
新增三大框架开发
1
新增JavaWeb核心
1
新增Java语言基础
课程名称
云计算大数据实战班
课程推出时间
2016.03.01
课程版本号
4.0
主要针对版本
JDK7.x
主要使用开发工具
Eclipse、IDEA
课程介绍
● 对比原有课程,本次课程做了重大更新,将大数据的核心技术hadoop及其生态圈技术完美的融入到了课程中。
● 课程分阶段的进行案例实战和项目实战,在大数据方面知识体系更加完整,课程更加深度有深度,更加贴近实战。
● 分阶段的进行大数据生态圈的学习,将生态圈分为离线处理,实时流计算和实现火热的spark内存计算,完美的将生态圈进行了抽离和归类,让学习变得更便捷。
1
升级Spark1.6版本
1
新增Linux操作系统和shell脚本学习
1
新增JVM内存模型分析、NIO、Netty、自定义RPC框架
1
新增电商点击流日志分析、电商实时日志告警平台、交易风控风控平台、流量日志分析分析
1
新增Spark游戏日志分析项目
1
删除KVM虚拟化技术、网络基础和OpenvSwitch技术、Ceph存储技术
1
删除CloudStack云管理平台、混合云管理平台项目
课程名称
云计算大数据实战班
课程推出时间
2015.05.15
课程版本号
3.0
主要针对版本
JDK7.x
主要使用开发工具
Eclipse、IDEA
课程介绍
● 本次更新将大数据和虚拟化这两大热门技术加入到课程体系中,在大数据方面知识体系更加完整,课程更加深度有深度,更加贴近实战。
● 在虚拟化方面,选择了在云计算领域常用的虚拟化、网络、存储等技术,并通过Apache CloudStack技术整合,在此基础上开发混合云管理平台。
1
升级Hadoop2.0版本、Hive优化课程
1
新增电信流量运营分析项目、混合云管理平台项目
1
新增Scala函数式编程、Spark内存计算、KVM虚拟化技术
1
新增网络基础和OpenvSwitch技术
1
新增Ceph存储技术、CloudStack云管理平台
课程名称
云计算大数据实战班
课程推出时间
2014.02.15
课程版本号
2.0
主要针对版本
JDK6.x
主要使用开发工具
Eclipse
课程介绍
● 随着近年来云计算大数据的大力发展,市场对相关人才需求急增,所以本版课程在原有的云计算课程进行了颠覆性的改革,把原来只有1天的课程扩展为7天,加入了Hadoop生态圈的相关技术。
1
升级云计算课程、Hadoop集群部署、优化HDSF、MapReduce案例
1
新增Hadoop生态圈相关技术:Zookeeper、Hive、Hbase、Sqoop、Flume
1
新增Storm实时计算技术和案例
1
新增黑马论坛日志分析项目
课程名称
云计算大数据实战班
课程推出时间
2012.02.15
课程版本号
1.0
主要针对版本
JDK6.0
主要使用开发工具
Eclipse
课程介绍
● 近期云计算概念火爆异常,传智教育敏锐的嗅探到大数据技术的悄然兴起,并预测大数据技术将会像雨后春笋一样快速发展,所以传智教育与时俱进在课程中引入了1天的云计算课程,作为拥有大数据课程的培训机构,传智教育大数据实战班助力学员可以掌握新的技术,拓宽学员的就业方向,增强就业竞争力。
1
新增云计算课程:云计算和大数据相关概念
1
新增Hadoop 1.0伪分布式环境部署
1
新增HDFS、MapReduce应用案例