Spark3大数据实时处理-Streaming+Structured Streaming 实战|完结无秘

〖课程介绍〗:

  •   基于Spark3,在同一项目中,学习两套实时处理的解决方案:Spark Streaming和Structured Streaming,体验完整实时处理方案的全流程,为你梳理大数据常见面试题、大厂的实时解决方案,带你跨过面试最后一公里。全网首发:基于新版Spark3,掌握两种实时流处理解决方案
  • 经过分析迭代,选择更优方案,还原实时处理系统的开发全流程

〖老师介绍〗:

  •   八年互联网公司一线研发经验,担任大数据架构师。主要从事基于Spark/Flink为核心打造的大数据公有云、私有云数据平台产品的研发。改造过Hadoop、Spark等框架的源码为云平台提供更高的执行性能。集群规模过万,有丰富的大数据项目实战经验以及授课经验(授课数千小时,深受学员好评)。

〖课程目录〗:

  • 第1章 【项目启动】项目背景及架构分析 9 节 | 43分钟
  • 本章将介绍实战项目背景、数据流,并让大家对知晓在实际项目中应如何进行技术的选型以及项目架构的迭代过程。
    • 视频:1-1 课程概览 (15:06)
    • 图文:1-2 ***学前必读***(助你平稳踩坑,畅学无忧,课程学习与解决问题指南)
    • 视频:1-3 课程目录 (01:31)
    • 视频:1-4 项目目的 (03:15)
    • 视频:1-5 项目流程 (03:56)
    • 视频:1-6 技术选型 (04:21)
    • 视频:1-7 项目总体架构 (03:05)
    • 视频:1-8 项目架构V1版本 (08:11)
    • 视频:1-9 项目架构V2版本 (02:57)
  • 第2章 【环境部署】基础开发环境搭建8 节 | 55分钟
  • 工欲利其事必先利其器,本章重点介绍项目实战中要使用的大数据框架的部署,基础不是很牢固的同学要认真看哦。
    • 视频:2-1 课程目录 (01:39)
    • 视频:2-2 OOTB环境的使用介绍 (11:34)
    • 视频:2-3 JDK部署 (04:49)
    • 视频:2-4 Scala部署 (04:55)
    • 视频:2-5 Maven部署(一定要仔细听) (07:42)
    • 视频:2-6 Hadoop配置 (09:10)
    • 视频:2-7 Hadoop格式化&启停 (08:31)
    • 视频:2-8 ZK部署 (06:04)
  • 第3章 【数据采集】构建日志服务器14 节 | 95分钟
  • 本章节讲解项目中要使用的数据是如何产生及落地的。我们将采用Spring Boot开发日志服务,将访问日志通过日志服务落地到日志服务器磁盘。
    • 视频:3-1 课程目录 (01:49)
    • 视频:3-2 数据产生和上报流程 (08:02)
    • 视频:3-3 构建多Module工程 (12:00)
    • 视频:3-4 快速构建第一个Spring Boot应用程序 (09:47)
    • 视频:3-5 SpringBoot热部署 (03:50)
    • 视频:3-6 关于Annotation的补充 (09:58)
    • 视频:3-7 yml配置文件的使用 (03:08)
    • 视频:3-8 开发日志服务Controller (05:17)
    • 视频:3-9 客户端上报日志功能开发 (11:19)
    • 视频:3-10 客户端与日志服务器联调测试 (07:46)
    • 视频:3-11 客户端日志上报到日志服务器并落盘 (06:17)
    • 视频:3-12 日志服务部署到服务器上运行并联调 (05:18)
    • 视频:3-13 对接项目数据到日志服务器 (05:18)
    • 视频:3-14 作业 (04:32)
  • 第4章 【数据收集】基于Flume构建分布式日志收集 23 节 | 160分钟
  • 本章节讲解如何采用Flume来完成日志数据的收集工作。讲解Flume在生产上不同的场景的经典部署方案、Flume Agent的不同选型及配置、在生产环境Flume高可用的使用以及如何基于Flume进行二次开发,并使用Flume收集上一个章节中产生的日志数据。…
    • 视频:4-1 课程目录 (03:32)
    • 视频:4-2 产生背景 (04:06)
    • 视频:4-3 采集和收集的区别 (05:59)
    • 视频:4-4 Flume概述 (05:44)
    • 视频:4-5 Flume版本迭代 (01:43)
    • 视频:4-6 Flume体系架构与三大核心组件 (13:28)
    • 视频:4-7 业界数据收集框架对比 (09:50)
    • 视频:4-8 Flume部署 (04:58)
    • 视频:4-9 Flume Agent编程案例 (15:21)
    • 视频:4-10 Event (02:24)
    • 视频:4-11 Flume经典部署方案 (08:00)
    • 视频:4-12 Flume收集文件数据到HDFS需求分析 (08:21)
    • 视频:4-13 Flume收集文件数据到HDFS实现 (07:25)
    • 视频:4-14 Flume收集文件夹数据到HDFS (08:32)
    • 视频:4-15 TailDirSource实战(非常重要) (13:00)
    • 视频:4-16 Flume拦截器二次开发需求分析 (09:10)
    • 视频:4-17 Flume自定义拦截器开发(非常重要) (09:23)
    • 视频:4-18 Flume自定义拦截器Agent配置(非常重要) (06:50)
    • 视频:4-19 Flume自定义拦截器功能测试 (06:18)
    • 视频:4-20 使用Flume收集日志服务器落地的日志数据 (03:18)
    • 视频:4-21 面试题谈谈你对Flume高可用的看法(重要) (08:09)
    • 视频:4-22 本章作业 (03:46)
    • 图文:4-23 【夯实学习成果,攻克面试官】Flume面试题
  • 第5章 【消息队列】基于Kafka构建实时数据交换 14 节 | 111分钟
  • Kafka是大数据项目选型中使用的最多的消息队列框架,本章节要掌握Kakfa的部署、使用命令行和API的方式进行Kafka的相关操作,分析Kafka的数据存储是什么样,并重点分析一个高频面试题ack的使用。最终完成,使用Kafka对接上一个章节Flume数据到的数据。…
    • 视频:5-1 课程目录 (01:55)
    • 视频:5-2 Kafka概述 (05:56)
    • 视频:5-3 Kafka核心术语(重要) (18:50)
    • 视频:5-4 Kafka单Broker部署及使用 (13:15)
    • 视频:5-5 Kafka多Broker部署及使用 (11:07)
    • 视频:5-6 容错姓测试 (03:14)
    • 视频:5-7 Kafka Producer API编程 (11:22)
    • 视频:5-8 Kafka Consumer API编程(重要) (07:37)
    • 视频:5-9 Kafka对接Flume收集的数据 (06:37)
    • 视频:5-10 对接项目数据到Kafka (03:16)
    • 视频:5-11 Kafka数据存储(非常重要) (14:07)
    • 视频:5-12 面试题谈谈你对acks的看法(非常重要) (12:50)
    • 图文:5-13 【夯实学习成果,攻克面试官】Kafka面试题
    • 作业:5-14 【讨论题】谈谈你对Kafka的认识
  • 第6章 【实时流处理】Spark Streaming核心API及编程初探21 节 | 177分钟
  • 本章节会先带领大家知晓SparkStreaming能做什么,快速构建第一个Spark Streaming的应用程序并在本地和打包在服务器上运行,然后重点讲解基于开发Spark Streaming应用程序的核心概念,并详解如何对接socket和HDFS文件系统上的数据进行处理。如何使用Spark Streaming进行状态相关的处理以及整合Spark SQL的使用。…
    • 视频:6-1 课程目录 (04:07)
    • 视频:6-2 Spark Streaming概述 (10:50)
    • 视频:6-3 Spark Streaming宏观角度了解 (06:52)
    • 视频:6-4 基于IDEA+Maven构建第一个流处理应用程序 (13:31)
    • 视频:6-5 本地功能测试 (06:11)
    • 视频:6-6 官网案例解读 (04:25)
    • 视频:6-7 Spark部署及服务器端测试 (11:41)
    • 视频:6-8 StreamingContext编程注意事项 (11:12)
    • 视频:6-9 核心概念DStream (07:14)
    • 视频:6-10 核心概念Input DStream和Receiver (07:57)
    • 视频:6-11 实战之读取文件系统的数据 (07:28)
    • 视频:6-12 常用Transformation操作 (08:07)
    • 视频:6-13 实战之日志数据过滤RDD方式实现 (11:02)
    • 视频:6-14 实战之日志数据过滤transform方式实现 (09:12)
    • 视频:6-15 实战之带状态的应用程序开发 (11:57)
    • 视频:6-16 常用Output操作 (09:48)
    • 视频:6-17 实战之统计结果写入数据库(非常重要) (12:01)
    • 视频:6-18 快速了解Spark SQL进行数据分析 (05:31)
    • 视频:6-19 实战之SparkStreaming和Spark SQL的整合使用 (03:50)
    • 视频:6-20 面试题之谈谈你对消费语义的认识 (13:44)
    • 图文:6-21 【夯实学习成果,攻克面试官】Spark Streaming面试题
  • 第7章 【实时流处理】应用Spark Streaming实现数据分析及调优39 节 | 298分钟
  • 本章节将讲解使用Spark Streaming进行项目实战。重点分析Spark Streaming如何对接Kafka的数据进行消费以及偏移量的自定义维护管理,使用Spark Streaming进行数据清洗以及项目功能的实现。并且,在完成功能的基础上如何进行其他功能的扩展、常用的调优点以及大数据集群规划。本章节是线上开发以及面试过程中必须掌握的!….
    • 视频:7-1 课程目录 (05:21)
    • 视频:7-2 项目需求介绍 (03:02)
    • 视频:7-3 论Offset对整个实时作业处理结果的影响 (10:56)
    • 视频:7-4 图解SparkStreaming整合Kafka offset的管理机制 (05:32)
    • 视频:7-5 使用checkpoint维护offset (09:40)
    • 视频:7-6 自定义维护offset的表结构设计 (05:09)
    • 视频:7-7 使用ScalikeJDBC对MySQL进行读写操作 (15:06)
    • 视频:7-8 Offset的获取及存储注意事项 (07:11)
    • 视频:7-9 自定义维护Offset存储实现 (08:42)
    • 视频:7-10 自定义维护Offset读取实现 (12:16)
    • 视频:7-11 Offset管理封装及作业 (05:27)
    • 视频:7-12 数据流打通及日志字段描述 (06:54)
    • 视频:7-13 数据清洗功能 (12:00)
    • 视频:7-14 功能三需求分析 (04:37)
    • 视频:7-15 HBase初探 (06:36)
    • 视频:7-16 HBase部署 (04:07)
    • 视频:7-17 HBase核心API编程 (19:05)
    • 视频:7-18 需求三功能实现 (08:36)
    • 视频:7-19 功能四功能实现 (03:39)
    • 视频:7-20 功能扩展及实现思路 (05:54)
    • 视频:7-21 Spark调优之序列化 (14:31)
    • 视频:7-22 调优之序列化在SS中的使用场景 (07:00)
    • 视频:7-23 调优之设置合理的Batch Interval (09:06)
    • 视频:7-24 调优之限速 (08:35)
    • 视频:7-25 集群规模评估 (15:42)
    • 视频:7-26 集群部署进程分布规划 (07:44)
    • 视频:7-27 HBase逻辑模型 (09:53)
    • 视频:7-28 HBase物理存储模型 (05:49)
    • 视频:7-29 HBase架构宏观角度分析 (03:33)
    • 视频:7-30 HBase架构组件职责 (07:42)
    • 视频:7-31 面试题之HBase寻址机制(重要) (13:39)
    • 视频:7-32 面试题之HBase写数据流程(重要) (07:53)
    • 视频:7-33 面试题之HBase读数据流程 (03:51)
    • 视频:7-34 项目打包并运行在YARN上 (11:26)
    • 图文:7-35 HBase表及rowkey设计原则
    • 视频:7-36 本章总结及作业 (11:29)
    • 图文:7-37 【夯实学习成果,攻克面试官】Spark Streaming面试题
    • 作业:7-38 【讨论题】谈谈你对HBase的认识
    • 作业:7-39 【讨论题】SparkStreaming对接Kafka的关键点
  • 第8章 【实时流处理】Structured Streaming企业级应用19 节 | 137分钟
  • 本章节将介绍Spark中新的流式模块Structured Streaming。通过本章学习,大家会知晓与Spark Streaming的优势体现在哪、掌握Structured Streaming的编程模型以及核心概念、基于EventTime的实时处理方式、对接常用数据源以及Streaming DataFrame编程、对接常用的Sink、Watermark机制和处理延迟数据的解决方案。…
    • 视频:8-1 课程目录 (06:05)
    • 视频:8-2 SparkStreaming的不足 (13:14)
    • 视频:8-3 Structured Streaming概述 (06:13)
    • 视频:8-4 快速开发第一个Structured Streaming应用程序 (13:24)
    • 视频:8-5 Structured Streaming编程模型 (10:03)
    • 视频:8-6 处理EventTime和延迟数据 (09:45)
    • 视频:8-7 使用SQL完成统计分析 (02:53)
    • 视频:8-8 对接csv数据源数据 (06:09)
    • 视频:8-9 对接分区数据源数据 (04:33)
    • 视频:8-10 对接Kafka数据源数据 (10:31)
    • 视频:8-11 基于EventTime的窗口统计原理详解 (05:33)
    • 视频:8-12 基于EventTime的窗口统计功能实现 (10:35)
    • 视频:8-13 延迟数据处理及Watermark (11:06)
    • 视频:8-14 File Sink (05:31)
    • 视频:8-15 Kafka Sink (03:19)
    • 视频:8-16 ForeachSink到MySQL (13:37)
    • 视频:8-17 容错语义 (03:57)
    • 图文:8-18 【夯实学习成果,攻克面试官】Structured Streaming 实战面试题
    • 作业:8-19 【讨论题】实时处理框架选型问题
  • 第9章 【实时流处理】应用Structured Streaming实现数据分析及调优10 节 | 60分钟
  • 本掌中将使用Structured Streaming框架来实现Spark Streaming项目中的清洗和统计功能,做到举一反三的功效,使得大家会使用不同的框架来进行相关业务的开发和处理。
    • 视频:9-1 课程目录 (02:05)
    • 视频:9-2 项目需求 (03:39)
    • 视频:9-3 数据清洗 (09:54)
    • 视频:9-4 Redis概述及部署 (07:46)
    • 视频:9-5 Redis命令行操作快速入门 (09:04)
    • 视频:9-6 通过Jedis API操作Redis (04:50)
    • 视频:9-7 将统计结果输出到Redis (09:34)
    • 视频:9-8 打包到服务器运行 (04:13)
    • 视频:9-9 调优及作业 (08:05)
    • 图文:9-10 【夯实学习成果,攻克面试官】Structured Streaming 面试题
  • 第10章 【数据可视化】使用Echarts完成数据展示14 节 | 116分钟
  • 本章节将对使用Spark Streaming以及Structured Streaming统计分析的结果进行可视化展示,采用前后端分离,请求后台查询服务接口并通过Echarts进行展示【前端部分采用React封装Echarts,源码随课赠送】。
    • 视频:10-1 课程目录 (02:36)
    • 视频:10-2 Spring Data概述 (06:07)
    • 视频:10-3 Spring Data整合MySQL开发环境准备及实体类开发 (09:41)
    • 视频:10-4 Spring Data存取MySQL功能开发及测试 (10:48)
    • 视频:10-5 Controller层开发及测试 (04:02)
    • 视频:10-6 常用可视化框架介绍 (09:08)
    • 视频:10-7 Echarts图形形成方式 (03:32)
    • 视频:10-8 Spring Boot整合Echarts快速开发一个可视化展示功能 (08:03)
    • 视频:10-9 Spring Data整合HBase开发环境搭建 (08:06)
    • 视频:10-10 Spring Data整合HBase查询功能开发及测试 (15:13)
    • 视频:10-11 Spring Data整合Redis查询功能开发及测试 (12:32)
    • 视频:10-12 可视化项目部署 (06:37)
    • 视频:10-13 前后端服务部署及效果演示 (07:13)
    • 视频:10-14 前后端交互流程分析 (11:28)
  • 第11章 【拓展&经验分享】核心梳理及面试指导9 节 | 65分钟
  • 本章节在对课程重难点内容进行总结的同时,重点分享面试过程中HR常考点、准备大数据简历注意要素、以及实时处理在大厂中的应用。
    • 视频:11-1 课程目录 (01:00)
    • 视频:11-2 HR面试常考点一 (08:28)
    • 视频:11-3 HR面试常考点二 (07:45)
    • 视频:11-4 HR面试常考题三 (07:17)
    • 视频:11-5 HR面试常考点作业 (01:26)
    • 视频:11-6 简历编写及面试准备 (14:43)
    • 视频:11-7 Spark&NoSQL实时数据处理实践案例分享 (17:31)
    • 视频:11-8 课程总结与展望 (06:18)
    • 作业:11-9 【讨论题】谈谈离线处理和实时处理的区别
免责声明: 1、本站信息来自网络,版权争议与本站无关 2、本站所有主题由该帖子作者发表,该帖子作者与本站享有帖子相关版权 3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和本站的同意 4、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责 5、用户所发布的一切软件的解密分析文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。 6、您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。 7、请支持正版软件、得到更好的正版服务。 8、如有侵权请立即告知本站,本站将及时予与删除 9、本站所发布的一切破解补丁、注册机和注册信息及软件的解密分析文章和视频仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。
600学习网 » Spark3大数据实时处理-Streaming+Structured Streaming 实战|完结无秘