大数据flink大数据实时计算系统实践视频教程 百度云
大数据视频教程名称:某象大数据flink大数据实时计算系统实践视频教程大数据视频教程集数:10讲
大数据视频教程简介:
1. Flink基本原理概述。指导学员了解并掌握Flink使用过程中设计到的基本概念和简要API,介绍大数据实时流计算相关生态体系,着重梳理清楚Flink上下游体系,掌握Flink的核心技术原理,建立大数据实时流计算的方法论思维。
2. Flink实战生产技术。从实战出发,围绕实时流计算业务场景分析、基本编程模型、高级特性等系统性介绍Flink实时流计算的实战技术,使得学员具备研发Flink实时流计算相关应用的基础能力。
3.Druid是一款支持数据实时写入、低延时、高性能的OLAP引擎,具有优秀的数据聚合能力与实时查询能力。在大数据分析、实时计算、监控等领域都有特定的应用场景,是大数据基础架构建设中重要的一环。本次课程我们将介绍Druid的核心特性与原理,以及在性能调优以及最佳实践经验。
**** Hidden Message *****
网盘密码:w8yc
第一课: Flink基本概念与部署1. Flink 简介2. 编程模型3. 运行时概念4. 应用部署与原理a. 部署模式b. On-Yarn 启动设置与原理c. Job 启动设置与原理第二课: DataStream1. DataStreamContext环境2. 数据源(DataSource)3. 转化(Transformation)4. 数据Sink第三课:Window & Time 1. Window介绍a. 为什么要有Windowb. Window类型2. Window API的使用a. Window的三大组件b. Time&watermarkc. 时间语义d. 乱序问题解决WaterMarke. AllowLateness正确设置与理解f. Sideoutput在Window中的使用3. Window的内部实现原理a. Window的处理流程b. Window中的状态存储4. 生产环境中的Window使用遇到的一些问题第四课: Connector1. 基本Connnector2. 自定义Source 与 Sink3. Kafka-connecotora. Kafka 简介b. Kafka Consumer 与Sink 的正确使用方式c. Kafka-Connector 内部机制与实现原理第五课: 状态管理与恢复机制1. 基本概念 2.KeyState 基本类型及用法a.ValueStateb.ListStatec.ReduceStated.FoldStatee.AggregatingState3.OperatorState基本用法4.Checkpoint a.概念 b. 开启checkpoint c.基本原理第六课: Metrics 与监控1.Metrics的种类2.Metrics的获取方式a. Web Uib. Rest APIc. MetricReporter3.用户自定义Metric指标方式4.监控和诊断:Metric和Druid 实时OLAP联合使用a. Metric上报b. Metric指标聚合c. Metric的分类和格式定义5. Druid查询和指标系统a. Flink作业反压监控b. Flink作业的延迟监控c. 其他6. Metric系统的内部实现7. 生产环境中的案例分析 — 通过指标来排查应用问题第七课: Flink应用案例介绍1. 数据清洗:map/flatmap等2. 监控告警系统a. 数据拉平b. 基础窗口计算等3. 线上运营系统4. 风控系统第八课: Druid基本概念与架构设计1. Druid与OLAP VS Kylin、ES等2. Druid与指标系统 VS 各种时序数据库3. Druid特性4. 基本架构:角色节点与基本职责a.角色行为b. 角色暴露的API5. 基本架构:外部依赖a. MySQL数据结构b. ZK数据结构c. HDFS数据结构第九课: Druid数据写入与查询1. 数据流向与存储格式a. 数据写入流程b. 存储与索引格式2. 实时数据写入a. Firehoseb. Realtime Nodec. Index-Service原理介绍d. Tranquility原理介绍e. Kafka-index-service原理3. 离线数据写入a. Indexerb. MR Indexer4. 查询模式与查询类型介绍第十课: Druid实践介绍1. 容错设计2. 指标监控a. 基于Graphite搭建指标监控系统b. 重要的指标项3. 运维实践a. 数据修复b. 集群升级实践c. Segment元数据管理d. JVM调优c. 资源隔离
感谢楼主的无私分享!要想学而知教育好 就靠你我他
页:
[1]