【课程介绍】
给大数据工程师的运维修炼手册
【课程目录】
目录 /共32节
开篇词
开篇词:掌握大数据,把握未来
模块一:Hadoop 大数据平台的规划与部署
第01讲:大话 Hadoop 生态圈
第02讲:Hadoop 发行版选型和伪分布式平台的构建
第03讲:自动化运维工具 Ansible 在部署大数据平台下的应用(上)
第04讲:自动化运维工具 Ansible 在部署大数据平台下的应用(下)
第05讲:手动模式构建双 Namenode+Yarn 的 Hadoop 集群(上)
第06讲:手动模式构建双 Namenode+Yarn 的 Hadoop 集群(下)
第07讲:通过 Ambari 工具自动化构建 Hadoop 大数据平台和外围应用(上)
第08讲:通过 Ambari 工具自动化构建 Hadoop 大数据平台和外围应用(下)
第09讲:如何通过 Hive/tez 与 Hadoop 的整合快速实现大数据开发(上)
第10讲:如何通过 Hive/tez 与 Hadoop 的整合快速实现大数据开发(下)
模块二:Hadoop 分布式架构解析
第11讲:HDFS 组件运行机制剖析及 HDFS Shell 的使用
第12讲:Hadoop 分布式资源管理器 Yarn、MR 运行机制剖析
模块三:Hadoop 外围应用整合实战
第13讲:Spark Standalone 模式的构建以及 Spark 与 Yarn 的整合
第14讲:HBase 与 Hadoop 的整合应用实践
第15讲:Flink Standalone、Flink on Yarn 集群构建与应用场景
模块四:Hadoop 大数据平台数据收集应用实践
第16讲:轻量级日志收集工具 Filebeat 应用案例
第17讲:日志收集、分析过滤工具 Logstash 应用实战
第18讲:Elasticsearch 应用架构的实现与调优
模块五:大数据平台日志传输与可视化应用实践
第19讲:Kafka 应用场景、集群容量规划、架构设计应用案例
第20讲:日均数据量 30 亿的 Filebeat+Kafka+Mirrormaker 跨机房实时日志传送案例
第21讲:Filebeat+Kafka+Logstash+Elasticsearch 构建可视化日志分析系统
模块六:大数据平台运维监控体系的构建.
第22讲:通过 Ganglia 实现对 HDFS、Yarn、Spark 运行状态监控
第23讲:Namenode、Datanode、Nodemanager 等服务状态监控策略
第24讲:通过 Kafka Eagle 实现对 Kafka 消息队列的监控
模块七:大数据平台性能调优与运维经验汇总
第25讲:Yarn 资源调度 Fair Schedule 与 Capacity Scheduler 配置选型
第26讲:HDFS 存储权限 ACL 控制策略以及与系统权限整合应用
第27讲:Yarn、HDFS、Kafka 内存调优策略以及性能瓶颈
第28讲:Hadoop 平台常见故障汇总以及操作系统性能调优
第29讲:大数据平台的硬件规划、网络调优、架构设计、节点规划
第30讲:Hadoop 跨集群数据迁移应用实践
结束语
结语:大数据运维,大有作为