主讲:向磊
一、课程体系结构
|
序号 |
课程概括 |
课程名称 |
|
1 |
Hadoop生态系统简介 |
第一节:Hadoop生态系统简介(一) 第二节:Hadoop生态系统简介(二) |
|
2 |
Hadoop开源技术运用 |
第三节:Hadoop开源技术运用(一) 第四节:Hadoop开源技术运用(二) |
|
3 |
Hadoop部署及运维 |
第五节:Hadoop部署及运维(一) 第六节:Hadoop部署及运维(二) 第七节:Hadoop部署及运维(三) 第八节:Hadoop部署及运维(四) |
|
4 |
深入理解HDFS |
第九节:深入理解HDFS(一) 第十节:深入理解HDFS(二) |
|
5 |
海量数据处理—Hive数据仓库 |
第十一节:Hive数据仓库(一) 第十二节:Hive数据仓库(二) 第十三节:Hive数据仓库(三) 第十四节:Hive数据仓库(四) |
|
6 |
性能优化及调度器 |
第十五节:性能优化及调度器 |
二、讲师介绍
向磊:知名IT专家,Hadoop课程资深顾问,Easyhadoop开源社区创始人,国内大型企业Hadoop内训讲师,清华大学国际传播研究中心课题研究员,开源开放数据平台phpHiveAdmin作者,开源自动化部署监控工具EasyHadoop作者,中科普开hadoop资深顾问。先后为联通研究院、惠普、深圳证券交易所等单位做过大数据内训课程的授课。
三、课程介绍
Hadoop生态系统简介(第1-2节)
本部分内容将围绕Hadoop的创立和历史沿革、Hadoop的基本概念、HDFS基础知识、Mapreduce基础知识、Hadoop生态系统等方面来介绍Hadoop生态系统的相关知识。目的是为了让学员了解并掌握Hadoop生态系统、应用环境及其解决方案。
Hadoop开源技术运用(第3-4节)
本部分内容主要围绕大数据和数据仓库概述,Hadoop应用案例和云平台,Hadoop数据仓库最佳实践,数据可视化案例,基于数据仓库平台改造变迁等内容来介绍Hadoop开源技术的相关知识。目的是让学员了解并掌握Hadoop应用背景、Hadoop应用案例和技术最佳实践。
Hadoop部署及运维(第5-8节)
本部分内容主要介绍Hadoop分布式系统的基本运维知识、技能与常用工具。旨在让学员能够掌握Hadoop部署的相关操作和运维知识点。
深入理解HDFS(第9-10节)
本部分内容将围绕开发动机、设计原则、基础结构、数据损坏处理等内容来介绍HDFS的相关知识,旨在帮助学员了解并掌握HDFS和Map/Reduce的架构与原理。
海量数据处理—Hive数据仓库(第11-14节)
本部分内容将围绕数据构建、使用方式、性能优化,如何做好HQL语言的调优和参数调优等方面来介绍Hive数据仓库的相关知识;旨在让学员能够了解并熟悉Hadoop自动化部署与运维的工具和原理。
性能优化及调度器(第15节)
本部分内容将围绕Codelevel优化、mapred-site.xml配置方法、FIFO等方面介绍Hadoop性能优化及调度器的相关知识,旨在帮助学员了解并掌握Hadoop性能优化及调度器的选择和使用方法。