首页 新技术应用Hadoop大数据

Hadoop大数据

课时: 7.4h
小节数: 15节
有效时间: 180 天
学习人数: 393人
已购买
0.0 / 375.00 学豆
0/15小节

Hadoop大数据

主讲:向磊 

一、课程体系结构

序号

课程概括

课程名称

1

Hadoop生态系统简介

第一节Hadoop生态系统简介(一)

第二节:Hadoop生态系统简介(二)

2

Hadoop开源技术运用

第三节Hadoop开源技术运用(一)

第四节:Hadoop开源技术运用(二)

3

Hadoop部署及运维

第五节Hadoop部署及运维(一)

第六节Hadoop部署及运维(二)

第七节Hadoop部署及运维(三)

第八节:Hadoop部署及运维(四)

4

深入理解HDFS

第九节:深入理解HDFS(一)

第十节:深入理解HDFS(二)

5

海量数据处理—Hive数据仓库

第十一节Hive数据仓库(一)

第十二节Hive数据仓库(二)

第十三节Hive数据仓库(三)

第十四节:Hive数据仓库(四)

6

性能优化及调度器

第十五节:性能优化及调度器

 

二、讲师介绍

    向磊:知名IT专家,Hadoop课程资深顾问,Easyhadoop开源社区创始人,国内大型企业Hadoop内训讲师,清华大学国际传播研究中心课题研究员,开源开放数据平台phpHiveAdmin作者,开源自动化部署监控工具EasyHadoop作者,中科普开hadoop资深顾问。先后为联通研究院、惠普、深圳证券交易所等单位做过大数据内训课程的授课。

 

三、课程介绍

Hadoop生态系统简介(第1-2节)

    本部分内容将围绕Hadoop的创立和历史沿革、Hadoop的基本概念、HDFS基础知识、Mapreduce基础知识、Hadoop生态系统等方面来介绍Hadoop生态系统的相关知识。目的是为了让学员了解并掌握Hadoop生态系统、应用环境及其解决方案。

 

Hadoop开源技术运用(第3-4节)

    本部分内容主要围绕大数据和数据仓库概述,Hadoop应用案例和云平台,Hadoop数据仓库最佳实践,数据可视化案例,基于数据仓库平台改造变迁等内容来介绍Hadoop开源技术的相关知识。目的是让学员了解并掌握Hadoop应用背景、Hadoop应用案例和技术最佳实践。

 

Hadoop部署及运维(第5-8节)  

    本部分内容主要介绍Hadoop分布式系统的基本运维知识、技能与常用工具。旨在让学员能够掌握Hadoop部署的相关操作和运维知识点。

 

深入理解HDFS(第9-10节) 

    本部分内容将围绕开发动机、设计原则、基础结构、数据损坏处理等内容来介绍HDFS的相关知识,旨在帮助学员了解并掌握HDFSMap/Reduce的架构与原理。

 

海量数据处理—Hive数据仓库(第11-14节)

    本部分内容将围绕数据构建、使用方式、性能优化,如何做好HQL语言的调优和参数调优等方面来介绍Hive数据仓库的相关知识;旨在让学员能够了解并熟悉Hadoop自动化部署与运维的工具和原理。

 

性能优化及调度器(第15节)

    本部分内容将围绕Codelevel优化、mapred-site.xml配置方法、FIFO等方面介绍Hadoop性能优化及调度器的相关知识,旨在帮助学员了解并掌握Hadoop性能优化及调度器的选择和使用方法。

      知名IT专家,Hadoop课程资深顾问,Easyhadoop开源社区创始人,国内大型企业Hadoop内训讲师,清华大学国际传播研究中心课题研究员,开源开放数据平台phpHiveAdmin作者,开源自动化部署监控工具EasyHadoop作者,中科普开hadoop资深顾问。先后为联通研究院、惠普、深圳证券交易所等单位做过大数据内训课程的授课。

查看其他课程