新浪微博 登陆  注册   设为首页 加入收藏

学PHP >> Android开发应用 >> 王家林的云计算分布式大数据Hadoop企业级开发动手实战

王家林的云计算分布式大数据Hadoop企业级开发动手实战

查看次数2381 发表时间2013-06-07 06:36:35

                                                        &n...

                                                                                                                                                                 王家林博客地址


一:课程简介:

Hadoop天生是解决大数据高并发问题的, 是一个能够对海量数据进行分布式处理的软件框架。互联网企业、金融机构、政府组织和云计算服务企业每天都会产生大量的数据并面临高并发的严峻考验,传统的关系型数据库已经无法满足大数据量高并发的要求,作为云计算实现规范和实施标准的Hadoop应运而生。

使用Hadoop,用户可以在不了解分布式底层细节的情况下开发出分布式程序,从而可以使用众多廉价的计算设备的集群的威力来高速的运算和存储,而且Hadoop的运算和存储是可靠的、高效的、可伸缩的,能够使用普通的社区服务器出来PB级别的数据,是分布式大数据处理的存储的理想选择。

“云计算分布式大数据Hadoop企业级开发动手实战”基于实务经验萃取而成,站在初学者的角度循序渐进的在实验的基础上前进,带你轻松驾驭Hadoop

课程以MapReduce、HBase、Hive为主轴,想理解和使用Hadoop,就必须掌握这三大核心。

二:课程特色

1, 案例驱动教学,全程项目实战训练;

2, 全面掌握Hadoop的架构原理和使用场景,涵盖分布式计算的经典常用算法

3, 规划及部署生产环境的Hadoop集群,掌握Hadoop基本运维思路和方法,对Hadoop集群进行管理和优化。

三:适合对象:

软件工程师;

数据库开发人员;

网络后台开发人员;

运维人员;

四:基础要求

了解Linux系统;

了解网络;

了解Java;

五:讲师简介

王家林老师Android架构师、高级工程师、咨询顾问、培训专家;

通晓Android、HTML5、Hadoop,迷恋英语播音和健美;

致力于Android、HTML5、Hadoop的软、硬、云整合的一站式解决方案;

国内最早(2007年)从事于Android系统移植、软硬整合、框架修改、应用程序软件开发以及Android系统测试和应用软件测试的技术专家和技术创业人员之一。

HTML5技术领域的最早实践者(2009年)之一,成功为多个机构实现多款自定义HTML5浏览器,参与某知名的HTML5浏览器研发;

云计算分布式大数据处理的最早实践者之一,Hadoop的狂热爱好者,不断的在实践中用Hadoop解决不同领域的大数据的高效处理和存储;

超过10本的IT畅销书作者;

Tel:     18610086859

Email: 18610086859@126.com       hiheartfirst@gmail.com

六:培训内容

时间

内容

备注

第一天 

第1个主题Hadoop思考

1、 Hadoop产生背景

2、 Hadoop在大数据、云计算中的位置和关系

3、 国内外Hadoop应用案例介绍

4、 国内Hadoop的就业情况分析

5、 Hadoop生态圈以及各组成部分的简介

6、 Hadoop核心MapReduce例子说明

2个主题: Hadoop安装和配置实战

1. 安装和配置单机版Hadoop实战

2. 安装和配置伪分布式Hadoop实战

3.安装和配置分布式Hadoop集群实战

第3个主题:HDFS

1、 分布式文件系统DFS简介
2、 HDFS的系统组成介绍
3、 HDFS的组成部分详解
4、 副本存放策略及路由规则
5、 命令行接口
6、 Java接口
7、 客户端与HDFS的数据流讲解
8、 HDFS的可用性(HA

4个主题: MapReduce

1、 如何理解mapreduce计算模型
2、 剖析伪分布式下MapReduce作业的执行过程
3、 序列化
4、 MapReduce的类型与格式
5、 MapReduce开发环境搭建
6、 MapReduce应用开发
7、 更多示例讲解,熟悉MapReduce算法原理

时间

内容

备注

第二天

第1个主题高级MapReduce

1、 使用压缩分隔减少输入规模
2、 利用Combiner减少中间数据
3、 编写Partitioner优化负载均衡
4、 MapReduce优化
5、 编程实战

2个主题:Hadoop集群与管理

1、 Hadoop集群的搭建
2、 Hadoop集群的监控
3、 Hadoop集群的管理
4、 集群下运行MapReduce程序

3个主题HBase

1、 HBase定义
2、 HBaseRDBMS的对比
3、 数据模型
4、 系统架构
5、 HBase上的MapReduce
6、 表的设计

时间

内容

备注

第三天

1个主题HBase集群及其管理

1、 集群的搭建过程讲解
2、 集群的监控
3、 集群的管理

2个主题HBase客户端

1、 HBase Shell以及演示
2、 Java客户端以及代码演示

时间

内容

备注

第四天

1个主题Hive

1、 数据仓库基础知识
2、 Hive定义
3、 Hive体系结构简介
4、 Hive集群
5、 客户端简介

2个主题HiveQL

1、 HiveQL定义
2、 HiveQLSQL的比较
3、 数据类型
4、 表与表分区概念
5、 表的操作与CLI客户端演示
6、 数据导入与CLI客户端演示
7、 查询数据与CLI客户端演示
8、 数据的连接与CLI客户端演示
9、 用户自定义函数(UDF)的开发与演示

3个主题Hadoop开发者之路

1. Hadoop技能模型

2. Hadoop开发者最佳学习路线和方式

3.Hadoop开发者最佳成长路线



(转发请注明转自:学PHP)    


  相关推荐




  发表评论
昵称:
(不超过20个字符或10个汉字)
内容: