课程培训
山东航空大数据培训

大数据培训日程

 

课程目标:

 

通过该课程的学习,会对大数据离线计算、实时计算的企业级构架有清晰的理解以及分布式存储系统hdfs、资源管理、分布式离线计算MapReduce、数据仓库工具Hive、分布式列存储数据库HBase、分布式内存计算框架spark有深入的理解。

 

课程大纲:

 

时间

主题

内容

第一天

上午

 

 

 

 

离线计算:

Hadoop大数据生态圈、分布式存储HDFS、资源管理

大数据生态圈介绍

开源相关项目说明以及每个项目的用途

实时计算整体构架详解

离线计算整体构架详解

分布式文件系统HDFS是什么

HDFS的体系结构

HDFS高可用集群原理详解

HDFS使用命令详解

资源管理器介绍以及构架

资源管理器核心组件详解

资源调度器详解

应用程序执行流程

下午

 

 

离线计算:

Hadoop MapReduce&Hive

 

分布式计算MapReduce介绍

MapReduce整体流程

MapReduce代码实例

数据仓库工具Hive介绍

Hive模型介绍:数据库、表、分区、高级函数

Hive元数据介绍

Hive项目实例介绍

第二天

上午

 

 

 

分布式列式数据库HBase

HBase存储数据库体系结构

HBase的高可用

HBase组件详解

HBase数据模型详解

HBase读写流程

过滤器、计数器

项目实例介绍

下午

 

 

 

内存计算框架spark

spark是什么以及体系结构

弹性分布式数据集RDD

行动操作和转化操作

算子详解、宽窄依赖

Jobstagetask详解

spark streaming流式计算体系结构

spark steaming读取kafka

实时计算项目实例

 

 

以上课程可以根据客户实际情况进行灵活调整。

中科信软高级技术培训中心

电话:010-62884854   

网址:www.info-soft.cn   www.zksoft.org; E-mail:




如果您想学习本课程,请预约报名
如果没找到合适的课程或有特殊培训需求,请订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表下载请点击

服务优势:
丰富专家资源,精准匹配相关行业,相关项目技术精英,面向用户实际需求,针对性培训或咨询,互动式交流,案例教学,精品小班,实际工程项目经验分享,快捷高效,节省时间与金钱,少走弯路与错路。

专家力量:
中国科学院相关研究所高级研究人员
西门子,TI,vmware,MSC,Ansys,MDI,Mentor, candence,Altium,Atmel 、Freescale,达索,华为等
大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关学历背景专业,理论素养高
多年实际项目实践,大型复杂项目实战案例分享,热情,乐于技术分享
针对客户实际需要,真实案例演示,互动式沟通,学有所值
报名表下载
联系我们 更多>>

咨询电话010-62883247

                4007991916

咨询邮箱:soft@info-soft.cn  

 

微信号.jpg

  微信咨询

随时听讲课

聚焦技术实践

订制培训 更多>>