课程培训
云计算与大规模数据处理培训课程

云计算与大规模数据处理培训课程

课程介绍:

通过本课程的学习,学员将深入了解到通过大规模集群的模式处理海量数据的方式与编程方法。通过实践相关的课程内容,使用开源的Apache Lucene Hadoop工具,学员将亲身实践Google文件系统以及Google所使用的分布式编程方式MapReduce。学员还需要完成特定的分布式应用程序设计来巩固所学的编程知识,用于处理实际的海量数据问题。

适合对象:

· 对云计算或大规模数据处理感兴趣的开发人员

·  架构师、项目经理等

课程目标:

·     熟悉和掌握云计算的架构与原理

·     了解大规模数据处理的核心技术

·     熟悉并理解企业大规模数据处理应用的注意事项

·     对开源系统的应用

预备知识:

·     Lucene(开源的索引和检索系统)和  Hadoop有所理解

·     掌握基本的Java语法

·     对数据结构、编译原理、概率论有基本的了解

第一章

主题

分布式系统概述

大纲

· 分布式系统基本概念

· 分布式系统设计遇到的问题

· 分布式系统的可靠性问题

· 分布式系统的可扩展性问题

实验:

· 实验环境的介绍:实验环境中所涉及到的软件,实验中所需要的硬件配置,编程所需要的必要的Java知识等。

· 介绍如何在集群环境下进行Hadoop系统的安装以及配置,使得每个参加的学员都能够安装完成Hadoop,并进行正确配置与运行。

第二章

主题

分布式文件系统

大纲

· 传统的分布式文件系统,例如NFSAFS等,

· 新的分布式文件系统的介绍,如Ceph等。

· 介绍分布式文件系统GFS,以及相应的在Hadoop中的模块HDFS

实验:

· 学员实验所必须的相关的背景知识,例如多线程程序的编写,程序的同步问题,网络编程所需要的必要知识(实际是不用的,但是为了理解分布式程序的运行,必须要了解)。

· 熟悉使用Hadoop进行编程的基础知识:Hadoop的构成,Hadoop中相关类库的介绍,在Hadoop环境下,使用Java操作接口,对文件系统进行读写操作。

第三章

主题

MapReduce编程技术

大纲

· GoogleMapReduce编程介绍

· 开源软件Nutch的体系结构与构成

· Hadoop的体系结构,构成以及MapReduce设计的编程要素

实验:

· HadoopMapReduce编程环境

    使用Hadoop进行MapReduce编程,并进行第一个实验,即做一次倒排表的实验。

第四章

主题

MapReduce算法

大纲

· 使用MapReduce进行图算法PageRank

· 使用MapReduce进行聚类算法Canopy Clustering

实验:

· 图算法PageRank的实现

第五章

主题

云计算技术分析

大纲

· Amazon的云计算系统的介绍Elastic Computing Cloud

· 微软所使用的大规模数据处理技术Dryad

· Google云计算平台App Engine深入剖析

§ App Engine概述及其典型应用分析

§ App Engine架构和实现解析

§ App Engine应用开发接口和编程实践

§ App Engine与其他云计算平台的横向比较及展望

实验:

· 聚类算法Canopy Clustering的实现

第六章

主题

Google中所使用的其它技术

大纲

· Google的集群的构建

· Google的数据库系统BigTable

· Google的分布式锁技术Chubby

实验:

· 对实验进行收尾工作




如果您想学习本课程,请预约报名
如果没找到合适的课程或有特殊培训需求,请订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表下载请点击

服务优势:
丰富专家资源,精准匹配相关行业,相关项目技术精英,面向用户实际需求,针对性培训或咨询,互动式交流,案例教学,精品小班,实际工程项目经验分享,快捷高效,节省时间与金钱,少走弯路与错路。

专家力量:
中国科学院相关研究所高级研究人员
西门子,TI,vmware,MSC,Ansys,MDI,Mentor, candence,Altium,Atmel 、Freescale,达索,华为等
大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关学历背景专业,理论素养高
多年实际项目实践,大型复杂项目实战案例分享,热情,乐于技术分享
针对客户实际需要,真实案例演示,互动式沟通,学有所值
报名表下载
联系我们 更多>>

咨询电话010-62883247

                4007991916

咨询邮箱:soft@info-soft.cn  

 

微信号.jpg

  微信咨询

随时听讲课

聚焦技术实践

订制培训 更多>>