【培训对象】
1,系统架构师、系统分析师、高级程序员、资深开发人员。
2,牵涉到数据挖掘和统计分析的数据中心运行、规划、设计负责人。
3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。
4,高校、科研院所牵涉到数据挖掘与统计分析处理的项目负责人。
【培训目标】
1、全面了解大数据前沿技术的相关知识。
2、学习大数据前沿技术平台、方法以及应用特征。
3、学习使用大数据挖掘和分析中的使用。
4、了解Hadoop、Spark等技术的融合使用。
【课程大纲】
第一讲 大数据技术基础
1)大数据应用需求及潜在价值分析
2)大数据与数据库解决方案的对比
3)国内外主流的大数据解决方案
4)开源的大数据生态系统平台剖析
5)大数据下的技术选型与架构设计
第二讲 批处理大数据平台Hadoop
1)Hadoop及其运行架构
2)HDFS分布式文件系统
3)MapReduce计算模型
4)HBase大表管理技术
5)Hadoop平台使用和实操
第三讲 实时大数据平台Spark
1)Spark实时处理技术
2)弹性分布式数据集RDD
3)Spark分布式计算框架
4)Spark的BDAS生态系统
5)Spark平台使用和实操
第四讲 流式大数据平台Storm
1)流式大数据处理架构
2)Storm在企业应用介绍
3)Storm拓扑及流分组
4)Spout和Bolt详解
5)分布式DPRC和Trident
6)Storm平台使用和实操
第五讲 Python网络爬虫
1)网络爬虫基础
2)urllib和urllib2库的用法
3)Python 正则表达式
4)Beautiful Soup使用
5)用Scrapy采集示例实操
第六讲 大数据日志采集工具Flume
1)日志采集及Scribe介绍
2)Flume-NG数据流模型
3)Flume平台架构
4)Flume集群部署配置
5)Flume应用案例实操
第七讲 分布式消息订阅工具Kafka
1)Kafka应用介绍
2)Kafka平台架构
3)Kafka集群部署与配置
4)Kafka应用案例实操
第八讲 NoSQL云数据处理工具
1)NoSQL技术及云数据库介绍
2)HBase列数据存储及处理机制
3)HBase高并发读/写实现及案例
4)MongoDB文档数据存储及处理
5)MongoDB操作实现及案例
第九讲 大数据中的SQL工具
1)大数据中的类SQL工具
2) Hive设计目标和数据模型
3) Hive关键性技术和案例
4) SparkSQL设计目标和数据模型
5) SparkSQL关键性技术和案例
第十讲 大数据分析挖掘工具
1)大数据挖掘及知识模型的发现
2)大数据挖掘工具Mahout和MLlib
3)推荐方法及MLlib电影推荐案例
4)分类方法及Mahout新闻分类案例
5)聚类方法及K-Means聚类案例
第十一讲 资源虚拟化工具Docker
1)虚拟化和容器技术
2)LXC和Docker的发展
3)Docker架构及特性
4)镜像、容器和仓库
5)Docker的执行及其案例实操
第十二讲 大数据技术展望
1)大数据分析技术展望
2)大数据平台的发展展望
3)大数据挖掘的应用展望
如果您想学习本课程,请
预约报名
如果没找到合适的课程或有特殊培训需求,请
订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表下载请点击
服务优势:
丰富专家资源,精准匹配相关行业,相关项目技术精英,面向用户实际需求,针对性培训或咨询,互动式交流,案例教学,精品小班,实际工程项目经验分享,快捷高效,节省时间与金钱,少走弯路与错路。
专家力量:
中国科学院相关研究所高级研究人员
西门子,TI,vmware,MSC,Ansys,MDI,Mentor, candence,Altium,Atmel 、Freescale,达索,华为等
大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关学历背景专业,理论素养高
多年实际项目实践,大型复杂项目实战案例分享,热情,乐于技术分享
针对客户实际需要,真实案例演示,互动式沟通,学有所值