一、 大数据处理平台架构基础 |
1. 大数据的产生背景、发展历程
2. 大数据和云计算的关系
3. 大数据应用需求以及潜在价值分析
4. 业界最新的大数据技术发展态势与应用趋势
5. 大数据项目的技术选型与大数据处理系统架构设计
6. “互联网+”时代下的电子商务、制造业、零售批发业、电信运营商、互联网金融业、网上银行、电子政务、移动互联网、教育信息化等行业应用实践与应用案例剖析 |
二、 业界主流的大数据技术产品与项目解决方案 |
7. 国内外主流的大数据解决方案介绍
8. 当前大数据解决方案与传统数据库方案的剖析比较
9. Apache大数据平台方案剖析
10. CDH大数据平台方案剖析
11. HDP大数据平台方案剖析
12. 开源的大数据生态系统平台剖析 |
三、 Hadoop大数据平台核心技术剖析 |
13. Hadoop的发展历程以及产业界的实际应用介绍
14. Hadoop大数据平台架构
15. 基于Hadoop平台的PB级大数据存储管理与分析处理的工作原理与机制
16. Hadoop的核心组件剖析 |
四、 大数据分布式存储系统原理及其应用实践 |
17. 分布式文件系统HDFS的简介
18. HDFS系统的主从式平台架构和工作原理
19. HDFS核心组件技术讲解
20. 基于HDFS的大型存储系统应用开发实战
21. HDFS集群的安装、部署、配置与性能优化实践
22. HDFS与Linux NFS3交互技术以及本地化挂载部署应用实践
23. 分布式键值存储系统的平台架构、核心技术以及应用开发
24. PB及大数据存储系统的项目案例分析 |
五、 大数据并行处理框架MapReduce与Yarn技术实践 |
25. MapReduce并行计算模型
26. MapReduce作业执行与调度技术
27. 第二代大数据处理框架Yarn的工作原理及DAG并行执行机制
28. MapReduce应用开发环境的部署,以及大数据并行处理应用程序开发
29. MapReduce高级编程技巧与性能优化实践
30. MapReduce与Yarn大数据分析处理案例分析 |
六、 Hadoop大数据处理高性能应用开发实践操作训练 |
31. 部署与配置HDFS,熟练操作HDFS SHELL,HDFS与NFS操作,以及HDFS API开发实践
32. 部署与配置MapReduce与Yarn及其开发实践
33. Hadoop的Linux二次开发环境部署与配置 |
七、 HBase分布式数据库管理系统 |
34. NoSQL数据库与NewSQL数据库技术介绍,及其在半结构化和非结构化大数据方面的应用实践
35. HBase分布式数据库简介、数据模型以及工作原理
36. HBase分布式数据库集群的平台架构和关键技术剖析
37. HBase应用项目开发技巧,以及客户端开发实战
38. HBase表设计与数据操作以及数据库管理API调用
39. HBase集群的安装部署与配置优化
40. ZooKeeper分布式协调服务系统的工作原理、平台架构、集群部署与配置应用实战
41. HBase集群的运维与监控管理
|
八、 HBase应用实践操作训练 |
42. 部署与配置HBase集群以及HBase的性能优化
43. 部署与配置ZooKeeper分布式集群
44. 构建HBase开发环境
45. HBase数据库二次开发项目实践 |
九、 大型数据仓库Hive集群平台 |
46. 基于Hadoop的大型分布式数据仓库基础知识,HIVE在行业中的数据仓库应用案例
47. Hive大数据仓库简介以及应用介绍
48. Hive数据仓库集群的平台体系结构、核心技术剖析
49. Hive Server的工作原理、机制与应用
50. Hive数据仓库集群的安装部署与配置优化
51. Hive应用开发技巧
52. Hive SQL剖析与应用实践
53. Hive数据仓库表与表分区、表操作、数据导入导出、客户端操作技巧
54. Hive数据仓库报表设计
55. Hive JDBC与ODBC的工作原理与实现机制
56. Hive HWI、CLI客户端操作以及UDF应用实践
|
十、 Hive应用实践操作训练 |
57. 部署与配置HIVE集群,以及HIVE性能调优
58. 构建HIVE开发环境
59. HIVE数据仓库操作项目实践 |
十一、 Spark大数据实时处理平台剖析 |
60. Spark的发展历程以及业界的实际应用介绍
61. Spark实时大数据处理平台架构
62. Spark RDD内存弹性分布式数据集的工作原理与机制
63. Spark的核心组件剖析
64. 基于Spark的实时数据仓库与实时分析挖掘处理在行业中的应用实践案例 |
十二、 Spark应用实践操作训练 |
65. 部署与配置Spark集群,以及Spark性能调优
66. 构建Spark开发环境
67. Spark程序运行以及操作 |
十三、 基于Spark的实时数据仓库和实时数据分析挖掘处理平台的实现机制, Spark SQL,Spark Streaming,MLib,GraphX,SparkR的应用实践 |
68. 内存计算模型和实时处理技术介绍
69. Spark中各个分布式组件的处理框架及工作原理
70. Spark SQL实时数据仓库的实现原理机制及应用实践
71. Spark Streaming流式数据实时处理机制及应用实践
72. Spark MLib实时机器学习算法应用实践与案例应用
73. Spark GraphX实时图数据处理应用实践与社交网络分析应用案例
74. SparkR的实现原理与应用实践
75. Spark组件的应用编程开发实战
76. Spark与Hadoop的集成解决方案实践 |
十四、 Spark核心组件功能运用的实践操作训练 |
77. Spark SQL应用操作实训
78. Spark Streaming应用操作实训
79. Spark MLib应用操作实训
80. Spark GraphX应用操作实训
81. SparkR应用操作实训
82. Spark与HBase集成数据分析实验实训 |
十五、 Mahout大数据分析挖掘平台 |
83. 大数据分析挖掘技术介绍,以及行业大数据挖掘应用案例
84 . Mahout大数据挖掘平台的体系架构和核心技术
85 . 基于Mahout的数据分析挖掘算法应用,包括分类算法、聚类算法、关联规则挖掘算法、推荐与协同过滤分析算法、预测分析等算法的应用及其案例剖析
86 . 基于Mahout的数据分析挖掘应用程序开发实战
87 . 利用Mahout与Hadoop集成大数据挖掘平台应用实战 |
十六、 Mahout大数据分析挖掘项目的实践操作训练 |
88. Mahout集群的安装部署与配置优化
89. Mahout实现客户分析,广告分析,日志分析,规律预测,关联分析,定向推荐等应用程序的开发与应用实战
90. Mahout性能优化与分析挖掘算法参数的优化,并结合Mahout实现交互式数据查询与分析挖掘的项目实践 |
十七、 Flink分布式数据流处理与计算 |
91.大数据处理引擎Flink基础概念
92.Flink体系架构
93.Flink的部署和HA的实现。
94.如何在Flink中实现流式处理和批处理的Demo。 |
十八、 Storm流式数据处理平台架构及其应用实践 |
95. Storm流式处理系统的平台架构和工作原理
96. Storm关键技术剖析
97. Storm集群安装部署与配置优化
98. Storm日志流数据分析项目应用实战
99. Storm和Hadoop,Spark的应用集成项目实践 |
十九、 大数据智能化ETL操作工具以及Hadoop集群运维监控工具平台应用 |
100. Hadoop与DBMS之间数据交互工具Sqoop导入导出数据的工作原理,以及Sqoop集群安装部署与配置
101. Kettle集群的平台架构、核心技术工作原理以及应用案例
102. Kettle大数据ETL工具的部署与配置,以及应用实战
103. 利用Sqoop实现MySQL与Hadoop集群之间的数据导入导出交互程序
104. Hadoop大数据运维监控管理系统HUE平台的安装部署与应用配置
105. Hadoop运维管理监控系统Ambari平台的安装部署与应用配置
106. Hadoop集群运维系统Ganglia, Nagios的安装部署与应用配置 |
二十、 大数据的信息安全技术及其应用 |
107. “互联网+APP”背景下的信息安全遇到的挑战,以及可行的信息安全策略和案例分析
108. 大数据隐私保护技术及其应用
109. 大数据加密技术及其应用
110. 大数据平台的安全认证技术及其应用
111. 大数据平台的实时保护和监控、细粒度的数据访问审计、自动化的告警、数据级别的访问控制、数据漏洞管理,以及敏感数据的自动发现
|
二十一、 大数据平台项目应用完整实践与咨询讨论 |
112. 根据讲师布置的实际应用案例,开展大数据完整项目部署设计和应用开发实践、大数据项目的需求分析、应用实施以及解决方案分享咨询与交流讨论 |