设为首页 加入收藏夹 最新课程 搜索排行 免费注册 ·我要参加培训 ·培训机构注册推广 ·我是培训讲师

网站首页 公开课程 企业内训 培训专题 培训讲师 培训机构 管理资讯 资料下载 培训商城 全国培训
北京培训 上海培训 深圳培训 广州培训 综合管理 绩效培训 生产计划 采购培训 销售团队 商务礼仪
战略管理 市场营销 人力资源 劳动法规 财务管理 生产管理 研发项目 行政工作 销售技能 中层干部
搜索课程:   
课程编号:  
 
中培热线 >> 公开课程 >> 综合管理 >> 关于举办大数据平台搭建与高性能计算最佳实战培训班的通知
关于举办大数据平台搭建与高性能计算最佳实战培训班的通知
培训时间:2019年07月23日2019年07月26日 该课程的其它培训场次:
2019-07-23至2019-07-26【烟台】   2019-09-17至2019-09-20【郑州】  
2019-10-21至2019-10-24【北京】   2019-11-15至2019-11-18【贵阳】  
培训地点:烟台
培训讲师:专家团
培训价格:5800 元/位
参会学员:对此课程感兴趣的学员

的平台架构与核心技术剖析 3. Hive metastore的工作机制与应用 4. Hive 分区、分桶机制,Hive行、列存储格式 5. 基于Spark的大型分布式数据仓库SparkSQL基础知识与应用场景 6. Spark SQL实时数据仓库的实现原理与工作机制 7. SparkSQL程序开发与DataFrame机制介绍 8. 基于MPP的大型分布式数据仓库Impala基础知识与应用场景 9. Impala实时查询系统平台架构、关键技术介绍,以及与Hive,SparkSQL的对比 Hadoop集群运维监控工具 1. Hadoop运维管理监控系统Ambari工具介绍 2. 第三方运维系统与工具Ganglia, Nagios 大数据实战练习二 1.基于 Hadoop平台搭建、部署与配置Spark集群,Spark shell环境实践,Spark案例程序分析,Spark程序开发与运行 2. 基于MapReduce的Hive数据仓库实践,Hive集群安装部署,基于文件的Hive数据仓库表导入导出与分区操作,Hive SQL操作,Hive客户端操作 3. 基于Hive的SparkSQL shell实践操作 第三天 上午 大数据计算模型(三)——流处理Storm, SparkStreaming 1. 流数据处理应用场景与流数据处理的特点 2. 流数据处理工具Storm的平台架构与集群工作原理 3. Storm关键技术与并发机制 4. Storm编程模型与基本开发模式 5. Storm数据流分组 6. Storm可靠性保证与Acker机制 7. Storm应用案例分析 8. 流数据处理工具Spark Streaming基本概念与数据模型 9. SparkStreaming工作机制 10. SparkStreaming程序开发介绍 11. Storm与SparkStreaming的对比 第三天 下午 大数据ETL操作工具,与大数据分布式采集系统 1. Hadoop与DBMS之间数据交互工具的应用 2. Sqoop导入导出数据的工作原理 3. Flume-NG数据采集系统的数据流模型与系统架构 4. Kafka分布式消息订阅系统的应用介绍与平台架构,及其使用模式 面向OLTP型应用的NoSQL数据库及应用实践 1. 关系型数据库瓶颈,以及NoSQL数据库的发展,概念,分类,及其在半结构化和非结构化数据场景下的适用范围 2. 列存储NoSQL数据库HBase简介与数据模型剖析 3. HBase分布式集群系统架构与读写机制,ZooKeeper分布式协调服务系统的工作原理与应用 4. HBase表设计模式与primary key设计规范 5. 文档NoSQL数据库MongoDB简介与数据模型剖析 6. MongoDB集群模式、读写机制与常用API操作 8.键值型NoSQL数据库Redis简介与数据模型剖析 9.Redis多实例集群架构与关键技术 10.NewSQL数据库技术简介及其适用场景 大数据实战练习三 1.Sqoop安装、部署与配置,基于Sqoop、MySQL与Hive操作MySQL数据库与Hive数据仓库数据导入导出 2.Kafka安装、部署与配置,基于Kafka创建和消费topic实践操作 3.Flume+HDFS+MapReduce/Spark大数据采集、存储与分析实践操作 大数据项目选型、实施、优化等问题交流讨论 大数据项目的需求分析、应用实施、系统优化,以及解决方案等咨询与交流讨论 第四天 学习考核与业内经验交流

培训内容

培训费用
培训费5800元/人(含培训费、场地费、资料费、学习期间午餐),食宿可统一安排,费用自理。请学员带身份证复印件一张。
本课程颁发《大数据平台搭建与高性能计算高级工程师》证书; 证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。

授课专家
蒋老师 清华大学博士,云计算专家 熟悉主流的云计算平台,并有商业与开源云计算平台的实践经验,对云计算关键技术有深刻了解和实践经验,如分布式系统、虚拟化、分布式文件系统、云存储等,参与并领导多个大型云计算项目。对大数据关键技术有深刻了解和实践经验,如NoSQL数据库、大数据处理、Hadoop、Hive、HBase、Spark等。
赵老师 清华大学计算机双学士,甲骨文(中国)软件系统有限公司高级技术顾问,大数据、数据库、中间件技术和Java专家。15年IT行业从业经历,10年培训授课经验。具有丰富的大数据方法论、数据科学、大数据生态圈技术知识和大数据规划建设、应用实施和客户培训经验。


一、培训收益
通过此次课程培训,可使学习者获得如下收益:
1.深刻理解在“互联网+”时代下大数据的产生背景、发展历程和演化趋势;
2.了解业界市场需求和国内外最新的大数据技术潮流,洞察大数据的潜在价值;
3.理解大数据项目解决方案及业界大数据应用案例,从而为企业在大数据项目中的技术选型及技术架构设计提供决策参考;
4.掌握业界最流行的Hadoop与Spark大数据技术体系;
5.掌握大数据采集技术;
6.掌握大数据分布式存储技术;
7.掌握NoSQL与NewSQL分布式数据库技术;
8.掌握大数据仓库与统计机器学习技术;
9.掌握大数据分析挖掘与商业智能(BI)技术;
10.掌握大数据离线处理技术;
11.掌握Storm流式大数据处理技术;
12.掌握基于内存计算的大数据实时处理技术;
13.掌握大数据管理技术的原理知识和应用实战;
14.深入理解大数据平台技术架构和使用场景;
15.娴熟运用Hadoop与Spark大数据技术体系规划解决方案满足实际项目需求;
16.熟练地掌握基于Hadoop与Spark大数据平台进行应用程序开发、集群运维管理和性能调优技巧。

二、培训特色
1.课程培训业界最流行、应用最广泛的Hadoop与Spark大数据技术体系。强化大数据平台的分布式集群架构和核心关键技术实现、大数据应用项目开发和大数据集群运维实践、以及Hadoop与Spark大数据项目应用开发与调优的全过程沙盘模拟实战。
2.通过一个完整的大数据开发项目及一组实际项目训练案例,完全覆盖Hadoop与Spark生态系统平台的应用开发与运维实践。课堂实践项目以项目小组的形式进行沙盘实操练习,重点强化理解Hadoop与Spark大数据项目各个阶段的工作重点,同时掌握作为大数据项目管理者的基本技术与业务素养。
3.本课程的授课师资都是有着多年在一线从事Hadoop与Spark大数据项目的资深讲师,采用原理技术剖析和实战案例相结合的方式开展互动教学、强化以建立大数据项目解决方案为主体的应用开发、技术讨论与交流咨询,在学习的同时促进讲师学员之间的交流,让每个学员都能在课程培训过程中学到实实在在的大数据技术知识体系,以及大数据技术应用实战技能,具备实际大数据应用项目的动手开发实践与运维管理部署能力。授课过程中,根据学员需求,增设交流环节,可将具体工作中遇到的实际问题展开讨论,讲师会根据学员的实际情况微调授课内容,由讲师带着全部学员积极讨论,并给出一定的时间让学员上台发言,现场剖析问题的症结,规划出可行的解决方案。

三、日程安排
第一天
上午大数据技术基础
1.大数据的产生背景与发展历程
2.大数据的4V特征,以及与云计算的关系
3.大数据应用需求以及潜在价值分析
4.业界最新的大数据技术发展态势与应用趋势
5.大数据思维的转变
6.大数据项目的系统与技术选型,及落地实施的挑战
7.“互联网+”时代下的电子商务、制造业、交通行业、电信运营商、银行金融业、电子政务、移动互联网、教育信息化等行业应用实践与应用案例介绍
业界主流的大数据技术方案
1.大数据软硬件系统全栈与关键技术介绍
2.大数据生态系统全景图
3.主流的大数据解决方案介绍
4.Apache大数据平台方案剖析
5.CDH大数据平台方案剖析
6.HDP大数据平台方案剖析
7.基于云的大数据平台方案剖析
8.大数据解决方案与传统数据库方案比较
9.国内外大数据平台方案与厂商对比
大数据计算模型(一)——批处理MapReduce
1.MapReduce产生背景与适用场景
2.MapReduce计算模型的基本原理
3.MapReduce作业执行流程
4.MapReduce基本组件,JobTracker和TaskTracker
5.MapReduce高级编程应用,Combiner和Partitioner
6.MapReduce性能优化技巧
7.MapReduce案例分析与开发实践操作
第一天
下午大数据存储系统与应用实践
1.分布式文件系统HDFS产生背景与适用场景
2.HDFS master-slave系统架构与读写工作原理
3.HDFS核心组件技术讲解,NameNode与fsimage、editslog,DataNode与数据块
4.HDFS Federation机制,viewfs机制,使用场景讲解
5.HDFS高可用保证机制,SecondaryNameNode,NFS冷备份,基于zookeeper的HA方案
大数据实战练习一
1. Hadoop平台搭建、部署与应用实践,包含HDFS分布式文件系统,YARN资源管理软件,MapReduce计算框架软件
2. HDFS shell命令操作
3. MapReduce程序在YARN上运行
第二天
上午Hadoop框架与生态发展,以及应用实践操作
1.Hadoop的发展历程
2.Hadoop 1.0的核心组件JobTracker,TaskTracker,以及适用范围
3.Hadoop 2.0的核心组件YARN工作原理,以及与Hadoop 1.0的联系与区别
4.Hadoop YARN的资源管理与作业调度机制
5.Hadoop 常用性能优化技术
大数据计算模型(二)——实时处理/内存计算 Spark
1.MapReduce计算模型的瓶颈
2.Spark产生动机、基本概念与适用场景
3.Spark编程模型与RDD弹性分布式数据集的工作原理与机制
4.Spark实时处理平台运行架构与核心组件
5.Spark宽、窄依赖关系与DAG图分析
6.Spark容错机制
7.Spark作业调度机制
8.Spark standardalone,Spark on YARN运行模式
9.Scala开发介绍与Spark常用Transformation函数介绍
第二天
下午大数据仓库查询技术Hive、SparkSQL、Impala,以及应用实践
1.基于MapReduce的大型分布式数据仓库Hive基础知识与应用场景
2.Hive数据仓库的平台架构与核心技术剖析
3.Hive metastore的工作机制与应用
4.Hive 分区、分桶机制,Hive行、列存储格式
5.基于Spark的大型分布式数据仓库SparkSQL基础知识与应用场景
6.Spark SQL实时数据仓库的实现原理与工作机制
7.SparkSQL程序开发与DataFrame机制介绍
8.基于MPP的大型分布式数据仓库Impala基础知识与应用场景
9.Impala实时查询系统平台架构、关键技术介绍,以及与Hive,SparkSQL的对比
Hadoop集群运维监控工具
1.Hadoop运维管理监控系统Ambari工具介绍
2. 第三方运维系统与工具Ganglia, Nagios
大数据实战练习二
1.基于 Hadoop平台搭建、部署与配置Spark集群,Spark shell环境实践,Spark案例程序分析,Spark程序开发与运行
2. 基于MapReduce的Hive数据仓库实践,Hive集群安装部署,基于文件的Hive数据仓库表导入导出与分区操作,Hive SQL操作,Hive客户端操作
3. 基于Hive的SparkSQL shell实践操作
第三天
上午大数据计算模型(三)——流处理Storm, SparkStreaming
1.流数据处理应用场景与流数据处理的特点
2.流数据处理工具Storm的平台架构与集群工作原理
3.Storm关键技术与并发机制
4.Storm编程模型与基本开发模式
5.Storm数据流分组
6.Storm可靠性保证与Acker机制
7.Storm应用案例分析
8.流数据处理工具Spark Streaming基本概念与数据模型
9.SparkStreaming工作机制
10.SparkStreaming程序开发介绍
11.Storm与SparkStreaming的对比
第三天
下午大数据ETL操作工具,与大数据分布式采集系统
1.Hadoop与DBMS之间数据交互工具的应用
2.Sqoop导入导出数据的工作原理
3.Flume-NG数据采集系统的数据流模型与系统架构
4.Kafka分布式消息订阅系统的应用介绍与平台架构,及其使用模式
面向OLTP型应用的NoSQL数据库及应用实践
1.关系型数据库瓶颈,以及NoSQL数据库的发展,概念,分类,及其在半结构化和非结构化数据场景下的适用范围
2.列存储NoSQL数据库HBase简介与数据模型剖析
3.HBase分布式集群系统架构与读写机制,ZooKeeper分布式协调服务系统的工作原理与应用
4.HBase表设计模式与primary key设计规范
5.文档NoSQL数据库MongoDB简介与数据模型剖析
6.MongoDB集群模式、读写机制与常用API操作
8.键值型NoSQL数据库Redis简介与数据模型剖析
9.Redis多实例集群架构与关键技术
10.NewSQL数据库技术简介及其适用场景
大数据实战练习三
1.Sqoop安装、部署与配置,基于Sqoop、MySQL与Hive操作MySQL数据库与Hive数据仓库数据导入导出
2.Kafka安装、部署与配置,基于Kafka创建和消费topic实践操作
3.Flume+HDFS+MapReduce/Spark大数据采集、存储与分析实践操作
大数据项目选型、实施、优化等问题交流讨论
大数据项目的需求分析、应用实施、系统优化,以及解决方案等咨询与交流讨论
第四天学习考核与业内经验交流

培训费用 培训费5800元/人(含培训费、场地费、资料费、学习期间午餐),食宿可统一安排,费用自理。请学员带身份证复印件一张。 本课程颁发《大数据平台搭建与高性能计算高级工程师》证书; 证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。 授课专家 蒋老师 清华大学博士,云计算专家 熟悉主流的云计算平台,并有商业与开源云计算平台的实践经验,对云计算关键技术有深刻了解和实践经验,如分布式系统、虚拟化、分布式文件系统、云存储等,参与并领导多个大型云计算项目。对大数据关键技术有深刻了解和实践经验,如NoSQL数据库、大数据处理、Hadoop、Hive、HBase、Spark等。 赵老师 清华大学计算机双学士,甲骨文(中国)软件系统有限公司高级技术顾问,大数据、数据库、中间件技术和Java专家。15年IT行业从业经历,10年培训授课经验。具有丰富的大数据方法论、数据科学、大数据生态圈技术知识和大数据规划建设、应用实施和客户培训经验。 一、 培训收益 通过此次课程培训,可使学习者获得如下收益: 1.深刻理解在“互联网+”时代下大数据的产生背景、发展历程和演化趋势; 2.了解业界市场需求和国内外最新的大数据技术潮流,洞察大数据的潜在价值; 3.理解大数据项目解决方案及业界大数据应用案例,从而为企业在大数据项目中的技术选型及技术架构设计提供决策参考; 4.掌握业界最流行的Hadoop与Spark大数据技术体系; 5.掌握大数据采集技术; 6.掌握大数据分布式存储技术; 7.掌握NoSQL与NewSQL分布式数据库技术; 8.掌握大数据仓库与统计机器学习技术; 9.掌握大数据分析挖掘与商业智能(BI)技术; 10.掌握大数据离线处理技术; 11.掌握Storm流式大数据处理技术; 12.掌握基于内存计算的大数据实时处理技术; 13.掌握大数据管理技术的原理知识和应用实战; 14.深入理解大数据平台技术架构和使用场景; 15.娴熟运用Hadoop与Spark大数据技术体系规划解决方案满足实际项目需求; 16.熟练地掌握基于Hadoop与Spark大数据平台进行应用程序开发、集群运维管理和性能调优技巧。 二、 培训特色 1.课程培训业界最流行、应用最广泛的Hadoop与Spark大数据技术体系。强化大数据平台的分布式集群架构和核心关键技术实现、大数据应用项目开发和大数据集群运维实践、以及Hadoop与Spark大数据项目应用开发与调优的全过程沙盘模拟实战。 2.通过一个完整的大数据开发项目及一组实际项目训练案例,完全覆盖Hadoop与Spark生态系统平台的应用开发与运维实践。课堂实践项目以项目小组的形式进行沙盘实操练习,重点强化理解Hadoop与Spark大数据项目各个阶段的工作重点,同时掌握作为大数据项目管理者的基本技术与业务素养。 3.本课程的授课师资都是有着多年在一线从事Hadoop与Spark大数据项目的资深讲师,采用原理技术剖析和实战案例相结合的方式开展互动教学、强化以建立大数据项目解决方案为主体的应用开发、技术讨论与交流咨询,在学习的同时促进讲师学员之间的交流,让每个学员都能在课程培训过程中学到实实在在的大数据技术知识体系,以及大数据技术应用实战技能,具备实际大数据应用项目的动手开发实践与运维管理部署能力。授课过程中,根据学员需求,增设交流环节,可将具体工作中遇到的实际问题展开讨论,讲师会根据学员的实际情况微调授课内容,由讲师带着全部学员积极讨论,并给出一定的时间让学员上台发言,现场剖析问题的症结,规划出可行的解决方案
案。 三、 日程安排 第一天 上午 大数据技术基础 1. 大数据的产生背景与发展历程 2. 大数据的4V特征,以及与云计算的关系 3. 大数据应用需求以及潜在价值分析 4. 业界最新的大数据技术发展态势与应用趋势 5. 大数据思维的转变 6. 大数据项目的系统与技术选型,及落地实施的挑战 7. “互联网+”时代下的电子商务、制造业、交通行业、电信运营商、银行金融业、电子政务、移动互联网、教育信息化等行业应用实践与应用案例介绍 业界主流的大数据技术方案 1. 大数据软硬件系统全栈与关键技术介绍 2. 大数据生态系统全景图 3. 主流的大数据解决方案介绍 4. Apache大数据平台方案剖析 5. CDH大数据平台方案剖析 6. HDP大数据平台方案剖析 7. 基于云的大数据平台方案剖析 8. 大数据解决方案与传统数据库方案比较 9. 国内外大数据平台方案与厂商对比 大数据计算模型(一)——批处理MapReduce 1. MapReduce产生背景与适用场景 2. MapReduce计算模型的基本原理 3. MapReduce作业执行流程 4. MapReduce基本组件,JobTracker和TaskTracker 5. MapReduce高级编程应用,Combiner和Partitioner 6. MapReduce性能优化技巧 7. MapReduce案例分析与开发实践操作 第一天 下午 大数据存储系统与应用实践 1. 分布式文件系统HDFS产生背景与适用场景 2. HDFS master-slave系统架构与读写工作原理 3. HDFS核心组件技术讲解,NameNode与fsimage、editslog,DataNode与数据块 4. HDFS Federation机制,viewfs机制,使用场景讲解 5. HDFS高可用保证机制,SecondaryNameNode,NFS冷备份,基于zookeeper的HA方案 大数据实战练习一 1. Hadoop平台搭建、部署与应用实践,包含HDFS分布式文件系统,YARN资源管理软件,MapReduce计算框架软件 2. HDFS shell命令操作 3. MapReduce程序在YARN上运行 第二天 上午 Hadoop框架与生态发展,以及应用实践操作 1. Hadoop的发展历程 2. Hadoop 1.0的核心组件JobTracker,TaskTracker,以及适用范围 3. Hadoop 2.0的核心组件YARN工作原理,以及与Hadoop 1.0的联系与区别 4. Hadoop YARN的资源管理与作业调度机制 5. Hadoop 常用性能优化技术 大数据计算模型(二)——实时处理/内存计算 Spark 1. MapReduce计算模型的瓶颈 2. Spark产生动机、基本概念与适用场景 3. Spark编程模型与RDD弹性分布式数据集的工作原理与机制 4. Spark实时处理平台运行架构与核心组件 5. Spark宽、窄依赖关系与DAG图分析 6. Spark容错机制 7. Spark作业调度机制 8. Spark standardalone,Spark on YARN运行模式 9. Scala开发介绍与Spark常用Transformation函数介绍 第二天 下午 大数据仓库查询技术Hive、SparkSQL、Impala,以及应用实践 1. 基于MapReduce的大型分布式数据仓库Hive基础知识与应用场景 2. Hive数据仓

 >> 课程类别
战略管理 市场营销
人力资源 劳动法规
综合管理 财务管理
生产管理 研发项目
采购供应 行政工作
销售技能 精益生产
项目管理 中层干部
商务礼仪 库存控制
 >> 培训月历
  2019年培训课程:
01月 | 02月 | 03月 | 04月
05月 | 06月 | 07月 | 08月
09月 | 10月 | 11月 | 12月
  2020年培训课程:
01月 | 02月 | 03月 | 04月
05月 | 06月 | 07月 | 08月
09月 | 10月 | 11月 | 12月
 >> 热门培训词
人力资源规划 员工招聘 面试技巧 绩效管理 薪酬设计 员工福利 劳动关系 劳动法 员工关系 人力资源管理师 3E薪资设计 KPI绩效考核 BSC平衡计分卡 人力资源管理制度 非人力资源经理的人力资源管理 人力资源开发 HR系列 生产计划 物料控制 采购 供应商 供应链 生产安全 精益生产 创新 品质管理 生产效率 设备管理 库存控制 班组长 工厂成本 研发 车间管理 IE工业工程 5S(6S) 生产维护 仓储 注塑 EHS TPM 销售技能 营销策略 电话销售 顾问式销售 销售团队 经销商管理 市场策划 大客户营销 外贸操作 商务谈判 非财务人员的财务管理 企业所得税法 全面预算管理 应收账款 内部控制 新会计准则 财务报表 纳税筹划 成本管理 信用管理 企业融资

报名流程
  温馨提示:请完整填写电子邮件地址,以便会后收取资料。
网上咨询/报名表
  请 选 择: 确认报名  我先咨询  过期课程咨询   *
  op、Hive、HBase、Spark等。 赵老师 清华大学计算机双学士,甲骨文(中国)软件系统有限公司高级技术顾问,大数据、数据库、中间件技术和Java专家。15年IT行业从业经历,10年培训授课经验。具有丰富的大数据方法论、数据科学、大数据生态圈技术知识和大数据规划建设、应用实施和客户培训经验。 一、 培训收益 通过此次课程培训,可使学习者获得如下收益: 1.深刻理解在“互联网+”时代下大数据的产生背景、发展历程和演化趋势; 2.了解业界市场需求和国内外最新的大数据技术潮流,洞察大数据的潜在价值; 3.理解大数据项目解决方案及业界大数据应用案例,从而为企业在大数据我单位共计 * 人,报名参加2019-7-23开始,在烟台举办的关于举办大数据平台搭建与高性能计算最佳实战培训班的通知(课程编号:177032)。
  单位名称: *  联 系 人: *
  联系电话: -  *  电子邮件: *
  移动电话:    联系传真: - *
  请问是否需要预订酒店(费用自理): 不需要 需要标单 需要标双 共 间房,住 天,入住日期
  支付方式: 现金支付 转账支付 暂未确定
  其他备注:
验 证 码: 6551 *       pxcn168-01
我们的客户
 
Copyright © 2001 - 2019 PXCN168.COM All Rights Reserved
中培热线,致力于企业培训服务。为企业提供上千种企业内训,以及每年数千个公开课程,授课范围覆盖全国各大中小城市!
中培热线 与您一路携手前进,共创企业管理之路!
粤ICP备09207139号-2

粤公网安备 44011302000598号