曙海教育集团
全国报名免费热线:4008699035 微信:shuhaipeixun
或15921673576(微信同号) QQ:1299983702
首页 课程表 在线聊 报名 讲师 品牌 QQ聊 活动 就业
 
大数据平台数据管控培训

 
  班级规模及环境--热线:4008699035 手机:15921673576( 微信同号)
      每个班级的人数限3到5人,互动授课, 保障效果,小班授课。
  上间和地点
上部份地点:【上海】同济大学(沪西)/新城金郡商务楼(11号线白银路站)【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院【北京分部】:北京中山学院/福鑫大楼【南京分部】:金港大厦(和燕路)【武汉分部】:佳源大厦(高新二路)【成都分部】:领馆区1号(中和大道)【沈阳分部】:沈阳理工大学/六宅臻品【郑州分部】:郑州大学/锦华大厦【石家庄分部】:河北科技大学/瑞景大厦
最近开间(周末班/连续班/晚班):2019年1月26日
  实验设备
    ◆小班教学,教学效果好
       
       ☆注重质量☆边讲边练

       ☆合格学员免费推荐工作
       ★实验设备请点击这儿查看★
  质量保障

       1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
       2、课程完成后,授课老师留给学员手机和Email,保障培训效果,免费提供半年的技术支持。
       3、培训合格学员可享受免费推荐就业机会。☆合格学员免费颁发相关工程师等资格证书,提升职业资质。专注高端技术培训15年,曙海学员的能力得到大家的认同,受到用人单位的广泛赞誉,曙海的证书受到广泛认可。

部份程大纲
 
  • 主题 内容
    数据治理范围
  •  数据治理面临的挑战
     数据的多元化
     数据的复杂性
     数据的完整性
     数据生命周期管理
     统一元数据管理
     数据集成方法
     数据安全
     数据湖架构
     基于大数据平台的数据建模
     RMDBS数据的增量实时同步采集
  • 大数据在国内的运用
  •  大数据在国内的使用介绍
     离线计算框架介绍
     流式计算框架介绍
     内存计算框架介绍
     内存流式计算介绍
     大数据实时请求框架介绍
     大数据在证券的案例介绍
     大数据在银行的案例介绍
  • 大数据生态系统介绍
  •  分布式存储—HDFS
     分布式并行计算—MapReduce
     基于Hadoop的数据仓库—Hive
     统一元数据管理—Hcatlog
     集群管理工具—ambari
     工作流工具—Oozie
     数据的并行采集—Flume
     MapReduce脚本工具—Pig
     与关系型数据库之间的数据迁移—Sqoop
     资源管理平台—Yarn
     数据生命周期管理—Falcon
     数据挖掘算法—Mahout
     分布式统一服务—Zookeeper
     Hadoop安全工具—Knox
     流式计算框架—Storm
     内存计算框架—Spark
     数据挖掘框架—Mahout、Mllib和Graphx
  • 统一元数据管理
  •  元数据概念
     Hadoop平台元数据处理面临的问题
     Hcatalog介绍
     Hcatlog原理和架构解析
     Hive与Hcatlog关系
     Hcatlog解决那些问题
     Hcatlog实战
     元数据注册机制
     基于Hadoop平台元数据处理方案
  • 数据生命周期管理
  •  数据质量
     数据标准
     数据生命周期管理的重要性
     数据生命周期的概念
     开源Falcon解决那些问题
     Falcon架构和原理
     Falcon实战
     Falcon+HDFS、Hive实战
     Falcon+Oozie实战
  • 大数据平台安全
  •  Hadoop平台安全介绍
     HDFS2.0的ACLS介绍
     Hive安全介绍
     Hbase基于namespace的安全介绍
     Hadoop访问安全控制Knox
     Knox的架构和原理
     Knox与Kerberos介绍
     Ranger安全工具介绍
     Knox+Ranger整合控制Hadoop平台的安全
     基于Hadoop平台的数据加密
  • 数据湖
  •  数据湖概念
     数据湖解决那些问题
     数据湖架构
     数据的整合
     数据的landing zone功能
     离线数据管理
     流式数据管理
     RDBMS全量和增量数据实时采集
     Databus框架介绍
     Databus功能介绍
     Databus解决那些问题
  • Think big基于Hadoop平台实战
  •  怎么快速迭代在Hadoop平台开发
     Hadoop平台设施的方法论
     2个月快速基于Hadoop平台开发步骤
     Hadoop平台开发的难点
     Hadoop平台开的注意点
     Hadoop平台设施的流程
  • 互联网大数案例分享
  •  淘宝大数据平台深度解析
     基于大数据平台的实时营销架构
     淘宝大数据推荐架构介绍
     大数据实时分析架构
 

-

 

  备案号:沪ICP备08026168号 .(2014年7月11)..............