021-52581540
服务热线
返回顶部
当前位置: 首页>IT技能进阶>企业级的大数据课程

企业级的大数据课程

全面深入应用课程 6天

支持服务 训前调研 定制内容

上课天数
索取方案 立即咨询 企业内训登记

你所报名的课班已满/课班报名日期已截止/你所填写的人数超过了课班可报名数

课程特色:
1. 理论与实践相结合、案例分析与行业应用穿插进行; 2. 专家精彩内容解析、学员专题讨论、分组研究; 3. 通过全面知识理解、专题技能演示和实践引导学员掌握课程内容。


课程对象
1、对云计算、分布式数据存储于处理、大数据等感兴趣的工程师 2、传统的数据库,例如Oracle、My SQL、DB2等的管理人员 3、数据分析工程师、BI工程师和ETL开发人员 4、网站服务器端的开发人员


课程收益
1、理解大数据概念 2、理解hadoop栈及其组件说明 3、学会hadoop安装与配置 4、理解分布式文件系统 5、理解Hadoop IO 6、理解RPC协议 7、深入理解MapReduce 8、MapReduce设计模式 9、了解性能调优 10、了解hadoop管理 11、Hadoop 在实际项目中的应用


课程大纲
Hadoop 是一个由 Apache 基金会所开发的分布式系统基础架构,它可以使用户在不了解分布式底层细节的情況下开发分布式程序,充分利用集群的威力进行高速运算和存储。 从其定义就可以发现,它解決了两大问题:大数据存储、大数据分析。也就是 Hadoop 的两大核心:HDFS 和 MapReduce。 HDFS(Hadoop Distributed File System)是可扩展、容错、高性能的分布式文件系统,异步复制,一次写入多次读取,主要负责存储。 MapReduce 为分布式计算框架,包含map(映射)和 reduce(归约)过程,负责在 HDFS 上进行计算。 本课程将介绍Hadoop栈的相关技术与其两大核心技术HDFS和MapReduce的实践,学员将掌握使用新技术和工具将数据采集到Hadoop集群并进行处理,从而具备解决实际大数据问题和挑战的能力。使用Hadoop栈,不同行业的开发人员可以为不同的商业应用和系统架构编写复杂的并行应用,得以更快速地获取更优的商业决策,帮助决策人员进行及时应对。

课程大纲

大数据概念     什么是大数据     hadoop生态圈工具介绍     hadoop应用现状介绍与版本历史 hadoop安装     伪分布式安装     集群分布式安装 hadoop组件说明     YARN模型概述 分布式文件系统     HDFS介绍     JAVA 接口 Hadoop IO     hadoop序列化     文件压缩     编码解码     特殊文件处理 RPC协议     RPC概述     hadoop rpc包的协议 深入理解MapReduce     MapReduce     MapReduce作业运行流程     作业关键过程详解     shuflle和排序     作业调度器介绍     如何去开发MapReduce MapReduce设计模式     MapReduce设计模式实践 性能调优     Hadoop性能优化 hadoop管理     Hadoop管理 Hadoop 实战:NIIT动感云课堂网站日志分析     项目需求分析     数据清洗     数据统计处理与入库     数据可视化     性能调优