数据分析师培训
课程介绍
了解Apache Pig、Apache Hive及Apache Impala如何通过删选、连接进行数据转换和数据分析,以及利用其它常见技术自定义用户功能。
Apache Hadoop基础及数据ETL(包括数据提取、转换及加载)、如何通过使用Hadoop相关工具将数据载入Hadoop并进行分析处理:
• 如何使用Apache Pig对多个关联的数据集进行join操作以及如何分析不同的独立数据;
• 如何使用Apache Hive:通过定义合适的表来组织数据、执行各种数据变换、简化复杂查询;
• 如何使用Impala来对存储在HDFS里的大规模数据进行实时和交互式的分析查询;
• 如何根据数据分析任务来选择合适的数据分析工具。
课程目标
• 了解Apache Pig、Apache Hive及Apache Impala如何通过删选、连接进行数据转换和数据分析,以及利用其它常见技术自定义用户功能。
适合人群
• 需要使用Hadoop来进行数据分析的数据分析员,商业分析员,开发员以及系统管理员。
• 面向意欲使用SQL、脚本和基本Linux 操作 Hadoop数据的分析师、BI专家、架构 师和管理员。培训对象不要求具有Hadoop 相关知识。
数据分析
Cloudera Hadoop数据分析师培训