Greenplum分布式大数据实战培训
培训班型: 企业内训、公开课
课程长度: 3天/18小时
培训讲师: 博学高级讲师
培训地点: 杭州市文三路252号伟星大厦19楼博学教育
环境要求: 投影仪、白板、大白纸
培训形式: 实例讲授,现场演、练、及时沟通
培训资料: 培训教材
课程内容
Greenplum:Greenplum诞生于2003年硅谷,2010/07 EMC收购了GREENPLUM,并把GREENPLUM作为EMC面向分析云的战略核心产品,加以大力发展。该产品不仅在国际市场发展很快,在国内市场发展也很快。最著名的案例就是阿里巴巴集团,经过多种产品的精心选型,最终选择GREENPLUM作为它们的数据仓库平台存放数百TB的业务数据去高效支持各种分析应用。正是由于产品发展速度很快,但是在相关人才上存在很大缺口。
课程描述:本课程全面深入地介绍了Greenplum数据库的方方面面,包括架构特性、部署、理、开发和调优等,由浅入深,理论结合实战,让同学全面彻底掌握这把大数据利剑。
培训对象:本课程适合于有对数据库和sql语句有一定了解,熟练使用linux系统的技术人员,特别适合于想换工作或寻求高薪职业的人士。
课程目标:课程结束时,帮助学员实现如下目标:
1、了解Greenplum的历史及目前发展的现状、以及它们的技术特点,从而把握分布式计算框架及未来发展方向,在大数据时代能为企业的技术选型及架构设计提供决策参考。
2、深入理解Greenplum的技术核心和管理操作,以此为基础,进而掌握MPP架构数据库的使用和调优的思想。
课程大纲:
1. Greenplum 概述
Greenplum 数据库架构和模块
数据冗余模块
数据监控模块
2. 分布式数据和查询处理
分布式表结构
3. 并行查询规划和执行
硬件设置
软件设置考虑
存储考虑
OS考虑
硬件优化
4. 数据库内部机制
System Catalog Table
数据库物理存储
数据库进程介绍
5. 安装和初始化
安装介绍
环境设置
数据库初始化
软件更新
6. Postgres PSQL
连接数据库
运行SQL语句
PSQL 命令
怎样设置参数
怎样查看参数
pg_hba.conf 配置文件
7. DDL 语句
Database
Schema
Table
Data Type
Constraints
其他数据库对象
8. 角色授权介绍
数据库用户
数据库群组
数据库授权
资源队列和工作负载管理
9. 表操作
表分区
怎样分区一个表
AO表
10. 数据加载
外表
GPfdist和GPload
Copy
数据加载性能
11. 性能调优
性能调优考虑
常见问题
硬件问题
资源规划问题
数据库统计
12. 数据分布
数据库设计
数据锁
PSQL调优
13. 数据库管理
启停数据库服务
监控系统状态
检查数据斜交
检查磁盘空间使用
Log 文件
Vacuum
Analyze
Reindex
14. 容错和高可用
主 Segment
镜像Segment
15. 故障检测和恢复
备用 Master
16. 备用和恢复
备份数据
恢复数据
自动备份
17. Greenplum技术实战