- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
TDH大数据平台实验_05_Sqoop基本用法
平台认证数据工程师培训
课堂实验
一、基本信息
文档编号 文档版本 1.0
实验名称 Sqoop 基本用法
所属课程 第5 讲 分布式ETL 工具Sqoop 认证等级 数据工程师 (初级)
授课形式 上机实验 实验批次 第5 次 / 共11 次
二、实验目的
掌握Sqoop 数据导入的基本过程。
理解Sqoop 工作原理。
三、实验准备
为了简化实验,采用Incepor Metastore 自带的MySQL (即TxSQL),作为Sqoop 数据源。
安装TDH Client,使用TDH Client 集成的Sqoop。
实验目录规划(zhangsan 代表学员姓名)
(1)本地目录:mnt/disk1/zhangsan ;
(2 )HDFS 采集目录:/tmp/zhangsan/sqoop_data/ ;
(3 )MySQL 数据库名:db_zhangsan 。
四、实验内容
1、创建MySQL用户
任务:创建MySQL 用户,将全部权限赋给集群的三台服务器,并确保赋权生效。
步骤
Linux :
/* 登录MySQL ,-u 为用户名,-p 为密码,-P 为端口号,-h 为集群第一台服务器IP ,
root 密码存储在服务器的/etc/txsql1/conf/db.properties 文件中 */
1. mysql -uroot –p120621016 –P3316 –h 172.16.140.85
SQL:
// 创建用户
1. create user 'sqoopuser'@'172.16.140.85' identified by '111111';
1
平台认证数据工程师培训
2. create user 'sqoopuser'@'172.16.140.86' identified by '111111';
3. create user 'sqoopuser'@'172.16.140.87' identified by '111111';
// 将全部权限赋给集群的三台服务器
4. grant all privileges on *.* to sqoopuser@'172.16.140.85';
5. grant all privileges on *.* to sqoopuser@'172.16.140.86';
6. grant all privileges on *.* to sqoopuser@' 172.16.140.87';
// 使赋权生效
7. flush privileges;
2、准备实验数据
任务:向MySQL 中插入实验数据。
步骤
SQL:
// 创建并切换数据库
1. create database db_zhangsan;
2. use db_zhangsan;
3. show tables;
// 创建表,并插入实验数据
4. create table test(name varchar(11),age int ,sex varchar(11));
5. insert into test value('zs',11,'girl');
6. insert into test value('zs',11,'girl');
7. insert into test value('zs',11,'girl');
8. insert into test value('zs',11,'girl');
9. insert into test value('zs',11,'girl');
10. i
您可能关注的文档
- TDH大数据平台培训_第02讲_分布式文件系统HDFS.pdf
- TDH大数据平台培训_第03讲_分布式资源管理框架YARN.pdf
- TDH大数据平台培训_第04讲_分布式计算框架.pdf
- TDH大数据平台培训_第05讲_分布式ETL工具Sqoop.pdf
- TDH大数据平台培训_第06讲_分布式数据采集工具Flume.pdf
- TDH大数据平台培训_第07讲_分布式消息队列Kafka.pdf
- TDH大数据平台培训_第08讲_星环大数据产品介绍_V4.0.pdf
- TDH大数据平台培训_第09讲_TDH平台的软硬件环境要求.pdf
- TDH大数据平台培训_第10讲_TDH集群的角色分配.pdf
- TDH大数据平台培训_第11讲_分布式SQL引擎Inceptor.pdf
文档评论(0)