- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
Kettle使用规范
1、Kettle 概念
Kettle是一款国外开源的 ETL工具,纯java编写,可以在 Window、Linux、Unix 上运行,绿色无需安装,数据抽取高效稳定。
Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里, 然后以一种指定的格式流出。
Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图 形化的用户环境来描述你想做什么,而不是你想怎么做。
Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的 基础转换,job则完成整个工作流的控制。
2、下载和部署
下载kettle压缩包,因kettle为绿色软件,解压缩到任意本地路径即可
3、Kettle环境配置
3.1安装JDK(略)
3.2测试JDK安装成功(略) 3.3 kettle的java环境变量
以win7为例:【开始】->【计算机】->【属性】->【高级系统属性】->【高级】-> 【环境变量】->【新建】,创建用户变量。变量名输入: pentaho_java_home
变量值输入刚才jdk的安装路径。
pauti 3 -Java bcm
计MTVfe i班Ft 個 做保护|逊
:caae:变SICLASSPATH目勺用尸克塑工丿A1: Vf of
:caae:
变SI
CLASSPATH
目勺用尸克塑工丿
A
1: Vf of1 r i r ia
.?讦RX职卫订B絶应ILI日1」A
C Atukdav txt
fl it ar
?1 \r*r
>1 u
以復曲此鬥再
3.4 运行 Kettle
Windows 下找到 $KETTLE_HOME/spoon.dat,双击运行
-* set-pentaho-env,bat
set-pentaho-e n\z.?h
Spec n.b 刊 t
J类型:
spoon.coimma rd 曲 spccn.ico
大小: |唇改I
■亠 cnnnn nnn
欢迎界面如下图所示:
Pentaho Data Integration
a?neral Aval lability ? V*rskn 5t0』
:_■ : Z :::■ !;■二- …” 九―一
Lanmn tw lApaa-* L tarh* Wtoni nn 工 口 Jin* ;
MS* rd LBC ”阿 ED^Xirlb ilE3 Bh ■■凸 Md |n :SgrFiflr N
◎ pentciho事 # it* 於h 砒知 鷗缁汨# 轉pp plE4U
◎ pentciho
ImH 11 vWL IC£nA£■}冷
U ^M5 4Pf>ILD?^iE g .> 世id fc ■ 7叫 哽
,斡1応申2 ?3 0価lb#3 ?■■ A "A5 15-阴弓巧
niiTHC』T AAR^AhitiES M dtMQrriaHB-OF JiNr mW, M.Bxmor ir^dbKC
I** iJStni* 衲 z jRT.* 怦 MMfiiHii?f>i ?d
liw^rtaitaiT <?r?1b1*ie
4、KETTLES件介绍与使用
Kettle 使用
Kettle提供了资源库的方式来整合所有的工作 ,即所建立的transformation和job及其运行日
志将被保存在数据库中,否则将以文件的形式存储在本地。
1) 创建一个新的transformation,点击保存到本地路径,例如保存到 D:/etltest下,保存文
件名为Trans, kettle默认transformation文件保存后后缀名为 ktr ;
2) 创建一个新的job,点击保存到本地路径,例如保存到 D:/etltest下,保存文件名为 Job,
kettle默认job文件保存后后缀名为 kjb ;
t Input 「|亘輸入
t Input 「|亘輸入|
:> S輸出
;,空转换
t
:,e脚本
「巳连接
&数锯仓库
>匕统计
Big Data
Agile
j匕加密
-Palo
OpenERP
U作业
映射 「(批量加载 匸巴内联
「不推荐的
??0历史
中基本的属性,可以通过各个节点来查看。
至接,每一个 transformation的数据库连接都
,可以通过鼠标拖动的方式对
4.2组件树介绍
42仃ransformation的主对象树和核心对 宣主號稠、/碗嫡 _ _
游 l?0
山 H db2excel
□ database2excel
J ? Steps (步骤)
卑 JavaScriptf^S H JavaScript^ 2 %| Microsoft Excel 输出
Q datasource
乱获酝统信息 缶获取蘇信息2 霁设矍变量
書绥变量2
您可能关注的文档
- (完整word版)金属与酸反应图像题.docx
- (完整word版)金融催收行业发展白皮书20170628-Sherry1.docx
- (完整word版)金融风控法律事务部职责及岗位职责细分.docx
- (完整word版)铝及其化合物的图像题(2).docx
- (完整word版)门诊护理管理资料,第六部分(2016修订).docx
- (完整word版)闽南泉州饮食文化习俗--超楠.docx
- (完整word版)青年安全生产示范岗”活动实施方案.docx
- (完整word版)静力学受力分析答案.docx
- (完整word版)静电场问题实例:平板电容器电容计算仿真.docx
- (完整word版)鞠萍姐姐讲故事.docx
- 《秦统一多民族封建国家的建立》PPT课文课件.ppt
- 两个余华(余华简介演讲PPT).ppt
- PCM通信原理完整版.ppt
- 1.2 技术的价值 & 1.3技术的性质 课件-高中通用技术苏教版(2019)必修《技术与设计1》.pptx
- Unit 10 Section A(2a-2d)八年级英语下册(人教版).pptx
- Unit 1 Topic 1 Section A(课件) 七年级英语上册(仁爱版).pptx
- 1.1 技术的发展 课件-高中通用技术苏教版(2019)必修《技术与设计1》.pptx
- 10.1 平面及其基本性质(课件)高二数学(沪教版2020必修第三册).pptx
- 1.3 地图的阅读(课件)七年级地理上册课件(人教版).pptx
- 第19课 清朝前期社会经济的发展(课件)-七年级历史下册(部编版).pptx
文档评论(0)