(完整版)kettle使用规范(修改版).docx

(完整版)kettle使用规范(修改版).docx

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
Kettle使用规范 1、Kettle 概念 Kettle是一款国外开源的 ETL工具,纯java编写,可以在 Window、Linux、Unix 上运行,绿色无需安装,数据抽取高效稳定。 Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里, 然后以一种指定的格式流出。 Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图 形化的用户环境来描述你想做什么,而不是你想怎么做。 Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的 基础转换,job则完成整个工作流的控制。 2、下载和部署 下载kettle压缩包,因kettle为绿色软件,解压缩到任意本地路径即可 3、Kettle环境配置 3.1安装JDK(略) 3.2测试JDK安装成功(略) 3.3 kettle的java环境变量 以win7为例:【开始】->【计算机】->【属性】->【高级系统属性】->【高级】-> 【环境变量】->【新建】,创建用户变量。变量名输入: pentaho_java_home 变量值输入刚才jdk的安装路径。 pauti 3 -Java bcm 计MTVfe i班Ft 個 做保护|逊 :caae:变SICLASSPATH目勺用尸克塑工丿A1: Vf of :caae: 变SI CLASSPATH 目勺用尸克塑工丿 A 1: Vf of1 r i r ia .?讦RX职卫订B絶应ILI日1」A C Atukdav txt fl it ar ?1 \r*r >1 u 以復曲此鬥再 3.4 运行 Kettle Windows 下找到 $KETTLE_HOME/spoon.dat,双击运行 -* set-pentaho-env,bat set-pentaho-e n\z.?h Spec n.b 刊 t J类型: spoon.coimma rd 曲 spccn.ico 大小: |唇改I ■亠 cnnnn nnn 欢迎界面如下图所示: Pentaho Data Integration a?neral Aval lability ? V*rskn 5t0』 :_■ : Z :::■ !;■二- …” 九―一 Lanmn tw lApaa-* L tarh* Wtoni nn 工 口 Jin* ; MS* rd LBC ”阿 ED^Xirlb ilE3 Bh ■■凸 Md |n :SgrFiflr N ◎ pentciho事 # it* 於h 砒知 鷗缁汨# 轉pp plE4U ◎ pentciho ImH 11 vWL IC£nA£■}冷 U ^M5 4Pf>ILD?^iE g .> 世id fc ■ 7叫 哽 ,斡1応申2 ?3 0価lb#3 ?■■ A "A5 15-阴弓巧 niiTHC』T AAR^AhitiES M dtMQrriaHB-OF JiNr mW, M.Bxmor ir^dbKC I** iJStni* 衲 z jRT.* 怦 MMfiiHii?f>i ?d liw^rtaitaiT <?r?1b1*ie 4、KETTLES件介绍与使用 Kettle 使用 Kettle提供了资源库的方式来整合所有的工作 ,即所建立的transformation和job及其运行日 志将被保存在数据库中,否则将以文件的形式存储在本地。 1) 创建一个新的transformation,点击保存到本地路径,例如保存到 D:/etltest下,保存文 件名为Trans, kettle默认transformation文件保存后后缀名为 ktr ; 2) 创建一个新的job,点击保存到本地路径,例如保存到 D:/etltest下,保存文件名为 Job, kettle默认job文件保存后后缀名为 kjb ; t Input 「|亘輸入 t Input 「|亘輸入| :> S輸出 ;,空转换 t :,e脚本 「巳连接 &数锯仓库 >匕统计 Big Data Agile j匕加密 -Palo OpenERP U作业 映射 「(批量加载 匸巴内联 「不推荐的 ??0历史 中基本的属性,可以通过各个节点来查看。 至接,每一个 transformation的数据库连接都 ,可以通过鼠标拖动的方式对 4.2组件树介绍 42仃ransformation的主对象树和核心对 宣主號稠、/碗嫡 _ _ 游 l?0 山 H db2excel □ database2excel J ? Steps (步骤) 卑 JavaScriptf^S H JavaScript^ 2 %| Microsoft Excel 输出 Q datasource 乱获酝统信息 缶获取蘇信息2 霁设矍变量 書绥变量2

文档评论(0)

wangyueyue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

认证主体王**

1亿VIP精品文档

相关文档

相关课程推荐