kettle使用实录
时间:2009-06-12 来源:odin_free
最近工作需要研究了一下kettle的使用。
从安装说起,下了个3.2版本安装,发现不用安装。。。直接点spoon.bat报错not find the main class
郁闷极了,上他们官网论坛看看说不用安装,自己又调试.bat脚本环境变量,重新安装jdk1.6接不得要领。最后哥们过来一看,日下错包了,下的是源代码开发包,又重新下个rc包,执行kettle.exe搞定。
从设计理念来说,他属于开源的不错etl,数据流入流出都很方便,回忆起以前自己用php读数据库sqlserver,格式处理,再导入mysql那叫一个麻烦,有他就省心了,他支持多数常见的数据库类型,支持csv xml css excel等等数据格式,转化支持去重,数据联合,加行,加列,拆分,行列转换,居然还给了计算器和mail,牛逼大了。支持数据仓库的维度和联合处理,方便一大堆。
我主要就用到界面的job系统,从文件和数据库导入,处理,导入另外一个数据库,说专业了就是数据库集群的异步同步,通过trigger+kittle很容易实现了一般数据量的交互。
例子就不说了,他有个cn的html说明 说的很清楚了。
从安装说起,下了个3.2版本安装,发现不用安装。。。直接点spoon.bat报错not find the main class
郁闷极了,上他们官网论坛看看说不用安装,自己又调试.bat脚本环境变量,重新安装jdk1.6接不得要领。最后哥们过来一看,日下错包了,下的是源代码开发包,又重新下个rc包,执行kettle.exe搞定。
从设计理念来说,他属于开源的不错etl,数据流入流出都很方便,回忆起以前自己用php读数据库sqlserver,格式处理,再导入mysql那叫一个麻烦,有他就省心了,他支持多数常见的数据库类型,支持csv xml css excel等等数据格式,转化支持去重,数据联合,加行,加列,拆分,行列转换,居然还给了计算器和mail,牛逼大了。支持数据仓库的维度和联合处理,方便一大堆。
我主要就用到界面的job系统,从文件和数据库导入,处理,导入另外一个数据库,说专业了就是数据库集群的异步同步,通过trigger+kittle很容易实现了一般数据量的交互。
例子就不说了,他有个cn的html说明 说的很清楚了。
相关阅读 更多 +