匿名
未登录
登录
Linux78|wiki
搜索
查看“Etl工具比较”的源代码
来自Linux78|wiki
名字空间
页面
讨论
更多
更多
页面选项
查看
查看源代码
历史
←
Etl工具比较
因为以下原因,您没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
wiki:用户|用户
您可以查看与复制此页面的源代码。
ETL是什么? ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。(数据仓库结构)通俗的说法就是从数据源抽取数据出来,进行清洗加工转换,然后加载到定义好的数据仓库模型中去。目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ETL是BI项目重要的一个环节,其设计的好坏影响生成数据的质量,直接关系到BI项目的成败。 目前比较常用的etl工具有DataPipeline,Kettle,Talend,Informatica === 易用性: === DataPipeline: 有非常容易使用的 GUI,具有丰富的可视化监控; Kettle: GUI+Coding; Informatica: GUI+Coding,有GUI,但是要专门的训练; Talend:GUI+Coding,有 GUI 图形界面但是以 Eclipse 的插件方式提供; === 技能要求: === DataPipeline:操作简单,无技术要求; Kettle: ETL设计, SQL, 数据建模 ; Informatica: ETL设计, SQL, 数据建模; Talend:需要写Java; === 底层架构: === DataPipeline:分布式,可水平扩展; Kettle:主从结构非高可用; Informatica:分布式; Talend:分布式; === 数据实时性: === DataPipeline:支持异构数据源的实时同步,速度非常快; Kettle:不支持实时数据同步; Informatica:支持实时,效率较低; Talend:支持实时处理,需要购买高级版本,价格贵; === 技术支持: === DataPipeline:本地化原厂技术支持; Kettle:无; Informatica:主要在美国; Talend:主要在美国;
返回至
Etl工具比较
。
导航
导航
首页
最近更改
随机页面
栏目
Nginx
Kubernetes
Spring Cloud
Wiki工具
Wiki工具
特殊页面
页面工具
页面工具
用户页面工具
更多
链入页面
相关更改
页面信息
页面日志