INFA Transformation组件

Router
Router和Filter很类似,Router能够用一或多个Filter来取代,不一样的是用Router来生成多个组时输入数据只需处理一次,因此效率更高;
Router 由一个输入组,一到多个用户定义的输出组和一个默认组组成,每个用户定义的输出组含一个测试条件,知足条件的输入数据会进入相应的用户定义组,不知足全部用户定义条件的数据会进入默认组;
输入组和输出组的端口类型和名称相同;
Powercenter根椐链接的用户定义输出组的顺序来进行评估,若是默认组没有链接,则不评估那些没有链接的用户定义输出组;
若是某一行符合多个输出组的评估条件,则出如今多个组的输出数据流中;
能够将一个输出组的端口连到多个Transformation或者Target上,但不能将多个输出组的端口连到一个Transformation或者Target上;
  Sorter服务器

Sorter用来排序数据,能够指定多个排序端口,每一个端口能够指定升降序,字符串比较时能够忽略大小写,还能够用Distinct选项来消除重复(全部端口,包括没有指定排序的端口);
排序时会用到输入数据两倍大小或者更大的空间,默认的排序Cache是8M,可选的排序Cache范围是1M到4G,排序Cache不够时,服务器会将数据临时存储在排序目录,若是指定的排序Cache没法知足,会话会失败,能够用文档中提到公式计算Cache;
当配置使用 Distinct属性时,全部的端口都会用于排序;
默认状况下,NULL大于任何值,能够配置NULL值小于任何值;
  Union函数

Union能够将多个数据流合并成一个数据流,功能相似于SQL中的UNION ALL;
Union能够有多个输入组,只有一个输出组,输入组和输出组有一一对应的端口;
Ports 页不可编辑,只能编辑Groups 和 Group Tabs页;
 Rank测试

Rank能够用来返回根椐某个端口排序的最大或者最小的N条记录,而且能够指定分组;能够用于获得去除的重复资料(好比5条相同数据,只取了一条,那么另外四条能够由这个加上Sqerence组合获得其它四条.).
Rank中可使用分组,但并不能使用分组函数,能够指定多个分组端口,但用于排序的Rank端口不可用于分组;
Rank端口有五种属性:I(输入),O(输出),V(变量),R(排序),G(分组),至少须要有一个输入端口和一个输出端口,排序端口有且只有一个,并且必须输出,排序端口和变量端口不能用于分组;
输入端口的数据只能来自一个Transformation;
有一个默认的Rankindex端口,表示输出行在排序中的位置;
若是是字符排序,能够选择大小敏感或者大小写不敏感;
Top X 中的X数量表示前几条数据(Rankindex的值就是顺序),当Rankindex同样时,取其中部分,好比Top1,有两条记录的Rankindex为1,则取其中一条.其受cache限制,可按需调整cache.
---------------------
做者:吃鱼的羊
来源:CSDN
原文:https://blog.csdn.net/hellojoy/article/details/46741917?utm_source=copy
版权声明:本文为博主原创文章,转载请附上博文连接!.net

相关文章
相关标签/搜索