跳转至

3.2、列处理

功能模块如图所示:

积木功能

列过滤

功能:此节点允许从输入表中选择包含列进行过滤,过滤掉排除列,输出表结果包含所选列。

积木功能

配置界面功能说明:

设置:

  • 数据列过滤:分为手动选择过滤列、表达式匹配过滤列、按字段类型过滤列,选择不同的列过滤规则,自定义过滤列字段。

列重命名

功能:该节点允许用户通过配置,重命名列名或更改其列字段类型。

积木功能

配置界面功能说明:

设置:

  • 更改列名:双击选择需要修改的列字段,勾选“修改为”选择框,填写需要新列名名称,或者修改列名字段类型。

文本转数字

功能:将列(或一组列)中的字符串转换为数字。如果节点解析字符串失败,它将生成一个缺失的单元格。

积木功能

配置界面功能说明:

设置:

  • 类型:双选择字符串要转换为的数字的字段类型。
  • 小数点分隔符:选择一个十进制分隔符,该分隔符用于标记十进制字符串的整数部分和小数部分之间的边界。
  • 千位分隔符:选择十进制字符串中使用的千位分隔符来将三个数字组合在一起。
  • 文本值中带有类型后缀:选中时,将接受类型后缀,否则将无法解析诸如1d之类的输入。这些后缀通常在java风格的程序中用于表示浮点数('f'表示float, 'd'表示double)。不选中则默认。

数字转文本

功能:将列(或一组列)中的数字转换为字符串。

积木功能

配置界面功能说明:

设置:

  • 转换列选择:将需要转化为数字的列移动到“包含”列表中。

列排序

功能:该节点根据用户定义的设置更改输入列的顺序。将需要重新排序的列按规则设置好后,输出结果将按照列名称对列进行重新排序。

积木功能

配置界面功能说明:

设置:

  • 排序A到Z/Z到A:按照字母顺序升序(A-Z)或降序(Z-A)进行排序。

列分割

功能:该节点使用用户指定的分隔符字符将所选列的内容拆分为多个部分。它将固定数量的列追加到输入表中,每个列包含原始列的一部分,或者将单个列包含具有分割输出的单元格集合(列表或集合)。可以指定输出是由一个或多个列组成、只有一个列包含列表单元格,还是只有一个列包含删除重复项的集合单元格。

积木功能

配置界面功能说明:

设置:

  • 要拆分的列:选择拆分值的列。
  • 在结果表中移除所选列:选中时,所选的列将不在显示在输出结果中。
  • 分隔符:在值中指定分隔符,分隔每个部分。
  • 使用\作为转义字符:如果启用,反斜杠("")可用于转义字符,例如制表符的"\t"。您可以使用Java的全部转义功能。
  • 包裹符:如果值中的不同部分被引用,则指定包裹符。(用于转义引号的字符用反斜杠。)如果不需要包裹符,则将其保留为空。
  • 去掉字符首尾的空白字符:如果勾选,将删除每个部分(标记)的首尾空白。
  • 输出
    • 列表:如果选中,输出结果将包含一个列,其中包含存储拆分部分的列表集合单元格。在列表单元格中可能出现重复。
    • 去重列表:如果选中,输出将包含一个列,其中包含存储拆分部分的集合单元格。重复被删除,并且不会在设置单元格中出现。
    • 新列:如果选中,输出结果将由一个或多个列组成,每个列包含一个拆分部分。
    • 拆分输入列名作为输出列名:当输出为新列时,如果可以以与列内容相同的方式拆分输入列名以获得输出列的名称,则选中此选项。
    • 手动设置拆分列数:根据实际情况,手动设置拆分的列数。所有创建的列都是String类型的。
    • 自动检测拆分列数和类型:如果选中此选项,节点将对整个数据表执行额外的扫描,并计算容纳拆分的所有部分所需的列数。此外,它还确定新列的列类型。
    • 扫描限制:输出列数时设置要扫描的最大行数。
  • 使用空字符串取代缺失值:如果选中,节点将创建空字符串单元格而不是缺失值单元格。

数据对比

功能:该节点将按行比较两个选定列的单元格值。

积木功能

配置界面功能说明:

配置-选项:

  • 设置对比条件
    • 左列:选择需要进行数据对比的左列字段。
    • 右列:选择需要进行数据对比的右列字段。
    • 操作符:选择数据对比常用的运算符。例如:等于、不等于、大于、大于等于、小于、小于等于。
  • 设置对比结果值:根据所选运算符的数据对比结果,将某个列的值设置到新列中。自定义对比结果值为'true'和'false'。
  • 设置对比结果列:可自定义设置对比结果列的列名。

列转行

功能:该节点将从输入表中选择的列旋转到行,并同时通过将其余输入列附加到每个相应的输出行来复制它们。

积木功能

配置界面功能说明:

配置-选项:

  • 选择要转为行值的列(必选):在该列表内选择要将列转为行的字段。
  • 选择要保留原始值的列(可选):在该列表内选择需要保留原始列值的字段。

常量列

功能:在每一行中添加/替换包含单个常量值的列。

积木功能

配置界面功能说明:

配置-选项:

  • 替换:选择已被新的常值列替换的列。
  • 增加:将常量值列添加为具有给定名称的新列。
  • 值设置:在左边的组合框中选择列的数据单元实现,在文本字段中输入实际的列值。

文本拼接

功能:该节点将多个列值,按指定规则拼接为一列值输出。

积木功能

配置界面功能说明:

配置-选项:

  • 分隔符:自定义拼接的字符以什么分隔符分割,默认使用逗号“,”分割。
  • 引用符:默认使用双引号,可自定义引用符号。
  • 将分隔符替换为:可自定义分割符号。
  • 附加列的名称:可自定义拼接列的名称。

列空值填充

功能:通过选择不缺失的单元格将两列合并为一列。配置对话框允许您选择主列和辅助列。节点的输出将是一个新列(或所选输入列的替换)。

积木功能

配置界面功能说明:

配置-选项:

  • 主列:除非缺少值,否则将使用该值的列。
  • 次列:具有将在其他情况下使用的值的列。
  • 输出操作:选择将结果列以哪种形式替换。您可以选择替换所选主列/替换所选次列/替换所选主列并移除次列,或者用自定义名称追加一个新列。