|
|
分析模块复制输入文件到项目工作目录中,模块输出即为复制的拷贝,复制到项目中的文件内容与原文件一致。在项目中,常用于中转多个模块的输入。
输入: 源文件。
输出: 拷贝文件。
应用场景示例:
分析模块在项目工作目录中创建输入文件链接,类似于快捷方式,模块输出即为创建的链接文件。链接文件指向源文件,相比于文件复制,节省了硬盘空间。在项目中,常用于中转多个模块的输入。
输入: 源文件。
输出: 链接文件。
应用场景示例:
分析模块输入xls格式的Excel表格文件,将其中的表格内容转化为制表符分隔的文本文件。
输入: xls格式的Excel表格文件。
输出: 制表符分隔的文本文件。
说明: 分析模块进行数据转换的效率低,速度慢,运行时间长!建议通过Excel软件直接进行格式转换,从而得到制表符分隔的文本文件。 步骤如下(Excel 2007版本): 1、Excel软件打开xls文件,选择 "另存为" �C> "其他格式" 。 2、保存类型选择:文本文件(制表符分隔)(*.txt)。
3、接着点击 "确定" 和 "是" 。 4、关闭Excel软件。 分析模块,输入Windows/Dos文本文件,输出Unix文本文件。例如换行符,Unix用 "\n" 表示,Windows用 "\r\n" 表示。
输入: Windows/Dos文本文件。
输出: Unix文本文件。
说明: Unix文本文件和Windows/Dos文本文件的格式区别参考维基百科:(https://en.wikipedia.org/wiki/Newline)。 分析模块,输入Unix文本文件,输出Windows/Dos文本文件。例如换行符,Unix用 "\n" 表示,Windows用 "\r\n" 表示。
输入: Unix文本文件。
输出: Windows/Dos文本文件。
说明: Unix文本文件和Windows/Dos文本文件的格式区别参考维基百科:(https://en.wikipedia.org/wiki/Newline)。 分析模块,输入两个制表符分隔的表格文本文件,根据两个文件中分别指定的列作为关键字进行数据的整合,合并输出具有相同关键字的行。
输入:
1、数据文件一:
2、数据文件二:
参数设置为以**个文件的第4列,第二个文件的第1列作为关键字进行合并。
输出:
结果文件:
分析模块,将输入的多个文件从头到尾进行连接。比如,连接合并多个fastq原始数据文件成一个文件。 不同类型的文件需要小心进行连接合并,分析模块并不会进行文件格式的确认。
输入:
1、数据文件一:
2、数据文件二:
3、数据文件三:
输出:
连接合并后的结果文件:
分析模块,输入制表符分隔的表格文本文件,根据指定列,进行切列操作,从而得到提取出相应列的表格数据文件。 l 列号用c1,c2指定,逗号分隔,以此类推。列号从1开始计数。 l 列号可以任意顺序进行指定,比如c2,c1,c6 。 l 如果指定的列在输入数据中不存在,则用符号 "-" 进行填充。 l c1-c5表示从第1列到第5列数据。
输入:
数据文件(6列:c1, c2, c3, c4, c5, c6):
输出:
指定 "c1,c4,c6" 将输出:
指定 "c6,c5,c4,c1" 将输出:
指定 "c1-c3" 将输出:
指定 "c8,c7,c4" 将输出:
分析模块,输入两个制表符分隔的表格文本文件,进行列合并操作。
输入:
1、数据文件一:
2、数据文件二:
输出:
列合并后的文件:
分析模块,提取输入文件头部前n行作为输出。
输入:
取前2行,从数据文件:
输出:
结果文件:
分析模块,输入两个制表符分隔的表格文本文件,根据两个文件中分别指定的列作为关键字进行数据的整合,合并输出具有相同关键字的行。
输入:
1、数据文件一:
2、数据文件二:
参数设置为以**个文件的第4列,第二个文件的第1列作为关键字进行合并。
输出:
结果文件:
分析模块,在一个数据集指定列中查找与另一个数据集指定列匹配或不匹配的行。
输入:
1、数据文件一:
2、数据文件二:
输出:
在数据文件一第4列中查找,与数据文件二第1列匹配的行,将输出:
在数据文件一第4列中查找,与数据文件二第1列不匹配的行,将输出:
|