一、命令简介
join
命令用于合并两个文件,基于一个共同的键(key)字段,将一个文件中的行与另一个文件中的行合并在一起。
这个键字段在两个文件中必须是相同的,这样 join 才能正确地将行匹配在一起。
二、命令参数
join [选项] 文件1 文件2
选项和参数
-a FILENUM
:打印文件FILENUM中不匹配的行,FILENUM是1或2。
-e EMPTY
:当某个字段为空时,使用EMPTY作为代替字符串。
-o FORMAT
:按照FORMAT指定的格式来打印输出,覆盖默认的输出格式。
-t CHAR
:使用CHAR作为输入和输出的字段分隔符,默认是空格。
-1 FIELD
:指明文件1中用作连接键的字段编号。
-2 FIELD
:指明文件2中用作连接键的字段编号。-i
或--ignore-case
:忽略键字段的字母大小写。
三、命令示例
示例1
cat a.txt #合并前
key1 value1
key2 value2
key3 value3
cat b.txt #合并前
key1 valueA
key2 valueB
key3 valueC
join -1 1 -2 1 a.txt b.txt #合并后
key1 value1 valueA
key2 value2 valueB
key3 value3 valueC
示例2
示例 3
cat a.txt b.txt #源文件
key1,value1
key2,value2
key3,value3
key1,valueA
key2,valueB
key3,valueC
join -1 1 -2 1 a.txt b.txt -t ',' #自定义分隔符
key1,value1,valueA
key2,value2,valueB
key3,value3,valueC
示例 4
源文件
cat a.txt b.txt #查看源文件内容
1 Adam
2 Brian
3 Carl
1 Programmer
2 Manager
4 Analyst
期望拼接为
1 Adam Programmer
2 Brian Manager
3 Carl
4 Analyst
第一次拼接:第一没有展示第3、4行,因为这两行没有匹配,第二提示没有排序。
join a.txt b.txt #直接拼接
1 Adam Programmer
2 Brian Manager
join: b.txt:4: is not sorted:
join: input is not in sorted order
排序
sort a.txt -o a.txt #排序
sort b.txt -o b.txt #排序
第二次拼接:使用-a 选项,将不匹配的行也展示出来。
join -a 1 -a 2 a.txt b.txt #命令
1 Adam Programmer
2 Brian Manager
3 Carl
4 Analyst
本文共 314 个字数,平均阅读时长 ≈ 1分钟
评论 (0)