join 命令:合并文件
侧边栏壁纸
  • 累计撰写 146 篇文章
  • 累计收到 2 条评论

join 命令:合并文件

soulio
2024-09-20 / 0 评论 / 5 阅读 / 正在检测是否收录...

一、命令简介

join​ 命令用于合并两个文件,基于一个共同的键(key)字段,将一个文件中的行与另一个文件中的行合并在一起。

这个键字段在两个文件中必须是相同的,这样 join 才能正确地将行匹配在一起。

二、命令参数

join [选项] 文件1 文件2

选项和参数

  • -a FILENUM​:打印文件FILENUM中不匹配的行,FILENUM是1或2。

  • -e EMPTY​:当某个字段为空时,使用EMPTY作为代替字符串。

  • -o FORMAT​:按照FORMAT指定的格式来打印输出,覆盖默认的输出格式。

  • -t CHAR​:使用CHAR作为输入和输出的字段分隔符,默认是空格。

  • -1 FIELD​:指明文件1中用作连接键的字段编号。

  • -2 FIELD​:指明文件2中用作连接键的字段编号。

  • -i​ 或 --ignore-case​:忽略键字段的字母大小写。

三、命令示例

示例1

cat a.txt #合并前
key1 value1
key2 value2
key3 value3

cat b.txt #合并前
key1 valueA
key2 valueB
key3 valueC

join -1 1 -2 1 a.txt b.txt #合并后
key1 value1 valueA
key2 value2 valueB
key3 value3 valueC

示例2

image

示例 3

cat a.txt b.txt  #源文件
key1,value1
key2,value2
key3,value3
key1,valueA
key2,valueB
key3,valueC

join  -1 1 -2 1 a.txt b.txt -t ',' #自定义分隔符
key1,value1,valueA
key2,value2,valueB
key3,value3,valueC

示例 4

源文件

cat a.txt b.txt #查看源文件内容
1 Adam
2 Brian
3 Carl

1 Programmer
2 Manager
4 Analyst

期望拼接为

1 Adam Programmer
2 Brian Manager
3 Carl
4 Analyst

第一次拼接:第一没有展示第3、4行,因为这两行没有匹配,第二提示没有排序。

join a.txt b.txt #直接拼接
1 Adam Programmer
2 Brian Manager
join: b.txt:4: is not sorted: 
join: input is not in sorted order

排序

sort a.txt -o a.txt #排序
sort b.txt -o b.txt #排序

第二次拼接:使用-a 选项,将不匹配的行也展示出来。

join -a 1 -a 2 a.txt b.txt #命令

1 Adam Programmer
2 Brian Manager
3 Carl
4 Analyst
本文共 314 个字数,平均阅读时长 ≈ 1分钟
0

海报

正在生成.....

评论 (0)

取消