两个结果集都有如下格式的行:

2012-03-25 18:30:29|abc|1048315014

2012-03-25 20:43:49|vsd|2331250121

2012-03-25 22:27:01|abc|2416567343


cat file1 | awk -F '|' '{print $2}'

cat file2 | awk -F '|' '{print $2}'

如何对这两个结果集进行比较得出其中$2不同的记录?

2011-02-23 07:47:17

3 Answers

方法一:

comm -23 file1 file2

方法二:

grep -v -f file1 file2

/注::此法在对比数字时候比较凑效果,文本对比不建议使用/

方法三:

awk '{print NR,$0}' file1 file2 |sort -k2|uniq -u -f 1|sort -k1|awk '{print $2}'

或者:

awk '{print $0}' file1 file2 |sort|uniq -u

2011-02-23 09:53:12

awk 'NR==FNR{a[$0]=$0;next;}!a[$0];' file1 file2

2011-02-23 11:17:27

#!/bin/bash
#判断是否输入两个参数,文件1 和 文件2
if [ $# != 2 ]
then
echo "using:please enter two parameters"
exit 1
fi
#判断两个文件是否是普通文件
if [ -f $1 -a -f $2 ]
then
sed '1,$s/\s/\n/g' $1|#把文件1中的空格都替换为换行符,使得所有的单词都变为一列,循环送到#while的word变量中
while read word
do
grep -q "\<$word\>" $2 #读到的每一个词在文件2查找,加-q参数后不打印搜索结果
if [ $? -eq 0 ] #如果查找成功,进入if模块中
then
sed -i "1,\$s/\<$word\>//g" $1 #把文件1中的所有word单词删除
sed -i "1,\$s/\<$word\>//g" $2 #把文件2中的所有word单词删除
fi
done
fi
sed -i -e "/^\s$/d" -e "1,\$s/\s{2,}/ /g" -e "s/^\s//g" $1 sed -i -e "/^\s$/d" -e "1,\$s/\s{2,}/ /g" -e "s/^\s//g" $2
#最后两句用来调整 删除所有相同单词后文件的格式
#"/^\s*$/d"用来删除多有空行
#"1,\$s/\s{2,}/ /g"用来使多个空格变为一个空格
#"s/^\s//g" $1 用来删除行首空白符
# "-e" 参数用来在一条语句中执行多条sed命令

2011-02-23 12:42:30
您不能回答该问题或者回答已经关闭!

相关文章推荐

  • C#中using指令的几种用法

    using + 命名空间名字,这样可以在程序中直接用命令空间中的类型,而不必指定类型的详细命名空间,类似于Java的import,这个功能也是最常用的,几乎每个cs的程序都会用到

  • C#实例解析适配器设计模式

    将一个类的接口变成客户端所期待的另一种接口,从而使原本因接口不匹配而无法在一起工作的两个类能够一起工作

  • 使用托管C++粘合C#和C++代码(二)

    本文实现一下C++代码调用C#代码的过程。我构造一个简单并且直观的例子:通过C++ UI 触发C# UI.

  • C#开发高性能Log Help类设计开发

    项目中要在操作数据库的异常处理中加入写Log日志,对于商业上有要求,写log时对其它操作尽可能影响小,不能因为加入log导致耗时太多

  • Async和Await使异步编程更简单

    C#5.0中async和await两个关键字,这两个关键字简化了异步编程,之所以简化了,还是因为编译器给我们做了更多的工作

  • C#开发中的反射机制

    反射的定义:审查元数据并收集关于它的类型信息的能力。元数据(编译以后的最基本数据单元)就是一大堆的表,当编译程序集或者模块时,编译器会创建一个类定义表,一个字段定义表,和一个方法定义表等

  • C#运行时相互关系

    C#运行时相互关系,包括运行时类型、对象、线程栈和托管堆之间的相互关系,静态方法、实例方法和虚方法的区别等等

  • C#协变和逆变

    “协变”是指能够使用与原始指定的派生类型相比,派生程度更大的类型,“逆变”则是指能够使用派生程度更小的类型

  • C#基础概念之延迟加载

    延迟加载(lazy load)是Hibernate3关联关系对象默认的加载方式,延迟加载机制是为了避免一些无谓的性能开销而提出来的,所谓延迟加载就是当在真正需要数据的时候,才真正执行数据加载操作

  • 使用托管C++粘合C#和C++代码(一)

    C#在xml读写,数据库操纵,界面构造等很多方面性能卓越;C++的效率高,是底层开发的必备武器

  • C#中的索引器的简单理解和用法

    C#中的类成员可以是任意类型,包括数组和集合。当一个类包含了数组和集合成员时,索引器将大大简化对数组或集合成员的存取操作

  • 深入C# 序列化(Serialize)、反序列化(Deserialize)

    C#中的序列化和反序列化,序列化是.NET运行时环境用来支持用户定义类型的流化的机制