比如以下文本:


name1,1,21,address1

name2,0,,

name3,0,,

name4,1,30,address4

name5,0,24,address5

name6,1,,

name7,1,29,address7


其中name2、name3和name6的第三列和第四列都为空值,我想实现这些空值自动填充为它们上方的相应列不为空的数据,如下所示:


name1,1,21,address1

name2,0,21,address1

name3,0,21,address1

name4,1,30,address4

name5,0,24,address5

name6,1,24,address5

name7,1,29,address7


请问用awk怎样实现呢?其他语言的版本不需要~

2011-02-27 01:51:40

6 Answers

可以用脚本实现,可能不是最简单的 

#!/bin/bash awk '{print}' aa.txt | while read line do a1=`echo $line | awk -F , '{print $1}'` a2=`echo $line | awk -F , '{print $2}'` a3=`echo $line | awk -F , '{print $3}'` a4=`echo $line | awk -F , '{print $4}'` if [[ ! -z $a1 && ! -z $a2 && ! -z $a3 && ! -z $a1 ]];then echo "$a1,$a2,$a3,$a4" >> bb.txt b1=$a1 b2=$a2 b3=$a3 b4=$a4 else if [ -z $a1 ];then a1=$b1 fi if [ -z $a2 ];then a2=$b2 fi if [ -z $a3 ];then a3=$b3 fi if [ -z $a4 ];then a4=$b4 fi echo "$a1,$a2,$a3,$a4" >> bb.txt fi done
2011-02-27 05:44:26
awk -F"," '{if($3){b=null;for(i=3;i<=NF;i++){b=b","$i}print $0}else{$0=$0b;gsub(/,+/,",",$0);print $0}}' 文件
2011-02-27 07:05:13
awk -F"," '{if(FNR==1){tmp3=$3;tmp4=$4;}if($3==null)$3=tmp3;if($4==null)$4=tmp4;tmp3=$3;tmp4=$4;a[FNR]=$1","$2","$3","$4; print a[FNR]}' 1.txt
2011-02-27 08:47:49
awk -F, 'BEGIN{OFS=","} { for(i=1;i<5;++i) if(length($i)==0) $i = rec[i]; split($0,rec); print }' in_file
2011-02-27 10:30:23
awk -F"," 'BEGIN{OFS=","}{if($3){th=$3;fo=$4;print $0}else{print $1,$2,th,fo}}' yourfile
2011-02-27 11:46:45
vi 1.txt name1,1,21,address1 name2,0,, name3,0,, name4,1,30,address4 name5,0,24,address5 name6,1,, name7,1,29,address7 awk -F',' 'BEGIN{OFS=","}{if($1!=""&&$2!=""&&$3!=""&&$4!=""){a=$1;b=$2;c=$3;d=$4}else{if($1==""){$1=a;}if($2==""){$2=b;}if($3==""){$3=c;}if($4==""){$4=d}}print;}' 1.txt name1,1,21,address1 name2,0,21,address1 name3,0,21,address1 name4,1,30,address4 name5,0,24,address5 name6,1,24,address5 name7,1,29,address7
2011-02-27 03:47:01
您不能回答该问题或者回答已经关闭!

相关文章推荐

  • C#中using指令的几种用法

    using + 命名空间名字,这样可以在程序中直接用命令空间中的类型,而不必指定类型的详细命名空间,类似于Java的import,这个功能也是最常用的,几乎每个cs的程序都会用到

  • C#实例解析适配器设计模式

    将一个类的接口变成客户端所期待的另一种接口,从而使原本因接口不匹配而无法在一起工作的两个类能够一起工作

  • C#开发高性能Log Help类设计开发

    项目中要在操作数据库的异常处理中加入写Log日志,对于商业上有要求,写log时对其它操作尽可能影响小,不能因为加入log导致耗时太多

  • 使用托管C++粘合C#和C++代码(二)

    本文实现一下C++代码调用C#代码的过程。我构造一个简单并且直观的例子:通过C++ UI 触发C# UI.

  • Async和Await使异步编程更简单

    C#5.0中async和await两个关键字,这两个关键字简化了异步编程,之所以简化了,还是因为编译器给我们做了更多的工作

  • C#开发中的反射机制

    反射的定义:审查元数据并收集关于它的类型信息的能力。元数据(编译以后的最基本数据单元)就是一大堆的表,当编译程序集或者模块时,编译器会创建一个类定义表,一个字段定义表,和一个方法定义表等

  • C#运行时相互关系

    C#运行时相互关系,包括运行时类型、对象、线程栈和托管堆之间的相互关系,静态方法、实例方法和虚方法的区别等等

  • C#协变和逆变

    “协变”是指能够使用与原始指定的派生类型相比,派生程度更大的类型,“逆变”则是指能够使用派生程度更小的类型

  • C#基础概念之延迟加载

    延迟加载(lazy load)是Hibernate3关联关系对象默认的加载方式,延迟加载机制是为了避免一些无谓的性能开销而提出来的,所谓延迟加载就是当在真正需要数据的时候,才真正执行数据加载操作

  • 使用托管C++粘合C#和C++代码(一)

    C#在xml读写,数据库操纵,界面构造等很多方面性能卓越;C++的效率高,是底层开发的必备武器

  • C#中的索引器的简单理解和用法

    C#中的类成员可以是任意类型,包括数组和集合。当一个类包含了数组和集合成员时,索引器将大大简化对数组或集合成员的存取操作

  • 深入C# 序列化(Serialize)、反序列化(Deserialize)

    C#中的序列化和反序列化,序列化是.NET运行时环境用来支持用户定义类型的流化的机制