Desculpa pessoal, Quis facilitar e acabei complicando.
O que tá lá no pastebin é o arquivo do jeito que tenho hoje. O exemplo que coloquei no corpo do email é o output esperado do script ao tratar o arquivo lá do pastebin Expliquei? :) []'s Eri 2009/6/25 Eri Ramos Bastos <bastos....@gmail.com>: > Olá, lista > > Estou tentando encontrar dados parcialmente duplicados num arquivo, > mas estou levando uma boa surra. > Foi bem fácil encontrar os totalmente duplicados usando sort e awk, > mas não consigo extrair os parcialmente duplicados. > > Os dados estão nesse formato aqui: http://pastebin.com/m79c990bf > > O que eu quero saber é quais dados estão sendo repetidos na primeira, > segunda e última coluna, mas são únicos na terceira coluna. Preciso > contar esses dados baseado na segunda coluna, de forma que no arquivo > exemplo o resultado do script seria: > > $ ./script raw-file.txt > 6361 34662277560 46606975 2 > 6361 36612632553 46606975 2 > 6361 36620505642 46606975 2 > > > Alguma dica? > > []'s > Eri >