Problema resolvido, muito obrigada a todos. Douglas, o mestrado vai bem, já tou na reta final, mas quelquer dúvida é só entrar em contato. Seu script extrai o que eu quero, mas tá em loop.
Acho que não expliquei com clareza o que eu quero, mas o Cistian e o Marcio conseguiram entender, valeu! :) Mas não entendi alguma coisas no comando sed -n '/>.*/{N;s/\(.*\)\n\(...\).*/\ 1: \2/p}' dna.txt. O que seria 'N', ele pula linhas? Abs. On Sun, Mar 14, 2010 at 7:31 PM, Marcio Gil <marciom...@bol.com.br> wrote: > > > Resolvendo em uma linha com sed: > > $ sed -n '/>.*/{N;s/.*\n\(...\).*/\1/p}' dna.txt > gtg > atg > atg > atg > > ou, se você quiser manter o identificador da sequência: > > $ sed -n '/>.*/{N;s/\(.*\)\n\(...\).*/\1: \2/p}' dna.txt > >fig|674.13.peg.56: gtg > >fig|674.13.peg.57: atg > >fig|674.13.peg.58: atg > >fig|674.13.peg.59: atg > > Nota: Eu criei o arquivo dna.txt com o exemplo que você passou. > > > > -----Original Message----- > > From: Graciela > > > > Trabalho com bioinformática e queria tirar uma dúvida com vocês > > Tou com essas sequências de DNA, cada '>' representa uma sequência > > > Quero verificar apenas as três primeira letras de cada > > sequência, por shel script tem como? > > > > >fig|674.13.peg.56 > > gtgacgttaggtgacaatgttgttgttgcctcgggagccgttgtgacaaagagttttggt > > agcaatgttgtcattggtggcaacccagcacgagtgttaaaagaaatcgagtaa > > >fig|674.13.peg.57 > > atgtcaatatacccaactgcaccccaaggtgtgtcagttgatgccaatatgaaaatgata > > aagcaaaagtttggccgcattgttggcccaactgatttctattggttttatgaacaggtt > > agaaataaaggcccgtgggattataaacaaagtggcccgtttgaaaatttcggtaatttt > > cattatggggcagttggttatgcaggtggcattccagaagaagttttgttaagagctgct > > ggttgtgctcaaatgaaggcgggtacttcagctgatagctggggtagttgttggagcgat > > caaccatttggagatgatccaaacgatcaacgttatatagcactaggtattgaatatgca > > aaaagtaaaggctattag > > >fig|674.13.peg.58 > > atgaacgtggataaagcgaaaaaacgcatattgaaacgagtacaaagaggtttcaaaggt > > tatccgcaaatatctttagagtatttcgggaaaacgacagattttgctaccgaagtagtc > > atcacttttgttcctgaagaaaacgctgaagcgcaaattcagagatttacgagtgataag > > gatgttcgtgaagatgaagcaattcaatcggtattgttgaaaattattgagcgagccgac > > gctgctacggttttagaaagccgagaagtatcagtttgttaa > > >fig|674.13.peg.59 > > atgccagttgttggacaccttcaagtggtgacaaattgggatggtataccgatttgtatt > > atagaaatgacgtctgtaaccaagcaaaaatacagcgaagtaacaccggagttcgcggct > > ttagaaggtgagggtgacaagactttagcttggtggcgggaggcgcattggaacttcttc > > tcaaaagagtgcgtagagttagaaatatcaccgtcggaagatatgttgctggttctagag > > cagttcaaagtggtgtacaaataa > > > > > > > [As partes desta mensagem que não continham texto foram removidas] ------------------------------------ --------------------------------------------------------------------- Esta lista não admite a abordagem de outras liguagens de programação, como perl, C etc. Quem insistir em não seguir esta regra será moderado sem prévio aviso. --------------------------------------------------------------------- Sair da lista: shell-script-unsubscr...@yahoogrupos.com.br --------------------------------------------------------------------- Esta lista é moderada de acordo com o previsto em http://www.listas-discussao.cjb.net --------------------------------------------------------------------- Servidor Newsgroup da lista: news.gmane.org Grupo: gmane.org.user-groups.programming.shell.brazil Links do Yahoo! Grupos <*> Para visitar o site do seu grupo na web, acesse: http://br.groups.yahoo.com/group/shell-script/ <*> Para sair deste grupo, envie um e-mail para: shell-script-unsubscr...@yahoogrupos.com.br <*> O uso que você faz do Yahoo! Grupos está sujeito aos: http://br.yahoo.com/info/utos.html