Benito, teste: /^[A-Za-z]{2}+[A-Za-z0-9]*/ Em Qua, 2007-12-05 às 17:18 -0200, Tiago Barcellos Peczenyj escreveu: > Por alguma razão o sed consegue entender que o ultimo ? se refere a > expressão [A-Z]{2}, mas esse site entende como se fosse apenas {2}? -- > alias > isso não faz sentido, um quantificador ser opcional... seria uma ER de > uma > ER... > > Vc pode forçar que o ? seja aplicado ao que vc quer: > ([A-Z]{2}[0-9]{2})+([A-Z]{2})? > > Ai funciona tanto no site (que faz uso de javascript, provavelmente) > quanto > em quaisquer outras ferramentas com o mesmo comportamento curioso > acerca do > ? ;-) > > On 12/5/07, Josenivaldo Benito Junior <[EMAIL PROTECTED]> wrote: > > > > Só acrescentando, > > > > o site http://regexpal.com/ > > > > Também interpreta ao ER do Thiago diferente. Ele da match em strings > de 6 > > digitos mas não da match em 4 digitos nem em 8 como o sed. Alguma > > explicação > > para isso? > > > > Exemplo usado no site: > > > > JJ34 => não pega > > GG47LH => pega > > FG37LL33 => não pega > > FG37LL33JK ==> pega > > > > Todas são válidas. No sed fica assim: > > > > [rdlxsr02][wjb069_teDebug][/home/sw/wjb069] > > > cat ttt | sed -r 's/([A-Z]{2}[0-9]{2})+[A-Z]{2}?/|&|/' > > |JJ34| > > |GG47LH| > > |FG37LL33| > > |FG37LL33JK| > > > > Ou seja, pega todas! > > > > Muito obrigado, > > Benito. > > > > On 12/5/07, Josenivaldo Benito Junior > <[EMAIL PROTECTED]<jrbenito%40benito.qsl.br>> > > wrote: > > > > > > Oi, > > > > > > eu acho que expressei-me mau. > > > > > > não existe a forma > > > > > > GG482733 (que sua expressão pegaria) > > > > > > O formato correto é: duas letras+dois números+duas letras+dois > > > números+duas letras > > > > > > O comprimento total é no máximo 12, mas o mais comum é 4 ou 6 como > por > > > exemplo: > > > > > > GG48LH > > > GG67 > > > GG48 > > > JH32HG > > > ... > > > > > > É mais ou menos assim: > > > > > > GG -> indica uma grade grande (de latitude e longitude) (quadrada) > > > GG48 -> se você dividir o quadro GG em pedacinhos (o tamanho não > vem ao > > > caso), GG48 representa um dos pedacinhos de GG (um quadro) > > > GG48LH -> novamente, divide o quadro GG48 em vários pedaços e > GG48LH é > > um > > > desses pedaços, GG48JG é outro e assim vai. > > > > > > Exemplo prático: > > > > > > O localizador da minha residência é GG67MH (com 6 digitos). > Dependendo > > da > > > aplicação eu posso informar: > > > > > > GG67 (menos preciso) > > > GG67MH (mais preciso) > > > > > > Então, o comum na aplicação é aparecerem localizadores, um por > linha, > > > assim: > > > > > > GG67 > > > GG35AF > > > GG67MH > > > GG48LH > > > GG67LH > > > DF45OP > > > DF54 > > > > > > Eventualmente podem aparecer: > > > > > > GG67AF33 > > > JH34RD25ES > > > > > > Mas não estou me preocupando com estes casos, posso cortá-los em 6 > > digitos > > > sem perda de informação relevante à minha aplicação. Cortando > esses dois > > > exemplo fica: > > > > > > GG67AF > > > JH34RD > > > > > > Mas, não posso aumentar um grid de 4 digitos para para 6 > > arbitrariamente, > > > por exemplo: > > > > > > usuário entra com GG48 > > > eu não posso assumir GG48LH ou GG48JH ou GG48EJ ... tenho que > considerar > > > apenas GG48 > > > > > > O que eu tentei fazer inicialmente era consistir qualquer > sequencia > > > agrupada de duas letras+dois numeros+duas letras+dois numeros e > assim > > por > > > diante. Só para ter certeza que não entrem coisas inválidas como? > > > > > > GGLH > > > ou > > > 2235 > > > ou > > > 22LH > > > (tem que começar por letra obrigatoriamente e sempre apos duas > letras > > vem > > > um numero, depois pode vir duas letras e assim vai) > > > > > > De fato, o que preciso é que, independente do comprimento (que eu > sempre > > > vou garantir ser maior que 4), a string comece por duas letras > seguidas > > por > > > dois numeros, eventualmente seguidos por mais duas letras que, > > > eventualmente, podem estar seguidas de dois números e assim por > diante. > > > > > > A expressão do Thiago acertou na lata. Mas, existe algum motivo > especial > > > para não funcionar no grep? Tipo: > > > > > > [rdlxsr02][wjb069_teDebug][/home/sw/wjb069] > > > > echo GG48LH|sed -r 's/([A-Z]{2}[0-9]{2})+[A-Z]{2}?/|&|/' > > > |GG48LH| > > > > > > [rdlxsr02][wjb069_teDebug][/home/sw/wjb069] > > > > echo GG48|sed -r 's/([A-Z]{2}[0-9]{2})+[A-Z]{2}?/|&|/' > > > |GG48| > > > > > > [rdlxsr02][wjb069_teDebug][/home/sw/wjb069] > > > > echo GG48LH33|sed -r 's/([A-Z]{2}[0-9]{2})+[A-Z]{2}?/|&|/' > > > |GG48LH33| > > > > > > [rdlxsr02][wjb069_teDebug][/home/sw/wjb069] > > > > echo GG48LH33|grep '([A-Z]{2}[0-9]{2})+[A-Z]{2}?' > > > > > > [rdlxsr02][wjb069_teDebug][/home/sw/wjb069] > > > > echo GG48LH33|grep "([A-Z]{2}[0-9]{2})+[A-Z]{2}?" > > > > > > > > > O grep não imprime o match. Comi bronha? > > > > > > > > > Obrigado pelas dicas de todos > > > Abraço > > > Benito > > > > > > > > > > > > > > > > On 12/5/07, voyeg3r < [EMAIL PROTECTED] <voyeg3r% > 40yahoo.com.br>> > > wrote: > > > > > > > > --- Em shell-script@yahoogrupos.com.br<shell-script% > 40yahoogrupos.com.br> > > <shell-script%40yahoogrupos.com.br>, > > > > "Josenivaldo Benito Junior" > > > > <[EMAIL PROTECTED]> escreveu > > > > > > > > > > Olá turma, > > > > > > > > > > Estou apanhando de uma expressão regular. Para ser sincero já > não > > > > sei dizer > > > > > se ela é possível (deve ser o sono). > > > > > > > > > > Preciso pegar strings do tipo: > > > > > > > > > > GG48LH > > > > > JH23 > > > > > JH45ER > > > > > FJ87SA76 > > > > > > > > > > Resumindo: > > > > > > > > > > Sempre tem duas letras (de A até Z) seguidas de dois números > (de 0 > > > > até 9), > > > > > podendo estar seguidos mais duas letras, podendo estar seguido > de > > > > mais dois > > > > > números. (duas letras,dois nros., duas letras, dois nros). Mas > a > > > > informação > > > > > pode ter 2,4,6 ou 8 letras (1,2,3 ou 4 conjuntos de letras e > > números). > > > > > > > > > > O que são essas coisas? Coordenadas em formato World Locator. > De > > > > fato podem > > > > > ir até 12 algarismos, o comum é 4 ou 6. Na aplicação que estou > > > > tentando > > > > > capturar podem chegar a 8. > > > > > > > > > > Tentei algumas coisas básicas. O mais próximo que cheguei foi: > > > > > > > > > > [A-Z]{2}[0-9]{2} > > > > > > > > ============================ > > > > se o conjunto de números pode ir até 6 faça: > > > > > > > > [A-Z]{2}[0-9]{2,6} > > > > > > > > > > > > > > Que pega um par de letras somente se for seguido de um par de > > > > números. Para > > > > > uma string tipo GG48LH23JV vai funcionar em dois matches, tem > algum > > > > problema > > > > > nisso? > > > > > > > > > > Pegar um par de letras+um par de números e assim por diante, > não > > > > resolve > > > > > toda a situação, pois em 90% dos casos são usados 6 algarismos > (ex: > > > > GG67MH). > > > > > > > > > > Alguém pode me dar uma dica? > > > > > > > > > > Valeu. > > > > > Benito > > > > > > > > > > > > > > > [As partes desta mensagem que não continham texto foram > removidas] > > > > > > > > > > > > > > > > > > > > > > > > > > > [As partes desta mensagem que não continham texto foram removidas] > > > > > > > > -- > Tiago B Peczenyj > Linux User #405772 > > http://peczenyj.blogspot.com/ > "what does not kill us makes us stronger" > > [As partes desta mensagem que não continham texto foram removidas] > > > > > >
[As partes desta mensagem que não continham texto foram removidas]