Mecanismo de busca identifica contexto, opinião e ajuda a prever o futuro

Redação do Site Inovação Tecnológica - 04/09/2012

*Informações contextualizadas*

Inspirados pelas ideias propostas por um bibliotecário indiano há quase um
século, uma equipe europeia desenvolveu um novo sistema de buscas para a
internet que leva em conta fatores como opinião, contexto, tempo e
localização.

A nova tecnologia, que promete chegar ao mercado rapidamente, consegue
mostrar tendências na opinião pública sobre um determinado assunto,
companhia ou pessoa, e como essa tendência muda com o tempo.

A equipe do projeto *LivingKnowledge* (conhecimento vivo, em tradução
livre) acredita que seus algoritmos permitirão até mesmo fazer previsões
sobre o futuro.

"Faça uma busca pela palavra 'clima' no Google, ou em outro motor de busca
qualquer, e o que você receberá de volta será basicamente uma lista de
resultados que caracterizam a palavra: não há categorização, nenhuma ordem
específica, nenhum contexto.

"Os motores de busca atuais não levam em conta as dimensões da diversidade:
fatores como quando a informação foi publicada, se há uma tendência de
favorecer uma ou outra opinião, quem publicou e quando," explica Fausto
Giunchiglia, professor de ciência da computação na Universidade de Trento,
na Itália.

*Google da diversidade*

Mas será que a tecnologia de buscas na internet poderá ser capaz de abarcar
a diversidade? Poderá um mecanismo de buscas dizer-lhe, por exemplo, como a
opinião pública sobre as mudanças climáticas mudaram na última década? Ou
como a temperatura poderá estar daqui a um século, agregando estimativas
atuais e do passado a partir de fontes diferentes?

Giunchiglia garante que não apenas é possível, como isso já pode ser feito
a partir dos resultados do projeto.

Os pesquisadores foram buscar inspiração no sistema de classificação de
livros criado por Sirkali Ramamrita Ranganathan nos anos 1930, que permite
atribuir múltiplas características a um livro, revista ou artigo.

Em vez de uma posição taxonômica fixa, o sistema permite, por exemplo, que
um texto sobre os efeitos das mudanças climáticas na agricultura escrito no
Brasil em 2010 seja classificado como "Geografia; Clima; Mudança Climática;
Agricultura; Pesquisa; Brasil; 2010".

O que os cientistas fizeram foi transformar o pseudo-algoritmo de
Ranganathan em um algoritmo codificado em um programa para minerar dados na
internet.

Isso permite extrair de cada texto um significado e um contexto,
associando-lhe as chamadas "facetas" da classificação bibliográfica. "E
usar essas facetas para estruturar a informação com base nas dimensões da
diversidade," completa o professor Giunchiglia.

*Conhecimento aberto*

O programa básico será disponibilizado como software de código aberto, e
vários parceiros do projeto *LivingKnowledge* afirmaram que pretendem
implementar a tecnologia em produtos comerciais.

O professor Giunchiglia, por sua vez, anunciou que pretende criar uma
fundação sem fins lucrativos para implementar os resultados do projeto, um
de cada vez, conforme surjam demandas para isso.
Nilton Bahlis dos Santos
Coordenador do Núcleo de Experimentação de Tecnologia Interativa (Next)
http://www.next.icict.fiocruz.br/wiki
Coordenador do NIT do Icict Fiocruz e Professor Permanente do PPGICS
_______________________________________________
Arquivos da Bib_virtual: http://listas.ibict.br/pipermail/bib_virtual/
Instruções para desiscrever-se por conta própria:
http://listas.ibict.br/cgi-bin/mailman/options/bib_virtual
Bib_virtual mailing list
Bib_virtual@ibict.br
http://listas.ibict.br/cgi-bin/mailman/listinfo/bib_virtual

Responder a