El principal problema con los buscadores es que consumen muchos
recursos, tanto de ancho de banda (debido a que constantemente están
indexando la web descargando información) como de almacenamiento, ya que
los índices crecen de forma proporcional a la cantidad de sitios que
revisa.
Existen implementaciones libres bastante buenas, algunas basadas en
Lucene como Nutch. Me gusta mucho YaCy, que esta construida bajo los
principios de las redes P2P, y funciona como un motor de búsqueda
distribuido, se montan nodos en distintos lugares, y asi con una
arquitectura descentralizada se comparten esfuerzos y recursos, si todo
el que tiene o quiere poner un buscador, montara un nodo de YaCy, pues
tendriamos un motor de búsqueda nacional bien potente.
Otros relativamente nuevos, de los que he escuchado hablar bien, pero no
he podido probar, son Indri (el motor del proyecto Lemur), Gigablast
(que fue liberado en 2013), Searchdaimon (nacido en 2006 y pensado para
el entorno empresarial, pero también se ha usado para indexar la
internet) y Seeks, que tiene un método bastante interesante de ordenar
los resultados, basándose en la opinión de los usuarios.
Saludos.
El 04/03/15 a las 11:40, Alberto José García Fumero escribió:
No existiendo un buscador público cubano (para no ser "Lazaresco" y no
añadir la coletilla "y además que sirva"), lo cual es una carencia
nacional de proporciones mayúsculas, y obliga a guardar largas listas de
direcciones con cosas que puedan hacer falta, me gustaría tener una idea
al menos elemental de cómo se planifican esos buscadores. No encuentro
nada relacionado en el repo de Debian, excepto whatweb (adivinen, en
Ruby!). ¿Dónde pudiera encontrar algo de información sobre el tema?
Recuerdo que para poner en un sitio, existía (¿aún existe?) PHPdig. En
su momento lo tuve instalado, y le agregaba a mano las ligas de cosas de
fuera de mi sitio... ;-)
Los buscadores que den resultados fuera de su propio sitio, y a los
cuales puedo acceder en estos momentos (por otra parte, no sé cuán
actualizados estén tampoco) son el de Infomed y el de
www.tabacom.co.cu/buscador (que busca en Google y devuelve lo que
corresponde a .cu). Orión está por lo visto fuera del aire para quienes
no pertenecen al MES, el 2x3 desapareció en un idem (tengo entendido que
al no estar más allí su programador, nadie más supo/pudo/aceptó
continuar su desarrollo). ¿Alguno más?
______________________________________________________________________
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l
--
Este mensaje le ha llegado mediante el servicio de correo electronico que
ofrece Infomed para respaldar el cumplimiento de las misiones del Sistema
Nacional de Salud. La persona que envia este correo asume el compromiso de usar
el servicio a tales fines y cumplir con las regulaciones establecidas
Infomed: http://www.sld.cu/
--
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que está limpio.
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL:
<http://listas.jovenclub.cu/pipermail/gutl-l/attachments/20150304/a978ae8a/attachment.html>
______________________________________________________________________
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l