Nutch
Nutch es un robot y motor de búsqueda basado en Lucene. Es parte del proyecto Lucene que a su vez es gestionado por la Apache Software Foundation. Nutch es software libre.
Nutch | ||
---|---|---|
Información general | ||
Tipo de programa | biblioteca de Java | |
Desarrollador | Apache Software Foundation | |
Licencia | Apache 2.0 License | |
Información técnica | ||
Programado en | Java | |
Plataformas admitidas | máquina virtual Java | |
Versiones | ||
Última versión estable | 1.1922 de agosto de 2022 | |
Archivos legibles | ||
Web ARChive | ||
Archivos editables | ||
Web ARChive | ||
Enlaces | ||
Nutch ofrece una solución transparente, pues al ser una tecnología de código abierto es posible conocer como organiza el ranking de resultados de las búsquedas. Está desarrollada en Java, y basa su arquitectura en la plataforma Hadoop de desarrollo de sistemas distribuidos.
Algunas de las características del buscador son:
- No distingue entre mayúsculas y minúsculas
- Usando comillas (") al principio y al final de un grupo de palabras o frase realiza la búsqueda de ese texto exacto
- Añadiendo el signo más (+) delante de una palabra fuerza la búsqueda de palabras no habituales
- Añadiendo el signo menos (-) delante de una palabra realiza la búsqueda excluyendo esa palabra
En los resultados se puede encontrar diversa información:
- en caché, muestra la versión de la página visitada por Nutch.
- explicar, muestra una explicación de cómo Nutch otorgó la puntuación a esa página.
- anchors, muestra una lista con el texto que aparece en enlaces que apuntan a esa página.
Enlaces externos
- http://apache.nutch.org es el sitio oficial del proyecto
Este artículo ha sido escrito por Wikipedia. El texto está disponible bajo la licencia Creative Commons - Atribución - CompartirIgual. Pueden aplicarse cláusulas adicionales a los archivos multimedia.