Skip to content

services/service-search.es

Topic

From the PointSav Documentation

service-search responde consultas de texto completo en millones de documentos de la plataforma en microsegundos, utilizando un índice invertido binario estático construido en Rust sobre la biblioteca Tantivy [^1] — y dado que el índice es un archivo en lugar de un proceso de base de datos activo, puede copiarse a medios portátiles y consultarse en cualquier máquina sin dependencias adicionales. El servicio es un componente del Anillo 2 — conocimiento y procesamiento — y cumple con el estándar Data Archive and Retrieval Protocol (DARP). Localiza documentos; no los genera ni los clasifica.

[edit]Línea de base arquitectónica

Un índice invertido funciona construyendo un mapa comprimido de cada palabra del corpus a la lista de documentos que la contienen — análogo al índice al final de un libro de referencia. En el momento de la consulta, el servicio busca los términos de consulta en este mapa y devuelve los documentos coincidentes en microsegundos, independientemente del tamaño del corpus.

[edit]Anillo y función

service-search ocupa el Anillo 2 — Conocimiento y Procesamiento en la arquitectura de tres anillos. El Anillo 2 es multiinquilino a través del espacio de nombres moduleId y opera deterministamente sin inferencia de IA. La función de service-search dentro del Anillo 2 es la recuperación: responde consultas contra el corpus indexado y devuelve referencias de documentos clasificadas que los servicios del Anillo 2 o Anillo 3 utilizan para el procesamiento descendente.

[edit]Propiedades arquitectónicas clave

  • Sin proceso activo requerido para consultas. El índice está mapeado en memoria en el momento de la consulta; no hay ningún demonio de base de datos que gestionar.
  • Portátil. El archivo de índice puede copiarse a almacenamiento USB o una máquina diferente y consultarse inmediatamente.
  • Comprimido. El formato de índice de Tantivy usa codificación block-maximal para datos de frecuencia de términos.
  • Actualizable. Los nuevos documentos se añaden al índice a través de un proceso de indexación en segundo plano que fusiona nuevos segmentos.

[edit]Véase también

  • service-extraction — servicio del Anillo 2 cuya salida analizada se alimenta al índice
  • service-slm — capa de inteligencia del Anillo 3 que consume los resultados de recuperación
  • service-people — libro mayor de identidades cuyos registros forman parte del corpus consultable
  • trajectory-substrate — el modelo de sustrato para la inteligencia de recuperación compuesta
Edit this page · View source