Reconstrucción nocturna del grafo de datos
TopicFrom the PointSav Documentation
El proceso programado que reconstruye el grafo de conocimiento de la plataforma a partir de fuentes canónicas de archivos planos cada noche, produciendo un substrato consultable desde entradas deterministas sin intervención de inteligencia artificial.
La reconstrucción nocturna del grafo de datos es el proceso programado que reconstruye el grafo de conocimiento completo de la plataforma a partir de sus fuentes canónicas de archivos planos. Todas las relaciones consultables en el grafo — enlaces de entidades, resultados de extracción, entradas del libro de registros e índices de inteligencia de ubicación — se derivan de las mismas entradas deterministas en cada ciclo. El resultado es una instantánea estable disponible para todos los consumidores de consultas al inicio de cada día operativo.
[edit]Puntos clave
- El grafo se reconstruye a partir de fuentes de archivos planos cada noche, sin mantenimiento por mutación continua. Los consumidores leen una instantánea estable, no un grafo parcialmente construido en tiempo real.
- Cada ciclo de reconstrucción puede replicarse a partir de archivos planos archivados. Las mismas entradas producen el mismo grafo — sin inferencia de IA, sin clasificación probabilística.
- El patrón de reconstrucción aplica el cumplimiento de SYS-ADR-07: los datos de entidades estructurados son el producto de reglas deterministas, no de salidas de modelos de IA.
- Cada ciclo acumula el anterior. Los registros recién comprometidos extienden el grafo; ningún registro se elimina. El mecanismo compounding-substrate hace que el grafo crezca con precisión de forma monotónica con el tiempo.
[edit]Propósito
El patrón de reconstrucción garantiza que el substrato consultable refleje el estado comprometido del registro canónico, no la deriva acumulada en memoria. Cualquier ejecución individual puede replicarse a partir de los archivos planos archivados.
El proceso se ejecuta sin inferencia de inteligencia artificial. Las relaciones se calculan mediante reglas de extracción deterministas y uniones basadas en esquemas, no mediante clasificación probabilística. Este es el límite de cumplimiento de SYS-ADR-07: los datos del grafo estructurado son un producto computado de reglas deterministas aplicadas a registros verificados.
[edit]Etapas del proceso
El proceso de reconstrucción sigue una secuencia fija:
- Instantánea del libro de registros — lee el estado comprometido actual de todos los segmentos del libro de registros WORM. El libro es de solo adición; la instantánea es el historial completo hasta el momento de inicio programado.
- Paso de extracción — service-extraction ejecuta sus reglas de reconocimiento de entidades deterministas contra la instantánea, produciendo registros de entidades para personas, organizaciones, activos y eventos.
- Uniones por esquema — los registros de entidades se unen con la taxonomía canónica y los índices de inteligencia de ubicación mediante relaciones de clave foránea explícitas. No hay coincidencia difusa en esta etapa.
- Construcción del grafo — los registros unidos se ensamblan en el substrato de grafo consultable consumido por service-content y la capa de inferencia Doorman.
- Intercambio — el grafo completado reemplaza la instantánea anterior de forma atómica. Los consumidores de consultas pasan a la nueva versión en la siguiente solicitud tras el intercambio.
[edit]Posición en la pila de substratos
La reconstrucción nocturna se sitúa entre el libro de registros WORM (que acumula escrituras de solo adición durante el día) y el nivel de consulta (que lee el grafo completado más recientemente). Los consumidores del grafo de conocimiento siempre leen una instantánea estable, no un grafo parcialmente construido.
El mecanismo compounding-substrate hace que cada ciclo de reconstrucción herede el grafo anterior completo y añada encima los registros recién comprometidos. La precisión se acumula con el tiempo: una entidad que apareció en tres registros del libro de registros hace dos años y en doce el mes pasado tiene un nodo de grafo más rico que una entidad recién registrada — sin ningún paso de curación manual.
[edit]Véase también
- compounding-substrate — el mecanismo por el cual cada ciclo de reconstrucción acumula el conocimiento anterior
- worm-ledger-design — el libro de registros de solo adición que alimenta el proceso de reconstrucción
- service-extraction — el servicio de extracción que produce los registros de entidades consumidos por la reconstrucción
- service-content — el servicio de consultas que lee el grafo completado
- doorman-protocol — el cliente de la capa de inferencia que consulta el grafo para obtener contexto de entidades