El álgebra de composición de adaptadores

El Álgebra de Composición de Adaptadores es el modelo que rige cómo se ensambla la inteligencia de IA en tiempo de solicitud en un despliegue de PointSav. Su metáfora central se asigna con precisión a un sistema operativo: el Doorman (service-slm) es el kernel; los adaptadores LoRA son procesos; service-content es el sistema de archivos; el modelo base es el firmware. La analogía no es ilustrativa — es operativa.

[edit]El álgebra

En tiempo de solicitud, el Doorman compone adaptadores apilándolos sobre el modelo base:

pesos_compuestos =
 modelo_base[OLMo-3-1125-7B-Q4]
 ⊕ adaptador_constitucional[doctrina_vM.m.p]
 ⊕ adaptador_ingeniería[pointsav_vN]?
 ⊕ adaptador_inquilino[<inquilino>_vK]?
 ⊕ adaptador_rol[master | root | task]
 ⊕ adaptador_clúster[<nombre-clúster>_vJ]?

Donde ? denota un adaptador opcional cargado solo cuando aplica el contexto de la solicitud. La composición es determinista dado el contexto de la solicitud; no hay una decisión en tiempo de ejecución sobre qué adaptadores usar.

[edit]Tipología de adaptadores

El adaptador constitucional es universal y lo carga cada despliegue de la plataforma. El adaptador de inquilino es estrictamente por inquilino, se produce y se mantiene dentro del Totebox del Cliente, y nunca sale del almacenamiento del cliente. El adaptador de ingeniería se publica con el conocimiento común (Apache 2.0) y no es propiedad intelectual privada del proveedor.

[edit]La metáfora del SO de la IA

Concepto del SO	Concepto de IA	Artefacto de la plataforma
Firmware	Modelo base preentrenado	OLMo 3 7B / 32B GGUF
Kernel	Enrutador de solicitudes	Doorman (`service-slm`)
Proceso	Unidad de comportamiento componible	Adaptador LoRA
Sistema de archivos	Conocimiento estructurado	`service-content` (grafo LadybugDB)
Llamada al sistema	Invocación de herramienta	Interfaz del servidor MCP
Memoria virtual	Aislamiento por inquilino	Particiones codificadas por `moduleId`
Módulo del kernel	Capacidad con alcance de clúster	Adaptador de clúster
Perfil de usuario	Límite de rol	Adaptador de rol

Esto enmarca el sustrato para pequeñas y medianas empresas como el sistema operativo de la IA — inteligencia componible con una arquitectura plana en lugar de un único producto cerrado. Los adaptadores entrenados en el corpus del cliente son propiedad del cliente. La doctrina es el alma; el corpus es la mente; los adaptadores son la personalidad.

[edit]Techo de composición práctico

La investigación de producción de multi-LoRA demuestra que componer 2–3 adaptadores por solicitud funciona limpiamente. Componer 5 o más adaptadores cruza hacia la interferencia de múltiples tareas. El álgebra se mantiene en un máximo de tres adaptadores en tiempo de ejecución por solicitud por diseño. Los parámetros de registro, voz de marca y tipo de documento viven en el andamiaje de instrucciones (la capa de plantilla de género), no como adaptadores adicionales.

[edit]Véase también

compounding-doorman — el Doorman que implementa el rol de kernel en este álgebra
apprenticeship-substrate — el mecanismo que produce el corpus de adaptadores por inquilino
language-protocol-substrate — la taxonomía de adaptadores de familia de lenguaje que extiende este álgebra para el trabajo editorial

[edit]Referencias

LoRAX — servidor de inferencia multi-LoRA de Predibase, código abierto.
S-LoRA — servicio escalable de miles de adaptadores LoRA concurrentes, MLSys 2024.