---
schema: foundry-doc-v1
title: "Esquema de datos POI"
slug: poi-data-schema.es
short_description: "El esquema de datos POI define estructuras de registro para datos de ubicación ingeridos de OpenStreetMap y Overture Maps Foundation, normalizados en un formato JSONL unificado antes del análisis de cluster. Los QIDs de Wikidata sirven como identificador de cadena principal y los modelos de sublocalización padre-hijo manejan servicios complementarios de marca compartida."
category: architecture
type: topic
content_type: topic
quality: complete
status: active
language: es
bcsc_class: public-disclosure-safe
last_edited: 2026-05-25
editor: pointsav-engineering
cites:
 - ni-51-102
 - osm-odbl
 - overture-maps-cdla-2-0
paired_with: poi-data-schema.md
---

## Resumen estratégico

El esquema de datos POI define la estructura de registro utilizada por la [[location-intelligence-platform|plataforma de inteligencia de co-ubicación]] para sus dos clases de datos de ubicación: ubicaciones de cadenas minoristas ingestadas desde OpenStreetMap, y ubicaciones de anclas institucionales ingestadas desde la Fundación Overture Maps. Ambas clases se normalizan en un esquema JSONL de archivo plano unificado antes del [[co-location-methodology|análisis de agrupaciones]]. No se requiere ninguna compra de datos propietarios: todos los registros se derivan de fuentes con licencias públicas y son versionables en el mismo registro que el resto de la plataforma.

## Dos clases de registros

**[[service-business-clustering|Registros service-business]]** — ubicaciones individuales de cadenas minoristas: ferreterías de gran formato, clubes de almacén, hipermercados y anclas alimentarias. Cada registro se identifica por un `chain_id` vinculado al archivo de configuración de la cadena, y por un campo `brand_wikidata` con el QID de Wikidata de la marca. Los QID de Wikidata son persistentes e independientes del idioma: dos tiendas con distinta ortografía del nombre pero con el mismo QID pertenecen a la misma cadena.

**[[service-places-filtering|Registros service-places]]** — anclas institucionales: hospitales, universidades y aeropuertos, ingestados desde Overture Maps usando el campo `taxonomy.primary`. Este campo reemplazó al `categories.primary` deprecado en la versión 2025-11 de Overture. Los identificadores de categoría no cambiaron: las consultas que antes leían `categories.primary = 'hospital'` pasan a `taxonomy.primary = 'hospital'` sin modificar los valores de filtro.

## Campos principales

Ambas clases comparten los campos: `location_name`, `brand_wikidata`, `street_address`, `city`, `region`, `iso_country_code`, `latitude`, `longitude`, `naics_code`, `top_category`, `sub_category`, `source` (osm / overture), y `confidence`.

## Deduplicación espacial

El pipeline ejecuta una primera pasada de deduplicación dentro de 100 metros para registros de la misma cadena, conservando el registro con los campos de dirección más completos. Una segunda pasada a 25 metros entre distintos `chain_id` que comparten el mismo QID de Wikidata identifica formatos secundarios co-ubicados con el minorista principal (por ejemplo, gasolineras bajo la misma marca), candidatos para el modelo padre-hijo.

## Modelo padre-hijo y estándar Placekey

El modelo previsto (pendiente de aprobación del operador) consolida los servicios auxiliares en una lista `sub_entities` dentro del registro padre, siguiendo el patrón estándar de POI padre-hijo del sector: el registro padre contiene la dirección y coordenadas canónicas, y cada sub-entidad hereda ese ancla mientras mantiene su propia clasificación de servicio.

El estándar Placekey — identificador global de ubicación con estructura `Qué@Dónde` — expresa esta relación mediante un sufijo `Dónde` compartido: dos POI en la misma dirección comparten el sufijo geocelda, mientras que su prefijo de marca difiere. La integración de Placekey está prevista como mecanismo principal para detectar co-ubicaciones en futuras versiones del pipeline [ni-51-102].

## Completitud de direcciones y cadencia de actualización

La cobertura de `addr:housenumber` y `addr:street` en OSM es sólida en Europa Occidental y Canadá, moderada en EE.UU., y escasa en algunos mercados nórdicos y del sur de Europa. Una mejora prevista realizará una unión espacial (radio ≤15 m) contra el tema Addresses de Overture para rellenar direcciones incompletas [ni-51-102].

Los registros service-business se reingesan por cadena bajo demanda; los registros service-places se reingesan con cada nueva versión trimestral de Overture.

## Véase también

- [[location-intelligence-platform]] — plataforma de inteligencia de ubicación y niveles de puntuación V2
- [[location-intelligence-substrate]] — arquitectura de datos GIS de archivo plano
- [[app-orchestration-gis]] — servicio de aplicación GIS que ejecuta el pipeline de ingestión
