Empresas de Servicios · Colombia

Playbook de Fundamentos de Datos

"Think of AI as the top of a pyramid of needs.
First you need data literacy, collection, and infrastructure."
— Monica Rogati

NIT · Razón Social · T&C · Facturación Electrónica

En fase 0, el objetivo no es construir infraestructura de datos perfecta. Es capturar los datos correctos para poder facturar, reportar, y crecer.

El contexto colombiano

Una empresa de servicios en Colombia tiene obligaciones específicas: facturación electrónica ante la DIAN, retenciones en la fuente, información exógena. Si no capturas bien los datos desde el inicio, el dolor viene después.

Lo que SÍ necesitas en fase 0

Lo que NO necesitas (todavía)

Principio

Captura hoy lo que necesitas para facturar y reportar mañana. Todo lo demás puede esperar.

Monica Rogati: antes de hacer analytics sofisticados, resuelve las necesidades básicas. En Colombia, eso incluye cumplimiento tributario.

AI / Predicción
Analytics / Reportes
Integración / Limpieza
Facturación / DIAN
Captura / Identificación

Fase 0 = Nivel 1 y 2. Sin esto, nada funciona.

Nivel 1: Captura / Identificación

Nivel 2: Facturación / DIAN

"If your foundation is weak (dirty, incomplete data), the solution will not be optimized."
En Colombia: datos incompletos = facturas rechazadas por la DIAN.

Pregunta clave

¿Puedes generar una factura electrónica válida para tu último cliente en menos de 5 minutos?

El cliente es la entidad más importante. En Colombia, necesitas datos específicos para facturar, retener, y reportar ante la DIAN.

dim_cliente
Identificación (obligatorio para facturar)
cliente_id — ID interno único
tipo_documentoNIT, CC, CE, Pasaporte
numero_documentoSin puntos ni guiones
digito_verificacionPara NIT (calculado)
razon_socialNombre legal exacto como en RUT
nombre_comercialOpcional

Ubicación (obligatorio para factura electrónica)
direccionDirección fiscal
ciudadCódigo DANE o nombre
departamentoCódigo DANE o nombre

Tributario (para retenciones)
regimen_tributarioResponsable IVA, No responsable
gran_contribuyenteSí/No
autorretenedorSí/No

Contacto
email_facturacionPara envío de factura electrónica
telefono, contacto_nombre, contacto_cargo

Regla

No cierres una venta sin tener: NIT validado + razón social exacta + régimen tributario + email.

Son dos cosas diferentes. Los T&C son las reglas generales que aplican a todos. El contrato es el acuerdo específico de un proyecto con alcance, precio y fechas.

Términos y Condiciones (T&C)

Documento general que el cliente acepta una vez (o cuando cambia la versión). Define reglas como: propiedad intelectual, confidencialidad, limitación de responsabilidad, jurisdicción.

fact_aceptacion_tyc
aceptacion_id — ID único
cliente_idQuién acepta
version_tycVersión del documento ("v2.1", "2024-01")
fecha_aceptacionTimestamp exacto
metodo_aceptacionFirma, email, clic
ip_address, user_agent — Si es digital
documento_url — Link al documento aceptado
aceptante_nombre, aceptante_cargo, aceptante_cedula

Contrato (propuesta aceptada)

Acuerdo específico por proyecto/servicio. Define: alcance, entregables, precio, fechas, condiciones particulares. Referencia los T&C vigentes.

fact_contrato
contrato_id — ID único
cliente_idCon quién
propuesta_id — Propuesta que se convirtió en contrato
version_tyc_idT&C vigentes al momento de firmar
fecha_firmaCuándo se firmó
alcance — Descripción de lo que incluye
valor_total, forma_pago — Precio y condiciones
fecha_inicio, fecha_fin — Vigencia
documento_firmado_url — Contrato con firmas
firmante_nombre, firmante_cargo, firmante_cedula

Regla

No prestes servicio sin: (1) T&C aceptados, (2) Contrato firmado que los referencia.

En servicios B2B, el ciclo va de lead a pago cobrado. Cada paso debe capturarse para tener trazabilidad completa.

Eventos del ciclo (facts)

Evento Qué capturar Para qué sirve
Lead Fecha, fuente, empresa, contacto De dónde viene la demanda
Aceptación T&C Fecha, cliente_id, versión, método Reglas generales aceptadas
Propuesta Fecha, cliente_id, servicios, valor, estado Pipeline, tasa de cierre
Contrato Fecha firma, alcance, valor, T&C referenciados Acuerdo específico firmado
Servicio prestado Fecha inicio, fecha fin, entregables Base para facturar
Factura emitida Número, fecha, CUFE, valor, IVA, retenciones Cumplimiento DIAN
Pago recibido Fecha, monto, método, factura_id Flujo de caja, cartera

La cadena de IDs

Cada evento debe poder rastrearse hacia atrás y hacia adelante:

Kimball: "Cada dato debe clasificarse como dimensión (quién, qué, cuándo, dónde) o hecho (cuánto, cuántos)." En servicios: el servicio prestado es el hecho central.

Ejercicio

Toma tu última factura. ¿Puedes rastrear la propuesta original, la aceptación de T&C y el servicio prestado?

Toda factura debe reportarse a la DIAN. Tu sistema de datos debe alimentar correctamente al software de facturación para evitar rechazos.

Datos requeridos para factura electrónica

Campo Fuente Validación
NIT emisor Configuración DV correcto
NIT receptor dim_cliente DV correcto, activo en RUES
Razón social dim_cliente Exacta según RUT
Dirección fiscal dim_cliente Ciudad con código DANE
Descripción servicio dim_servicio Clara y específica
Valor + IVA fact_servicio 19%, 5%, 0%, o excluido
Retenciones Según régimen cliente ReteFuente, ReteIVA, ReteICA
fact_factura
factura_id — ID interno
numero_facturaConsecutivo autorizado por DIAN
prefijo — Si aplica
cufeCódigo Único de Factura Electrónica
fecha_emision, fecha_vencimiento
cliente_id, contrato_id, servicio_id
subtotal, iva, retencion_fuente, retencion_ica, total
estado — Emitida, Pagada, Anulada
pdf_url, xml_url

Ralph Kimball: separa hechos (eventos) de dimensiones (contexto). En servicios colombianos, el modelo mínimo tiene 4 dimensiones y 4 facts.

Star schema para servicios B2B Colombia

dim_cliente dim_servicio dim_vendedor dim_fecha
↓ ↓ ↓ ↓
fact_aceptacion_tyc fact_propuesta fact_contrato fact_servicio fact_factura

Implementación en spreadsheet

"The star schema enables efficient querying and intuitive data filtering."
— Kimball. Funciona igual en un spreadsheet bien estructurado.

Tarea

Crea las hojas con las columnas definidas. Conecta con XLOOKUP/VLOOKUP usando los IDs.

El mayor problema de datos no es la tecnología. Es inconsistencia. Define convenciones ahora que funcionen cuando tengas 10x más datos.

Naming conventions para Colombia

Concepto Nombre Formato
NIT nit Solo números, sin puntos ni guiones
Dígito verificación nit_dv Un dígito (0-9)
Razón social razon_social Mayúsculas, exacto como en RUT
Ciudad ciudad_dane Código DANE (5 dígitos)
Valor en pesos valor_cop Entero sin decimales
Porcentaje IVA iva_porcentaje Decimal: 0.19 (no 19)
Fecha fecha_emision YYYY-MM-DD
Booleano es_gran_contribuyente TRUE/FALSE o 1/0
Versión T&C version_tyc "v2.1" o "2024-03"

Reglas de consistencia

Entregable

Documento de 1 página con tus convenciones. Compártelo con quien toque los datos.

Los errores de datos en Colombia tienen consecuencias reales: facturas rechazadas, sanciones de la DIAN, pérdida de derechos legales.

Errores de identificación

Errores de T&C y Contratos

Errores de facturación

Pregunta de sanidad

¿Puedo reconstruir cualquier factura y demostrar: qué servicio presté, bajo qué contrato, con qué T&C?

Captura los datos correctos hoy:
NIT validado, razón social exacta,
T&C aceptados, contrato firmado,
factura con CUFE.

Lo que no capturas bien hoy,
te costará mañana.

T&C = reglas generales. Contrato = acuerdo específico.
Primero cumplimiento, después analytics.
La DIAN no espera.

Lista de verificación para implementar los fundamentos de datos en una empresa de servicios en Colombia.

Cliente y tributario

Términos y Condiciones

Contratos

Ciclo comercial

Facturación

Validación

Compromiso

Completa este checklist antes de buscar herramientas más sofisticadas.