Soluciones/IA y Automatización Inteligente

IA en producción
no en una diapositiva.

Construimos automatización de clase juicio para el trabajo que realmente mueve el negocio. Sin teatro de demostración. Sin autonomía donde no pertenece. Siempre detrás de un umbral de confianza que un humano aprobó.

Primer modelo en vivo
4–6 semanas
detrás del umbral
Humano en el circuito
Siempre
donde importa
Bloqueo de proveedor
0
modelo portátil
clasificador · soporte_intake
BOLETO DE LECTURA #48,221
Entrante · cuerpo de correo
Hola equipo, traté de renovar mi suscripción anoche pero el pago fue rechazado — la tarjeta está bien en otros lugares. Intenté con una segunda tarjeta, mismo resultado. Frustrado — necesito que esto se resuelva hoy.
→ clasificación
87 ms
Categoría
Facturación · Pago Fallido
Facturación · Pago Fallido94 %
Cuenta · Problema con la tarjeta5 %
Otro1 %
SENTIMIENTOfrustrado
URGENCIAalto · "hoy"
UMBRAL≥ 90 % automático
→ enrutar · factura-nivel-2 · respuesta redactada en espera
↳ Clasificador en vivo de un despliegue del cliente. Los tickets por debajo del umbral caen en una cola humana, no en el vacío.
§ 01 / Tesis

Deja de medir
modelos.
Comienza a medir
decisiones.

La mayoría de los proyectos de IA fallan no porque el modelo fuera incorrecto, sino porque se conectó a la decisión equivocada. La prueba correcta no es la precisión — es si el costo de estar equivocado es aceptable en comparación con el tiempo para estar en lo correcto.

Algunas decisiones toleran un 5% de tasa de error a 200ms. Otras decisiones no toleran ninguna tasa de error en absoluto. El trabajo no es elegir el modelo, es mapear la decisión antes de que el modelo se ejecute.

Lo que construiremos
  • Clasificadores con umbrales de confianza
  • RAG sobre tus propios datos estructurados + no estructurados
  • Extracción de documentos desordenados a gran escala
  • Redacción que un humano revisa antes de enviar
Lo que no haremos
  • Agentes autónomos actuando en decisiones irreversibles
  • Chatbots reemplazando humanos en trabajos regulados
  • "Características de IA" añadidas para el comunicado de prensa
  • Pipelines sin un arnés de evaluación fuera de línea
§ 02 / Marco de decisión

Dónde pertenece la IA —
y dónde no.

Plotea la decisión en dos ejes: costo de estar equivocado y volumen de decisiones por día. La diagonal te da la respuesta.

Q · 01 / Noalto costo · bajo volumen

Juicio humano puro

Decisiones de contratación, M&A, llamadas de exposición legal, diagnóstico médico sin supervisión especializada.

No pongas un modelo frente a una decisión que un alto ejecutivo toma diez veces al año.
Q · 02 / Asistiralto costo · alto volumen

Humano asistido por IA

Suscripción, revisión de fraudes, triage de reclamos, preselección médica, apelaciones de moderación de contenido.

El modelo redacta, puntúa, etiqueta. El humano firma. Siempre.
Q · 03 / Omitirbajo costo · bajo volumen

Probablemente no valga la pena

Tareas administrativas ocasionales, consultas internas puntuales, tareas realizadas menos de una vez a la semana.

El costo de construcción superará el tiempo ahorrado. Usa una lista de verificación.
Q · 04 / Automatizarbajo costo · alto volumen

El punto dulce

Clasificación de tickets, extracción de documentos, enriquecimiento de leads, generación de borradores, enrutamiento inteligente.

↪ Donde ocurre la mayor parte de nuestro trabajo de IA.
Bajo volumen →↑ Costo de estar equivocado→ Alto volumen
NoAsistir a un humanoOmitirAutomatizar detrás del umbral

↪ Lo primero que hacemos en cualquier compromiso de IA es trazar tus decisiones candidatas en esta cuadrícula. Aproximadamente uno de cada tres cae en Q4.

§ 03 / Patrones

Seis patrones de IA,
enviados a producción.

No es un menú de modelos. Las formas de sistema que realmente construimos, con la unión a un humano siempre en la especificación.
A · Clasificar

Enrutamiento y triage

Elementos entrantes — tickets, correos, leads, reclamos — ordenados en la cola correcta con confianza. Por debajo del umbral caen a un humano en segundos.

ENTRADA → texto no estructurado SALIDA → etiquetado · confianza · enrutado
B · Extraer

Extracción de documentos

Facturas, contratos, ID, KYC — organizados en campos estructurados, validados y empujados a tus sistemas. Extracciones fallidas en espera para revisión.

ENTRADA → PDF · escaneo · correo SALIDA → JSON · validado en cruce
C · Recuperar

Sistemas de respuestas fundamentadas

RAG sobre tu propio conocimiento — manuales, políticas, contratos, datos de productos. Citas obligatorias. Sin cita, sin respuesta.

ENTRADA → pregunta + corpus SALIDA → respuesta + fuentes citadas
D · Redactar

Generación de primera redacción

Respuestas, informes, resúmenes, respuestas a RFP — redactadas en tu voz, en la cola de un humano para un clic de aprobación, una de edición.

ENTRADA → contexto + intención SALIDA → borrador editable (nunca enviado)
E · Prever

Puntuación predictiva

Deserción, demanda, incumplimiento, conversión de leads — probabilidades clasificadas que impulsan las operaciones. A menudo la respuesta correcta es el boosting de gradientes, no un transformador.

ENTRADA → histórico + características SALIDA → probabilidades clasificadas
F · Detectar

Detección de anomalías y deriva

El sistema nota cuando algo deja de parecerse a sí mismo — patrones de fraude, deriva operativa, degradación de calidad de datos — antes de que cualquier panel de control lo surface.

ENTRADA → telemetría continua SALIDA → marcado + explicado
§ 04 / Selección de modelos

El modelo correcto
raramente es el
más grande.

Somos agnósticos en cuanto a modelos por diseño. La arquitectura decide qué corre cada decisión; obtienes la cosa más barata, rápida y portable que cumpla con el umbral.
Clasificar (corto)
BERT ajustado · DistilBERT
~ 25 ms
€ 0.01
Etiquetas específicas, en tus datos, rápido y auto-alojado. Un LLM es excesivo.
Clasificar (nuanceado)
Claude Haiku · GPT-4o-mini
~ 800 ms
€ 0.30
Cuando las etiquetas necesitan leer entre líneas. Modelos de frontera pequeños, no grandes.
Extraer
Claude Sonnet · GPT-4o
~ 2 s
€ 1.50
Fuerte modo JSON + validación de esquema. Verificado contra reglas antes de la confirmación.
RAG · recuperar
pgvector · híbrido BM25
~ 80 ms
€ 0.00
Extensión de Postgres. La recuperación híbrida supera a la pura vector. No se necesita una base de datos vectorial independiente.
RAG · generar
Claude Sonnet · con citas
~ 1.5 s
€ 1.20
Cita por defecto. Si el modelo no puede citar, devuelve "desconocido" — nunca inventa.
Prever
XGBoost · LightGBM · Prophet
~ 5 ms
€ 0.00
Los datos tabulares con características fuertes superan a los LLM en predicción. Casi siempre.
Sensible · PII
Auto-alojado · Llama · Mistral
~ 1 s
infra
Soberanía de datos. Se ejecuta en tu VPC o nuestra región de UE. Nada sale del perímetro.

↪ La arquitectura es portable: cada modelo está detrás de un adaptador, intercambiable en un día. Tu lógica empresarial no se preocupa por cuál funcionó.

§ 05 / Guardrails

El andamiaje aburrido
que hace que la IA
sea de grado de producción.

Nada de esto es glamuroso. Todo es no negociable. Es la diferencia entre una demostración que maravilla y un sistema que no hará noticias por la razón equivocada.
G · 01no negociable

Umbrales de confianza

Cada salida del modelo lleva una puntuación de confianza. Por debajo del umbral, cae en una cola humana. Calibrado por decisión, no por modelo.

G · 02no negociable

Arnés de evaluación fuera de línea

Un conjunto de prueba congelado, puntuado en cada cambio. Ningún modelo va a producción sin superar al anterior en las métricas que tú aprobas.

G · 03no negociable

Modo en sombra

Los modelos funcionan silenciosamente contra tráfico real antes de actuar. Predicciones registradas, comparadas con humanos, revisadas semanalmente hasta ser confiables.

G · 04no negociable

Monitoreo de deriva

Los modelos decrecen silenciosamente cuando el mundo cambia. Monitoreamos la distribución de entradas y la calibración de salidas — las alertas se envían antes de que el rendimiento se vea afectado.

G · 05no negociable

Registro de auditoría

Cada predicción registrada con entrada, versión del modelo, confianza y el resultado eventual. Reproducible bajo demanda, defensible ante un regulador.

G · 06no negociable

Interruptor de apagado

Cualquier modelo puede desactivarse en segundos, regresando al flujo anterior a la IA. Probatado trimestralmente. Con la esperanza de que nunca se use. Siempre presente.

§ 06 / Preparación

Dos semanas para saber
si la IA es la respuesta.

Antes de que se construya cualquier modelo, realizamos una auditoría de preparación estructurada. Resultado: un informe escrito que nombra los candidatos correctos — y los incorrectos — por su nombre.

R · 01días 1–2

Inventario de las decisiones

Cada decisión recurrente en tu operación, trazada en el espectro. La lista honesta, no la lista de demostración.

R · 02días 3–5

Auditar los datos

Etiquetas de verdad, distribución, deriva, casos límite. La mayoría de los proyectos fallan aquí, antes de que se toque cualquier modelo.

R · 03días 6–8

Ejecutar una línea base

Un pequeño modelo de frontera, listo para usar, solicitado cuidadosamente — medido contra tus datos. Establece el piso antes de cualquier trabajo personalizado.

R · 04días 9–10

Puntuar y clasificar

Cada decisión candidata pesada en volumen, ahorros, riesgo y factibilidad. Te vas con un roadmap numerado.

R · 05transferencia

El informe escrito

Un documento de 14–20 páginas con candidatos nombrados, números de línea base y un plan de construcción. Tuyo para conservar, independientemente de lo que venga después.

TARIFA FIJA —Aproximadamente el 30% de las auditorías terminan con nosotros recomendando no usar IA para la carga de trabajo candidata. Estamos bien con eso.

§ 07 / Compromiso

Tres maneras
de empezar.

Nivel 01Tarifa fija

Auditoría de preparación

Dos semanas para saber qué vale la pena construir, qué no, y dónde empezar. Informe escrito en la transferencia.

DURACIÓN2 semanas
EQUIPO2 senior
PRECIOSTarifa fija
  • Espectro de decisiones mapeado
  • Línea base lista para usar medida
  • Hoja de ruta clasificada, informe escrito
Informe una Auditoría →
Nivel 02 · más común

Construir

Construcción integral de una o más capacidades de IA en tu operación. Modo en sombra → umbral → en vivo.

DURACIÓN3–6 meses
EQUIPO2–3 senior
PRECIOST&M con límite
  • Arnés de evaluación el primer día
  • Los seis guardrails incorporados
  • Transferencia de conocimiento a tu equipo
Definir una Construcción →
Nivel 03A largo plazo

Administrador

Nosotros poseemos el ciclo de vida de tu flota de IA — deriva, reentrenamiento, evaluaciones, ajuste de umbrales — hasta que tu equipo tome las riendas.

DURACIÓN6+ meses
EQUIPOIntegrado
PRECIOSRetención mensual
  • Monitoreo de deriva y calibración
  • Actualización trimestral del modelo
  • Plan de entrega desde el primer día
Discutir Administrador →

↪ Indicativo. Cada compromiso se escoge a partir de un informe escrito — sin sorpresas por modelo, sin ruleta de uso.

§ 08 / Prueba

Soporte de entrada
pasó de 11min
a 22 segundos —
y la precisión aumentó.

Precisión de enrutamiento
96.2 %
▲ desde 89% (humano)
Tasa de enrutamiento automático
81 %
≥ 90% de confianza
Tiempo de primera respuesta
22 s
▼ desde 11 min
"El modelo es correcto más a menudo que nuestro mejor agente — y sabemos exactamente cuándo no lo es."
— Jefe de Operaciones de Clientes · SaaS · NDA
§ 09 / Objeciones

Las preguntas
que escuchamos en
cada primera llamada.

Mayormente variaciones de "¿es seguro esto?", "¿esto va a alucinar?", y "¿qué pasa con nuestros datos?". Preguntas justas.

Q · 01

"¿Qué pasa con las alucinaciones?"

+
Arquitectamos en su contra, no alrededor de ellas. Los sistemas RAG deben citar. Las extracciones deben validar contra esquemas. Los clasificadores deben confesar incertidumbre a través del umbral. Y nada irreversible se ejecuta sin una unión humana. Se permite que el modelo esté equivocado; el sistema no debe permanecer en silencio al respecto.
Q · 02

"¿Dónde va nuestros datos?"

+
Por defecto: regiones de la UE, sin entrenamiento en tus datos, cifrado en tránsito y en reposo. Para cargas de trabajo reguladas, modelos completamente autoalojados en tu VPC — nada sale del perímetro. La arquitectura decide el modelo; la soberanía de datos es uno de los insumos.
Q · 03

"¿Qué pasa si el modelo empeora con el tiempo?"

+
Monitoreamos la deriva en la distribución de entradas y la calibración de salidas continuamente. El rendimiento disminuye unos pocos puntos porcentuales antes de que alguien lo note en el mundo real — las alertas se envían mucho antes de eso. En un compromiso de Administrador, el reentrenamiento o el ajuste del umbral son parte de la retención.
Q · 04

"¿Son los agentes de IA el futuro de la automatización?"

+
Para algunos dominios específicos, eventualmente. Hoy, los sistemas "agentes" son típicamente pipelines de clasificadores, extractores y redactores conectados con un pegamento determinista — que es exactamente cómo construimos. La pregunta interesante no es "¿es un agente?"; es "¿dónde en el pipeline firma el humano?"
Q · 05

"¿Esto nos atascará con un proveedor de modelos?"

+
No. Cada modelo está detrás de un adaptador — tu lógica empresarial no sabe si llamó a Anthropic, OpenAI, o a un Llama autoalojado. Cambiarlo toma un día, no un trimestre. El riesgo de proveedor se trata de la misma manera en que tratamos todas las demás dependencias: minimizado en la entrada.
Actualmente aceptando compromisos Q3

¿Dónde en tu
operación
la escala de juicio
es peor que el volumen?

Ahí es donde la IA se gana su lugar. Trae esto a una llamada de 30 minutos — te diremos, honestamente, si vale la pena construirlo y lo que tomaría.