Soluciones/IA y Automatización Inteligente§ 05 de 06 disciplinas

IA en producción —
no en una diapositiva.

Construimos automatización de clase juicio para el trabajo que realmente mueve el negocio. Sin teatro de demostración. Sin autonomía donde no pertenece. Siempre detrás de un umbral de confianza que un humano aprobó.

Agendar una auditoría de preparación Ver dónde encaja la IA — y dónde no

Primer modelo en vivo

4–6 semanas

detrás del umbral

Humano en el circuito

Siempre

donde importa

Bloqueo de proveedor

modelo portátil

clasificador · soporte_intakev 8

BOLETO DE LECTURA #48,221

Entrante · cuerpo de correo

Hola equipo, traté de renovar mi suscripción anoche pero el pago fue rechazado — la tarjeta está bien en otros lugares. Intenté con una segunda tarjeta, mismo resultado. Frustrado — necesito que esto se resuelva hoy.

→ clasificación

87 ms

Categoría

Facturación · Pago Fallido

Facturación · Pago Fallido94 %

Cuenta · Problema con la tarjeta5 %

Otro1 %

SENTIMIENTOfrustrado

URGENCIAalto · "hoy"

UMBRAL≥ 90 % automático

→ enrutar · factura-nivel-2 · respuesta redactada en espera

↳ Clasificador en vivo de un despliegue del cliente. Los tickets por debajo del umbral caen en una cola humana, no en el vacío.

§ 01 / Tesis

Deja de medir
modelos.
Comienza a medir
decisiones.

La mayoría de los proyectos de IA fallan no porque el modelo fuera incorrecto, sino porque se conectó a la decisión equivocada. La prueba correcta no es la precisión — es si el costo de estar equivocado es aceptable en comparación con el tiempo para estar en lo correcto.

Algunas decisiones toleran un 5% de tasa de error a 200ms. Otras decisiones no toleran ninguna tasa de error en absoluto. El trabajo no es elegir el modelo, es mapear la decisión antes de que el modelo se ejecute.

Lo que construiremos

Clasificadores con umbrales de confianza
RAG sobre tus propios datos estructurados + no estructurados
Extracción de documentos desordenados a gran escala
Redacción que un humano revisa antes de enviar

Lo que no haremos

Agentes autónomos actuando en decisiones irreversibles
Chatbots reemplazando humanos en trabajos regulados
"Características de IA" añadidas para el comunicado de prensa
Pipelines sin un arnés de evaluación fuera de línea

§ 02 / Marco de decisión

Dónde pertenece la IA —
y dónde no.

Plotea la decisión en dos ejes: costo de estar equivocado y volumen de decisiones por día. La diagonal te da la respuesta.

← Costo de estar equivocado →

Q · 01 / Noalto costo · bajo volumen

Juicio humano puro

Decisiones de contratación, M&A, llamadas de exposición legal, diagnóstico médico sin supervisión especializada.

No pongas un modelo frente a una decisión que un alto ejecutivo toma diez veces al año.

Q · 02 / Asistiralto costo · alto volumen

Humano asistido por IA

Suscripción, revisión de fraudes, triage de reclamos, preselección médica, apelaciones de moderación de contenido.

El modelo redacta, puntúa, etiqueta. El humano firma. Siempre.

Q · 03 / Omitirbajo costo · bajo volumen

Probablemente no valga la pena

Tareas administrativas ocasionales, consultas internas puntuales, tareas realizadas menos de una vez a la semana.

El costo de construcción superará el tiempo ahorrado. Usa una lista de verificación.

Q · 04 / Automatizarbajo costo · alto volumen

El punto dulce

Clasificación de tickets, extracción de documentos, enriquecimiento de leads, generación de borradores, enrutamiento inteligente.

↪ Donde ocurre la mayor parte de nuestro trabajo de IA.

Bajo volumen →↑ Costo de estar equivocado→ Alto volumen

NoAsistir a un humanoOmitirAutomatizar detrás del umbral

↪ Lo primero que hacemos en cualquier compromiso de IA es trazar tus decisiones candidatas en esta cuadrícula. Aproximadamente uno de cada tres cae en Q4.

§ 03 / Patrones

Seis patrones de IA,
enviados a producción.

No es un menú de modelos. Las formas de sistema que realmente construimos, con la unión a un humano siempre en la especificación.

A · Clasificar

Enrutamiento y triage

Elementos entrantes — tickets, correos, leads, reclamos — ordenados en la cola correcta con confianza. Por debajo del umbral caen a un humano en segundos.

ENTRADA → texto no estructurado SALIDA → etiquetado · confianza · enrutado

B · Extraer

Extracción de documentos

Facturas, contratos, ID, KYC — organizados en campos estructurados, validados y empujados a tus sistemas. Extracciones fallidas en espera para revisión.

ENTRADA → PDF · escaneo · correo SALIDA → JSON · validado en cruce

C · Recuperar

Sistemas de respuestas fundamentadas

RAG sobre tu propio conocimiento — manuales, políticas, contratos, datos de productos. Citas obligatorias. Sin cita, sin respuesta.

ENTRADA → pregunta + corpus SALIDA → respuesta + fuentes citadas

D · Redactar

Generación de primera redacción

Respuestas, informes, resúmenes, respuestas a RFP — redactadas en tu voz, en la cola de un humano para un clic de aprobación, una de edición.

ENTRADA → contexto + intención SALIDA → borrador editable (nunca enviado)

E · Prever

Puntuación predictiva

Deserción, demanda, incumplimiento, conversión de leads — probabilidades clasificadas que impulsan las operaciones. A menudo la respuesta correcta es el boosting de gradientes, no un transformador.

ENTRADA → histórico + características SALIDA → probabilidades clasificadas

F · Detectar

Detección de anomalías y deriva

El sistema nota cuando algo deja de parecerse a sí mismo — patrones de fraude, deriva operativa, degradación de calidad de datos — antes de que cualquier panel de control lo surface.

ENTRADA → telemetría continua SALIDA → marcado + explicado

§ 04 / Selección de modelos

El modelo correcto
raramente es el
más grande.

Somos agnósticos en cuanto a modelos por diseño. La arquitectura decide qué corre cada decisión; obtienes la cosa más barata, rápida y portable que cumpla con el umbral.

Forma de decisión

Elección por defecto

Latencia

Costo / 1k

Por qué esto, no el más grande

Clasificar (corto)

BERT ajustado · DistilBERT

~ 25 ms

€ 0.01

Etiquetas específicas, en tus datos, rápido y auto-alojado. Un LLM es excesivo.

Clasificar (nuanceado)

Claude Haiku · GPT-4o-mini

~ 800 ms

€ 0.30

Cuando las etiquetas necesitan leer entre líneas. Modelos de frontera pequeños, no grandes.

Extraer

Claude Sonnet · GPT-4o

~ 2 s

€ 1.50

Fuerte modo JSON + validación de esquema. Verificado contra reglas antes de la confirmación.

RAG · recuperar

pgvector · híbrido BM25

~ 80 ms

€ 0.00

Extensión de Postgres. La recuperación híbrida supera a la pura vector. No se necesita una base de datos vectorial independiente.

RAG · generar

Claude Sonnet · con citas

~ 1.5 s

€ 1.20

Cita por defecto. Si el modelo no puede citar, devuelve "desconocido" — nunca inventa.

Prever

XGBoost · LightGBM · Prophet

~ 5 ms

€ 0.00

Los datos tabulares con características fuertes superan a los LLM en predicción. Casi siempre.

Sensible · PII

Auto-alojado · Llama · Mistral

~ 1 s

infra

Soberanía de datos. Se ejecuta en tu VPC o nuestra región de UE. Nada sale del perímetro.

↪ La arquitectura es portable: cada modelo está detrás de un adaptador, intercambiable en un día. Tu lógica empresarial no se preocupa por cuál funcionó.

§ 05 / Guardrails

El andamiaje aburrido
que hace que la IA
sea de grado de producción.

Nada de esto es glamuroso. Todo es no negociable. Es la diferencia entre una demostración que maravilla y un sistema que no hará noticias por la razón equivocada.

G · 01no negociable

Umbrales de confianza

Cada salida del modelo lleva una puntuación de confianza. Por debajo del umbral, cae en una cola humana. Calibrado por decisión, no por modelo.

G · 02no negociable

Arnés de evaluación fuera de línea

Un conjunto de prueba congelado, puntuado en cada cambio. Ningún modelo va a producción sin superar al anterior en las métricas que tú aprobas.

G · 03no negociable

Modo en sombra

Los modelos funcionan silenciosamente contra tráfico real antes de actuar. Predicciones registradas, comparadas con humanos, revisadas semanalmente hasta ser confiables.

G · 04no negociable

Monitoreo de deriva

Los modelos decrecen silenciosamente cuando el mundo cambia. Monitoreamos la distribución de entradas y la calibración de salidas — las alertas se envían antes de que el rendimiento se vea afectado.

G · 05no negociable

Registro de auditoría

Cada predicción registrada con entrada, versión del modelo, confianza y el resultado eventual. Reproducible bajo demanda, defensible ante un regulador.

G · 06no negociable

Interruptor de apagado

Cualquier modelo puede desactivarse en segundos, regresando al flujo anterior a la IA. Probatado trimestralmente. Con la esperanza de que nunca se use. Siempre presente.

§ 06 / Preparación

Dos semanas para saber
si la IA es la respuesta.

Antes de que se construya cualquier modelo, realizamos una auditoría de preparación estructurada. Resultado: un informe escrito que nombra los candidatos correctos — y los incorrectos — por su nombre.

R · 01días 1–2

Inventario de las decisiones

Cada decisión recurrente en tu operación, trazada en el espectro. La lista honesta, no la lista de demostración.

R · 02días 3–5

Auditar los datos

Etiquetas de verdad, distribución, deriva, casos límite. La mayoría de los proyectos fallan aquí, antes de que se toque cualquier modelo.

R · 03días 6–8

Ejecutar una línea base

Un pequeño modelo de frontera, listo para usar, solicitado cuidadosamente — medido contra tus datos. Establece el piso antes de cualquier trabajo personalizado.

R · 04días 9–10

Puntuar y clasificar

Cada decisión candidata pesada en volumen, ahorros, riesgo y factibilidad. Te vas con un roadmap numerado.

R · 05transferencia

El informe escrito

Un documento de 14–20 páginas con candidatos nombrados, números de línea base y un plan de construcción. Tuyo para conservar, independientemente de lo que venga después.

TARIFA FIJA —Aproximadamente el 30% de las auditorías terminan con nosotros recomendando no usar IA para la carga de trabajo candidata. Estamos bien con eso.

§ 07 / Compromiso

Tres maneras
de empezar.

Nivel 01Tarifa fija

Auditoría de preparación

Dos semanas para saber qué vale la pena construir, qué no, y dónde empezar. Informe escrito en la transferencia.

DURACIÓN2 semanas

EQUIPO2 senior

PRECIOSTarifa fija

Espectro de decisiones mapeado
Línea base lista para usar medida
Hoja de ruta clasificada, informe escrito

Informe una Auditoría →

Nivel 02 · más común

Construir

Construcción integral de una o más capacidades de IA en tu operación. Modo en sombra → umbral → en vivo.

DURACIÓN3–6 meses

EQUIPO2–3 senior

PRECIOST&M con límite

Arnés de evaluación el primer día
Los seis guardrails incorporados
Transferencia de conocimiento a tu equipo

Definir una Construcción →

Nivel 03A largo plazo

Administrador

Nosotros poseemos el ciclo de vida de tu flota de IA — deriva, reentrenamiento, evaluaciones, ajuste de umbrales — hasta que tu equipo tome las riendas.

DURACIÓN6+ meses

EQUIPOIntegrado

PRECIOSRetención mensual

Monitoreo de deriva y calibración
Actualización trimestral del modelo
Plan de entrega desde el primer día

Discutir Administrador →

↪ Indicativo. Cada compromiso se escoge a partir de un informe escrito — sin sorpresas por modelo, sin ruleta de uso.

§ 08 / Prueba

Soporte de entrada
pasó de 11min
a 22 segundos —
y la precisión aumentó.

Precisión de enrutamiento

96.2 %

▲ desde 89% (humano)

Tasa de enrutamiento automático

81 %

≥ 90% de confianza

Tiempo de primera respuesta

22 s

▼ desde 11 min

"El modelo es correcto más a menudo que nuestro mejor agente — y sabemos exactamente cuándo no lo es."

— Jefe de Operaciones de Clientes · SaaS · NDA

Leer el caso completo Todos los estudios de caso

§ 09 / Objeciones

Las preguntas
que escuchamos en
cada primera llamada.

Mayormente variaciones de "¿es seguro esto?", "¿esto va a alucinar?", y "¿qué pasa con nuestros datos?". Preguntas justas.

Q · 01

"¿Qué pasa con las alucinaciones?"

Arquitectamos en su contra, no alrededor de ellas. Los sistemas RAG deben citar. Las extracciones deben validar contra esquemas. Los clasificadores deben confesar incertidumbre a través del umbral. Y nada irreversible se ejecuta sin una unión humana. Se permite que el modelo esté equivocado; el sistema no debe permanecer en silencio al respecto.

Q · 02

"¿Dónde va nuestros datos?"

Por defecto: regiones de la UE, sin entrenamiento en tus datos, cifrado en tránsito y en reposo. Para cargas de trabajo reguladas, modelos completamente autoalojados en tu VPC — nada sale del perímetro. La arquitectura decide el modelo; la soberanía de datos es uno de los insumos.

Q · 03

"¿Qué pasa si el modelo empeora con el tiempo?"

Monitoreamos la deriva en la distribución de entradas y la calibración de salidas continuamente. El rendimiento disminuye unos pocos puntos porcentuales antes de que alguien lo note en el mundo real — las alertas se envían mucho antes de eso. En un compromiso de Administrador, el reentrenamiento o el ajuste del umbral son parte de la retención.

Q · 04

"¿Son los agentes de IA el futuro de la automatización?"

Para algunos dominios específicos, eventualmente. Hoy, los sistemas "agentes" son típicamente pipelines de clasificadores, extractores y redactores conectados con un pegamento determinista — que es exactamente cómo construimos. La pregunta interesante no es "¿es un agente?"; es "¿dónde en el pipeline firma el humano?"

Q · 05

"¿Esto nos atascará con un proveedor de modelos?"

No. Cada modelo está detrás de un adaptador — tu lógica empresarial no sabe si llamó a Anthropic, OpenAI, o a un Llama autoalojado. Cambiarlo toma un día, no un trimestre. El riesgo de proveedor se trata de la misma manera en que tratamos todas las demás dependencias: minimizado en la entrada.

Actualmente aceptando compromisos Q3

¿Dónde en tu
operación
la escala de juicio
es peor que el volumen?

Ahí es donde la IA se gana su lugar. Trae esto a una llamada de 30 minutos — te diremos, honestamente, si vale la pena construirlo y lo que tomaría.

Primario

Agendar una auditoría de preparación

30 min · video · EN/PT/ES

O — escrito

hello@giroteam.com

Respuesta dentro de un día laboral.

IA en producción —no en una diapositiva.

Deja de medirmodelos.Comienza a medirdecisiones.

Dónde pertenece la IA —y dónde no.