Tu agente de IA gestionó 1.000 conversaciones este mes. Enhorabuena. Pero, ¿cuántas de esas conversaciones se convirtieron en visitas? ¿Cuántas generaron ingresos reales?
Si no puedes responder a esas preguntas, estás midiendo lo que no importa.
En el artículo anterior explicamos cómo construimos el agente de IA de PropPilot. En este, vamos a hablar de algo igual de importante: cómo saber si tu agente de IA está funcionando de verdad.
El problema de las métricas de vanidad
La industria del software tiene una debilidad por las métricas que impresionan en una presentación pero no significan nada en la práctica. En IA agéntica inmobiliaria, esto es especialmente peligroso.
Cuando un proveedor te dice que su IA “gestiona 5.000 conversaciones al mes”, la pregunta inmediata debería ser: ¿y qué?
Una IA que responde a 5.000 leads con mensajes genéricos e irrelevantes no es mejor que no responder. De hecho, puede ser peor: estás dañando tu marca con cada interacción vacía.
Métricas que NO importan
Antes de hablar de lo que sí importa, despejemos el ruido. Estas son las métricas que muchos proveedores de IA usan para impresionar, pero que no deberían guiar ninguna decisión:
| Métrica de vanidad | Por qué no importa |
|---|---|
| Número de mensajes enviados | Más mensajes ≠ mejor resultado. Un agente que envía 20 mensajes para conseguir lo que debería lograr en 3 está siendo ineficiente. |
| Número de conversaciones | Volumen sin contexto de calidad es ruido. 1.000 conversaciones con 0 cualificaciones es un fracaso. |
| Longitud media de respuesta | Respuestas largas no significan respuestas buenas. En WhatsApp, los mensajes cortos y directos tienen mejor tasa de lectura. |
| ”Puntuación de satisfacción IA” | Métrica inventada sin correlación demostrada con resultados de negocio. Un lead puede estar “satisfecho” con la conversación y nunca comprar. |
| Tiempo de conversación | Conversaciones más largas no implican mayor interés. A veces significan que la IA no está siendo clara. |
Las 8 métricas que SÍ importan
Estas son las métricas que correlacionan directamente con ingresos y eficiencia operativa. Si tu agente de IA no mejora estas cifras, no está funcionando.
1. Tasa de cualificación de leads
Qué mide: Del total de leads que gestiona la IA, ¿qué porcentaje se convierte en lead cualificado (con presupuesto, necesidad y plazo definidos)?
Por qué importa: Es la métrica más directa de la efectividad de la IA. Un agente que habla con 100 leads y cualifica 5 es radicalmente diferente de uno que cualifica 25.
| Rendimiento | Tasa de cualificación |
|---|---|
| Pobre | < 10% |
| Aceptable | 10-20% |
| Bueno | 20-35% |
| Excelente | > 35% |
En el mercado español, donde los portales generan un volumen alto de leads con intención variable, una tasa del 20-25% ya indica que la IA está haciendo un filtrado efectivo.
2. Tiempo hasta primera respuesta
Qué mide: Segundos (no minutos, no horas) desde que un lead contacta hasta que recibe una respuesta personalizada.
Por qué importa: Los datos del sector son claros: responder en menos de 5 minutos multiplica por 9 la probabilidad de contacto. La IA debería responder en segundos.
| Rendimiento | Tiempo de respuesta |
|---|---|
| Pobre | > 30 minutos |
| Aceptable | 5-30 minutos |
| Bueno | 1-5 minutos |
| Excelente | < 60 segundos |
3. Tasa de cualificación a visita
Qué mide: De los leads cualificados por la IA, ¿qué porcentaje agenda una visita real?
Por qué importa: Cualificar un lead es solo el primer paso. El valor real está en convertir esa cualificación en una acción concreta. Esta métrica mide si la IA está proponiendo el siguiente paso correcto.
| Rendimiento | Tasa a visita |
|---|---|
| Pobre | < 15% |
| Aceptable | 15-25% |
| Bueno | 25-40% |
| Excelente | > 40% |
4. Tasa de completitud de seguimiento
Qué mide: Del total de leads, ¿qué porcentaje recibe la secuencia completa de seguimiento (no solo el primer mensaje, sino toda la cadencia planificada)?
Por qué importa: La mayoría de agencias responden al primer mensaje y abandonan. Estudios del sector muestran que el 80% de las ventas requieren al menos 5 interacciones de seguimiento. La IA no debería olvidar nunca un lead.
| Rendimiento | Completitud |
|---|---|
| Manual típico | 15-25% |
| IA básica | 60-75% |
| IA agéntica | 95-100% |
5. Precisión de escalación
Qué mide: Cuando la IA decide escalar un lead a un agente humano, ¿lo hace en el momento correcto y con la información adecuada?
Por qué importa: Una IA que escala demasiado pronto desperdicia tiempo del equipo. Una que escala demasiado tarde pierde oportunidades. Esta métrica mide el criterio del agente.
Para medirla, revisa una muestra mensual de escalaciones:
- Escalación prematura: El lead no estaba listo. El agente humano no tenía nada que hacer.
- Escalación tardía: El lead ya se había enfriado o había contactado con la competencia.
- Escalación correcta: Lead cualificado, en el momento oportuno, con toda la información necesaria.
Objetivo: > 80% de escalaciones correctas.
6. Completitud de datos del lead
Qué mide: Del total de campos del CRM relevantes para la cualificación, ¿qué porcentaje rellena la IA de forma automática a partir de la conversación?
Por qué importa: Cada campo vacío en el CRM es trabajo manual para el agente humano y contexto perdido. Una IA agéntica debería extraer y registrar información de forma natural durante la conversación.
| Campo | Objetivo de completitud |
|---|---|
| Nombre completo | > 95% |
| Teléfono / email | > 90% |
| Presupuesto | > 70% |
| Zona de interés | > 85% |
| Plazo de compra | > 60% |
| Financiación necesaria | > 50% |
7. Ingreso por lead (IA vs. manual)
Qué mide: Ingreso medio generado por los leads gestionados por la IA comparado con los gestionados manualmente.
Por qué importa: Esta es la métrica definitiva. Si los leads gestionados por la IA generan más ingresos (o los mismos con menos coste), el ROI está demostrado.
Para calcularla correctamente:
- Divide los leads en dos grupos: gestionados por IA y gestionados manualmente.
- Sigue ambos grupos durante al menos 90 días (ciclo de venta inmobiliario típico en España).
- Compara ingresos totales / número de leads en cada grupo.
Benchmark realista en España: Si la IA gestiona el 80% de los leads iniciales y la tasa de cierre se mantiene o mejora, el ahorro operativo ya justifica la inversión.
8. Tiempo liberado del agente humano
Qué mide: Horas semanales que los agentes humanos dedican a tareas que antes consumían su tiempo y ahora gestiona la IA.
Por qué importa: La IA no sustituye a los agentes, los libera para actividades de alto valor. Esta métrica demuestra el impacto operativo real.
| Tarea liberada | Tiempo típico ahorrado/semana |
|---|---|
| Respuesta inicial a leads | 8-12 horas |
| Seguimiento de leads fríos | 5-8 horas |
| Cualificación básica | 4-6 horas |
| Actualización de CRM | 3-5 horas |
| Total | 20-31 horas |
Dashboard semanal: qué deberías estar revisando
Esta es la plantilla de seguimiento semanal que recomendamos. No necesitas sistemas complejos. Un spreadsheet con estas columnas es suficiente para empezar:
| Métrica | Semana 1 | Semana 2 | Semana 3 | Semana 4 | Tendencia |
|---|---|---|---|---|---|
| Leads recibidos | — | — | — | — | — |
| Tasa de cualificación | — | — | — | — | ↑ ↓ → |
| Tiempo medio 1ª respuesta | — | — | — | — | ↑ ↓ → |
| Cualificados → Visita | — | — | — | — | ↑ ↓ → |
| Seguimientos completados | — | — | — | — | ↑ ↓ → |
| Escalaciones correctas (%) | — | — | — | — | ↑ ↓ → |
| Campos CRM completados (%) | — | — | — | — | ↑ ↓ → |
| Horas liberadas equipo | — | — | — | — | ↑ ↓ → |
Revísalo cada lunes. Busca tendencias, no cifras absolutas. Una tasa de cualificación del 22% que sube cada semana es mejor que un 30% que baja.
Errores comunes al medir IA agéntica
1. Optimizar velocidad sobre calidad
Responder en 3 segundos con un mensaje genérico es peor que responder en 30 segundos con un mensaje personalizado que menciona el inmueble específico del que el lead preguntó. La velocidad importa, pero no a costa de la relevancia.
2. Medir la IA de forma aislada
La IA es parte de un sistema. Si la tasa de cualificación es alta pero la tasa de cierre es baja, el problema puede estar en el traspaso al equipo comercial, no en la IA. Mide el funnel completo.
3. No establecer baselines antes de implementar
Si no sabes cuáles eran tus métricas antes de la IA, no puedes demostrar el impacto. Antes de activar cualquier agente, documenta: tasa de respuesta, tiempo medio, tasa de cualificación y coste por lead actuales.
4. Cambiar demasiadas variables a la vez
Implementas IA, cambias los scripts de venta y rediseñas el CRM en el mismo mes. ¿Qué causó la mejora? Imposible saberlo. Cambia una variable, mide, itera.
Siguiente paso
Las métricas son el fundamento. Pero saber qué medir es solo la mitad del trabajo. En el próximo artículo, exploraremos cómo la combinación de agentes humanos y agentes de IA está redefiniendo las ventas inmobiliarias en España.
¿Quieres ver cómo responde tu agencia hoy? Nuestro Mystery Shopper analiza la respuesta de tu equipo a un lead real y te da un informe detallado con métricas reales, no de vanidad. Es gratuito y confidencial.
PropPilot.ai