Entrenamiento

Etiquetar respuestas del bot

Pulgares 👍/👎 inline en cada respuesta del bot + correcciones. Promové al KB y el bot aprende para la próxima.

Por qué etiquetar

El bot ya aprende solo al cerrar conversaciones — el analizador decide si la conversación fue golden o un anti-pattern basándose en el sentiment final y guarda un resumen en golden_conversations. Eso captura el panorama, no el detalle.

Las etiquetas por mensaje cubren el detalle: una respuesta concreta del bot que te gustó (o no). Si dejás una corrección, el bot la usa la próxima vez que le pregunten algo parecido.

Cómo etiquetar (agente)

  1. Abrí cualquier conversación desde el inbox /agent.
  2. Debajo de cada mensaje del bot vas a ver dos íconos pequeños: 👍 y 👎.
  3. Clic en 👍 marca la respuesta como buena. Si la promueve un admin, queda como ejemplo dorado en el KB.
  4. Clic en 👎 abre un modal. Pegá la respuesta que el bot debería haber dado. Podés dejarla vacía si solo querés marcar que la respuesta fue mala.
  5. Clic de nuevo en la misma etiqueta la quita. Cambiar de pulgar reemplaza el anterior.
Las etiquetas son personales: si dos agentes ven la misma respuesta, cada uno deja su propia opinión sin pisar la del otro.

El dashboard (admin)

/admin/training agrega todas las etiquetas del workspace en una sola tabla con stats arriba.

Stats

MétricaQué cuenta
TotalEtiquetas dejadas (todos los agentes).
👍 buenasRespuestas marcadas como ejemplares.
👎 malasRespuestas marcadas con o sin corrección.
En KBEtiquetas ya promovidas a golden_conversations.
PendientesEtiquetas esperando promoción.
Últimos 7dEtiquetas creadas en los últimos 7 días.

Promover al KB

Cada tarjeta tiene un botón "Promover". Al hacer clic:

  • 👍 buena: insertamos un row en golden_conversations con type golden que une la pregunta del cliente anterior + la respuesta del bot.
  • 👎 mala con corrección: insertamos dos rows — la respuesta correcta como golden, y la original como anti_pattern con un "NO responder así" arriba.

Ambos van con embedding de OpenAI text-embedding-3-small, así que el retriever híbrido (vectorial + FTS) los rankea junto al resto del corpus.

Promoción en masa

Si aplicaste filtros (ej. solo 👍 buenas y pendientes), el botón "Promover N visibles" los procesa todos. Útil al final del día para no hacer clic uno por uno.

Cómo lo usa el bot

El retriever híbrido (HyDE + reranker, ver src/lib/ai/rag.ts) hace dos queries paralelas: una sobre type=golden y otra sobre type=anti_pattern. Los top-k de cada uno se inyectan en el system prompt como bloques separados ("EJEMPLOS BUENOS" y "PATRONES A EVITAR").

Lo importante: el bot empieza a usar tus correcciones desde el siguiente mensaje que mande, sin retraining ni redeploy. Es<efectivamente> fine tuning a la velocidad del clic.

Combinalo con el panel de Anti-patterns del retriever: cuanto más etiquetes los errores con corrección, más rápido converge la voz del bot a la tuya.