Entrenamiento
Etiquetar respuestas del bot
Pulgares 👍/👎 inline en cada respuesta del bot + correcciones. Promové al KB y el bot aprende para la próxima.
Por qué etiquetar
El bot ya aprende solo al cerrar conversaciones — el analizador decide si la conversación fue golden o un anti-pattern basándose en el sentiment final y guarda un resumen en golden_conversations. Eso captura el panorama, no el detalle.
Las etiquetas por mensaje cubren el detalle: una respuesta concreta del bot que te gustó (o no). Si dejás una corrección, el bot la usa la próxima vez que le pregunten algo parecido.
Cómo etiquetar (agente)
- Abrí cualquier conversación desde el inbox
/agent. - Debajo de cada mensaje del bot vas a ver dos íconos pequeños: 👍 y 👎.
- Clic en 👍 marca la respuesta como buena. Si la promueve un admin, queda como ejemplo dorado en el KB.
- Clic en 👎 abre un modal. Pegá la respuesta que el bot debería haber dado. Podés dejarla vacía si solo querés marcar que la respuesta fue mala.
- Clic de nuevo en la misma etiqueta la quita. Cambiar de pulgar reemplaza el anterior.
El dashboard (admin)
/admin/training agrega todas las etiquetas del workspace en una sola tabla con stats arriba.
Stats
| Métrica | Qué cuenta |
|---|---|
| Total | Etiquetas dejadas (todos los agentes). |
| 👍 buenas | Respuestas marcadas como ejemplares. |
| 👎 malas | Respuestas marcadas con o sin corrección. |
| En KB | Etiquetas ya promovidas a golden_conversations. |
| Pendientes | Etiquetas esperando promoción. |
| Últimos 7d | Etiquetas creadas en los últimos 7 días. |
Promover al KB
Cada tarjeta tiene un botón "Promover". Al hacer clic:
- 👍 buena: insertamos un row en
golden_conversationscon typegoldenque une la pregunta del cliente anterior + la respuesta del bot. - 👎 mala con corrección: insertamos dos rows — la respuesta correcta como
golden, y la original comoanti_patterncon un "NO responder así" arriba.
Ambos van con embedding de OpenAI text-embedding-3-small, así que el retriever híbrido (vectorial + FTS) los rankea junto al resto del corpus.
Promoción en masa
Cómo lo usa el bot
El retriever híbrido (HyDE + reranker, ver src/lib/ai/rag.ts) hace dos queries paralelas: una sobre type=golden y otra sobre type=anti_pattern. Los top-k de cada uno se inyectan en el system prompt como bloques separados ("EJEMPLOS BUENOS" y "PATRONES A EVITAR").
Lo importante: el bot empieza a usar tus correcciones desde el siguiente mensaje que mande, sin retraining ni redeploy. Es<efectivamente> fine tuning a la velocidad del clic.