Playbook

Sistemas RAG

Recuperación fiable aunque cambien los documentos.

Un RAG real es más que embeddings. Trata ingesta, recuperación y ensamblaje de respuesta como capas separadas y testeables.

Ingesta + chunking

Preserva estructura y procedencia.

  • Normaliza fuentes (PDF, DOCX, HTML) a un esquema estable
  • Divide por encabezados o límites semánticos, no por longitud fija
  • Guarda metadatos de propiedad, acceso y timestamps
  • Versiona documentos para rollback o comparación

Estrategia de recuperación

Obtén el contexto correcto antes de generar.

  • Búsqueda híbrida (BM25 + vector) supera embeddings puros
  • Usa filtros de metadatos y control de acceso en la recuperación
  • Re‑rank de resultados con un modelo ligero
  • Cachea queries frecuentes y mantiene ventana de frescura

Ensamblaje de respuesta

Las citas no son opcionales en producción.

  • Prompts con requisitos explícitos de citas
  • Rechaza cuando no hay fuentes o baja confianza
  • Usa un esquema estricto de respuesta para evitar drift

Modos de fallo

  • Docs obsoletos o faltantes que causan alucinaciones
  • Sobreinclusión de contexto irrelevante
  • Fuentes en conflicto sin desambiguación
  • Cero visibilidad sobre calidad de recuperación

Lista de verificación

  • Test set con queries top y edge cases
  • Dashboard de calidad de recuperación
  • Citas obligatorias en prompts
  • Filtros de acceso en retrieval