Playbook

Prompt injection y seguridad de datos

Reduce el blast radius y mantén datos acotados.

Seguridad es poner límites. Mantén datos acotados, herramientas restringidas y respuestas auditables.

Mitigación de prompt injection

  • Jerarquía de instrucciones: system > developer > user
  • Allowlist de herramientas y validación de esquemas
  • Citas obligatorias para afirmaciones

Límites de datos

  • Índices por tenant o por equipo
  • Filtros de acceso en retrieval
  • Sin secretos en prompts ni logs

RBAC + auditoría

  • Permisos por rol para herramientas
  • Trazas de auditoría en acciones sensibles
  • Revisión periódica de accesos

Controles de abuso

  • Rate limits y detección de anomalías
  • Caps duros en tokens y herramientas
  • Estados de error explícitos en lugar de fallbacks

Lista de verificación

  • Allowlist de herramientas por rol
  • Controles de PII y redacción
  • Política de retención de auditoría