Ultima revision
29 de junio de 2026

El problema no es que un LLM alucine. El problema serio empieza cuando ese modelo toca datos reales, llama a herramientas, consulta sistemas internos o toma decisiones que alguien acaba ejecutando. Ahí deja de ser una demo simpática y se convierte en superficie de ataque, en riesgo operacional y, para quien trabaja en banca, seguros o fintech, en material regulatorio de primera.
OWASP lleva tiempo poniendo orden en este terreno con su Top 10 for Large Language Model Applications. La lista es útil, pero se queda corta si el lector necesita algo más exigente que una taxonomía: cómo aterrizar esos riesgos en operación, qué controles sirven de verdad en un entorno regulado, qué evidencias pedir a seguridad, a ingeniería y a proveedores, y cómo conectar todo eso con obligaciones auditables bajo DORA, NIS2 e ISO 27001.
Aquí está el quid: en un entorno europeo regulado, un riesgo de LLM no se evalúa solo por su novedad técnica. Se evalúa por su impacto en confidencialidad, integridad, disponibilidad, autenticidad y trazabilidad; exactamente el lenguaje que usa DORA para la gestión del riesgo TIC y el que NIS2 traduce en medidas de gestión del riesgo de ciberseguridad. Si tu copiloto interno puede exfiltrar datos, ejecutar acciones no autorizadas o contaminar un flujo de decisión crítico, no tienes un “riesgo de IA”. Tienes un riesgo TIC de libro con un embalaje nuevo.
Y el embalaje nuevo tiene una trampa: muchas organizaciones están desplegando LLM como si fueran una capa de interfaz. No lo son. Son una capa probabilística con dependencias opacas, datos de entrenamiento difíciles de gobernar, comportamiento sensible al contexto y una tendencia muy poco tranquilizadora a obedecer al texto más reciente que reciben. Excelente para productividad. También excelente para que un atacante esconda una instrucción en una página web, un PDF, un correo o un ticket y convierta a tu agente en su becario gratuito.
OWASP enumera los fallos más habituales en aplicaciones LLM: prompt injection, divulgación de información sensible, gestión insegura de salidas, data poisoning, denegación de servicio del modelo, exceso de confianza, autorización insuficiente, ejecución no controlada de herramientas, dependencia de componentes vulnerables y robo del modelo, entre otros, según la versión y evolución del proyecto. La tentación habitual es leerlo como una lista de fallos de aplicación. Error. En operación regulada, cada uno de esos fallos desplaza obligaciones muy concretas:
Un detalle que muchas áreas de cumplimiento todavía subestiman: cuando un LLM se integra con correo, CRM, repositorios documentales, sistemas de pago, herramientas de soporte o RPA, el perímetro regulatorio ya no depende del modelo sino de la función. Si esa función soporta procesos críticos o importantes, DORA aprieta. Si esa función forma parte de servicios esenciales o importantes en el sentido de NIS2, también aprieta. Y si en el camino aparece dato personal, GDPR entra por la puerta principal, no por la ventana.
Por eso la pregunta correcta no es “¿estamos usando IA generativa?”. La pregunta útil es otra: ¿qué decisiones, datos y sistemas puede tocar este LLM, con qué restricciones y qué prueba objetiva tenemos de que esas restricciones funcionan?
El prompt injection se ha popularizado porque se entiende rápido: alguien consigue que el modelo ignore instrucciones del sistema o las desborde mediante instrucciones maliciosas en la entrada o en contenido recuperado. Pero la versión de producción no se parece a los ejemplos de laboratorio tipo “ignora todas las instrucciones anteriores”. La versión de producción suele venir disfrazada de dato legítimo.
Un agente que resume correos y propone acciones puede recibir un mensaje con texto oculto, una firma manipulada o un adjunto que contiene instrucciones para extraer secretos del contexto. Un asistente con RAG puede recuperar una wiki interna “contaminada” con órdenes embebidas. Un agente que navega por webs de proveedores puede visitar una página con instrucciones diseñadas para forzar llamadas a herramientas. En todos esos casos, el atacante no necesita romper el modelo. Le basta con hablarle donde el modelo escucha.
Operativamente, el error más repetido consiste en tratar el prompt injection como si fuera un problema de filtrado semántico. No basta. Un filtro de prompts ayuda, pero no sustituye el aislamiento de privilegios. Si el agente puede ver secretos, ejecutar herramientas o modificar registros, cualquier inyección exitosa escala de “respuesta extraña” a incidente real.
El control que funciona no es uno; es una cadena:
Esto conecta de forma directa con NIS2 art. 21.2, que exige medidas sobre seguridad en adquisición, desarrollo y mantenimiento, gestión de incidentes y seguridad de la cadena de suministro, y con DORA art. 6, que obliga a mantener un marco sólido y documentado de gestión del riesgo TIC. Si el agente puede ejecutar acciones y no puedes demostrar qué documento desencadenó la orden, qué política la permitió y qué control la bloqueó o autorizó, no tienes control defendible. Tienes fe tecnológica. Y la fe, en auditoría, cotiza peor que nunca.
La evidencia útil no es una política PDF de 27 páginas. Es telemetría.
Sin esa base, luego llega el incidente y todo el mundo “cree” que el agente hizo algo extraño. Magnífico. Lo que nadie puede reconstruir es cómo, cuándo y con qué impacto.
La fuga de datos en LLM no ocurre solo cuando el modelo “recuerda” datos de entrenamiento. Ese caso existe, pero en empresa el vector más común es mucho más prosaico: el sistema envía al proveedor más contexto del necesario, el usuario pega información sensible en un chat no segregado, el RAG recupera documentación clasificada sin necesidad, o la salida del modelo mezcla datos de varios expedientes. Nada glamuroso. Muy eficaz.
Para un responsable de cumplimiento europeo, aquí convergen tres planos distintos:
En DORA, además, la fuga de datos no se analiza solo como privacidad. Si compromete servicios críticos, integridad de procesos o dependencia de terceros, entra en la maquinaria de incidentes TIC y de supervisión de terceros. Un asistente de operaciones que expone credenciales, claves API, runbooks de recuperación o datos de clientes puede convertirse en un incidente material aunque el volumen de datos personales no sea masivo.
El control esencial aquí es una arquitectura de datos por capas. Dicho sin liturgia:
Quien crea que esto se resuelve con una cláusula estándar de proveedor probablemente no ha leído sus propios flujos. La fuga más probable no está en el contrato; está en el conector mal configurado al repositorio documental o en el desarrollador que decidió pasar la conversación completa “porque mejora la respuesta”. Sí, la mejora. También mejora el radio de explosión.
Si eres CISO o compliance, pide pruebas incómodas, no presentaciones:
Eso enlaza con DORA art. 28 sobre gestión del riesgo de terceros proveedores de servicios TIC. Si el LLM depende de un proveedor externo, el riesgo no se limita al modelo principal. También cuenta la base vectorial gestionada, la capa de observabilidad, el gateway de prompts, el servicio de embeddings y cualquier plugin que procese datos. La cadena es más larga de lo que sugiere la factura.
El data poisoning tiene menos titulares que el prompt injection porque es más aburrido de contar. También porque sus efectos suelen ser graduales. Pero en entornos regulados puede ser más dañino. Si el corpus de RAG, los datos de ajuste fino o las fuentes de etiquetado se contaminan, el sistema no solo responde mal: normaliza errores, sesgos o instrucciones nocivas como si fueran conocimiento legítimo.
Hay tres variantes operativas especialmente relevantes:
Esto conecta con NIS2 art. 21.2.d sobre seguridad de la cadena de suministro y con art. 21.2.e sobre seguridad en adquisición, desarrollo y mantenimiento de redes y sistemas de información, incluida la gestión y divulgación de vulnerabilidades. También encaja con controles de ISO 27001:2022 relativos a gestión de configuraciones, integridad de la información y seguridad en desarrollo.
La cuestión práctica es sencilla: si tu organización no trata el corpus de RAG como un activo crítico con control de cambios, revisión y trazabilidad, está dejando una puerta lateral abierta. Y las puertas laterales suelen ser las favoritas del atacante porque nadie las mira con el dramatismo del acceso privilegiado.
La evidencia, de nuevo, debe ser operativa: registro de cambios, aprobación, controles de acceso al repositorio de conocimiento, alertas por ediciones anómalas y trazabilidad de qué versión documental sustentó cada respuesta relevante. Si luego el agente recomienda una acción equivocada durante un incidente, necesitas reconstruir si el origen fue el modelo, el recuperador o el contenido. Sin esa reconstrucción, la investigación post-incidente se convierte en una disputa teológica entre equipos.
OWASP acierta al incluir la dependencia excesiva o overreliance. No es un “riesgo blando”. Es uno de los fallos de control más serios porque convierte una salida probabilística en una decisión operativa con apariencia de autoridad.
En banca y seguros, el daño no siempre viene de una orden de pago mal ejecutada. A veces basta con que un analista, un operador o un agente de primera línea deje de cuestionar la respuesta del sistema. Un LLM que resume una alerta, clasifica un incidente o propone una respuesta al cliente puede arrastrar errores aguas abajo con una eficacia admirable. El ser humano en el circuito no sirve de mucho si actúa como notario del modelo.
Aquí hay una dimensión regulatoria clara. DORA art. 5 y el marco de gobernanza exigen que el órgano de dirección defina, apruebe, supervise y sea responsable de la gestión del riesgo TIC. Traducido: no basta con desplegar una herramienta y pedir a los usuarios “criterio profesional”. Hace falta diseñar umbrales de confianza, límites de automatización, casos de uso permitidos y actividades expresamente prohibidas.
El control útil no consiste en poner un aviso de “la IA puede cometer errores”. Eso sirve para cubrir expedientes de marketing, no para reducir riesgo. Lo que sirve es:
En términos de evidencia, conviene registrar cuántas respuestas fueron aceptadas sin cambios, cuántas se corrigieron, en qué tipos de tarea falla más el sistema y qué incidentes o cuasi incidentes generó. Si no mides reversión humana, correcciones y excepciones, no estás gobernando dependencia. La estás decorando.
El salto de riesgo más brusco ocurre cuando el LLM deja de limitarse a generar texto y adquiere capacidad de actuar: llamar APIs, consultar bases de datos, abrir tickets, reconfigurar sistemas, enviar correos o interactuar con herramientas de terceros. Ahí aparece una mezcla bastante tóxica de dos mundos: la inseguridad clásica de APIs y privilegios, y la imprevisibilidad de un motor generativo que decide cuándo usar esas capacidades.
La mayoría de incidentes serios que veremos en entornos corporativos no vendrán del “modelo rebelde”, sino de permisos mal diseñados alrededor del modelo. Un agente con acceso amplio a sistemas internos es, en esencia, una cuenta privilegiada con interfaz conversacional. Y las cuentas privilegiadas con decisiones probabilísticas no suelen ser el sueño húmedo del auditor.
OWASP lo enfoca como autorización insegura y uso inseguro de plugins o herramientas. Traducido a controles empresariales:
Esto enlaza de forma muy directa con DORA art. 28 y 30. Si el caso de uso depende de herramientas o servicios de terceros que soportan funciones críticas o importantes, la organización debe identificar dependencias, evaluar concentración de riesgo, asegurar condiciones contractuales adecuadas y mantener capacidad de supervisión. Un agente que llama a cinco servicios de terceros puede crear una cadena operacional mucho más frágil de lo que muestra el diagrama de arquitectura de ventas.
Desde la óptica de NIS2 art. 21, además, la autorización insegura afecta a control de accesos, seguridad del desarrollo y gestión de vulnerabilidades. Si un plugin permite acciones amplias sin validación contextual, el problema no es “de IA”. Es de diseño de seguridad básico, solo que ahora viaja en una envoltura nueva y cara.
Si esta trazabilidad no está disponible de forma correlacionable, cualquier post mortem será un ejercicio de arqueología creativa.
Una aplicación LLM en producción rara vez depende de un único componente. Suele incluir modelo base, servicio de inferencia, librerías de orquestación, motor de embeddings, vector store, pasarela de observabilidad, filtros de seguridad, herramientas conectadas y a veces un segundo modelo para clasificación o moderación. La superficie de terceros se multiplica.
OWASP lo recoge al hablar de componentes vulnerables y de la cadena de dependencias. El ángulo regulatorio es evidente: NIS2 art. 21.2.d exige abordar la seguridad de la cadena de suministro, incluidas las relaciones entre cada entidad y sus proveedores directos o prestadores de servicios; DORA art. 28 exige una estrategia sobre el riesgo de terceros TIC y un registro de acuerdos contractuales relativos al uso de servicios TIC prestados por terceros.
El error recurrente consiste en evaluar solo al hyperscaler o al proveedor del modelo y olvidar el resto. Pero la fuga, indisponibilidad o alteración puede nacer en la capa vectorial, en una librería con vulnerabilidad conocida, en una herramienta de prompt management o en un conector de datos. Esto no es teórico. En 2023 y 2024 se han multiplicado los avisos de seguridad y CVEs en ecosistemas de IA y MLOps; no todos son críticos, pero bastan para recordar que “innovador” no significa “maduro”.
El control mínimo aceptable debería incluir:
La ironía aquí es fina: muchas organizaciones despliegan IA para ganar eficiencia operativa mientras añaden una cadena de suministro técnica mucho más densa, menos visible y a menudo menos gobernada que la de sus aplicaciones tradicionales. Productividad, sí. También concentración de riesgo, si nadie la mide.
Los LLM introducen una variante curiosa del viejo DoS: no hace falta tumbar el servicio; basta con disparar consumo, latencia o complejidad de inferencia. Solicitudes gigantes, bucles de herramientas, consultas recursivas, abuso de contexto o extracción masiva pueden degradar servicio y presupuesto a la vez. En sistemas de atención interna o externa, ese deterioro se traduce rápidamente en indisponibilidad operativa.
Para entidades sometidas a DORA, la disponibilidad y resiliencia del servicio no son adornos. DORA art. 11 exige mecanismos para detectar actividades anómalas, y los artículos sobre respuesta y recuperación exigen capacidad real para contener y restaurar. Si tu arquitectura LLM no tiene límites de tokens, cuotas por usuario, control de fan-out de herramientas y observabilidad de coste/latencia, la pregunta ya no es si sufrirás abuso, sino cuánto tardarás en verlo.
Controles concretos:
La evidencia útil aquí son series temporales: latencia, tokens de entrada/salida, número de llamadas a herramientas, errores por tipo, bloqueos por política, consumo por tenant o unidad de negocio, y correlación con eventos de seguridad. Un SIEM que no ingiere esta telemetría está ciego para una parte relevante del riesgo.
| Riesgo operativo en LLM | Obligación regulatoria principal | Control operativo | Evidencia esperable |
|---|---|---|---|
| Prompt injection en RAG o correo | NIS2 art. 21.2; DORA art. 6 y 11 | Aislamiento entre datos e instrucciones, permisos mínimos, revisión humana para acciones sensibles | Logs de recuperación, políticas aplicadas, bloqueos, árbol de herramientas |
| Fuga de datos sensibles | GDPR art. 5, 32 y 33; DORA art. 17-19 | Redacción previa, DLP de salida, segmentación de fuentes y retención limitada | Matriz de fuentes, pruebas de extracción, configuración de retención, incidentes y cuasi incidentes |
| Poisoning de corpus o fine-tuning | NIS2 art. 21.2.d y e; ISO 27001 controles de integridad y cambios | Versionado, revisión dual, control de cambios y etiquetas de confianza | Histórico de cambios, hashes, aprobaciones y trazabilidad documental |
| Autorización insegura de herramientas/agentes | DORA art. 28-30; NIS2 art. 21 control de accesos | Credenciales separadas, alcance mínimo, validaciones deterministas y aprobaciones | Logs de ejecución, políticas IAM, inventario de herramientas, evidencias de SoD |
| Exceso de confianza del usuario | DORA art. 5 gobernanza; NIS2 art. 21 políticas y eficacia de medidas | Límites de automatización, clases de decisión y métricas de corrección humana | Procedimientos, formación, KPIs de reversión y excepciones |
| Dependencia de componentes vulnerables o terceros opacos | DORA art. 28; NIS2 art. 21.2.d | Inventario de terceros, gestión de vulnerabilidades, pruebas de resiliencia | Registro de proveedores TIC, SBOM/inventario, resultados de pruebas y cláusulas contractuales |
La tabla no pretende canonizar un único enfoque. Sirve para recordar algo mucho más simple: un riesgo de LLM solo está controlado cuando puedes unir cuatro piezas sin titubear —riesgo, obligación, control y evidencia—. Si una de esas piezas falta, la cobertura regulatoria se deshace enseguida.
Esta es una de esas raras ocasiones en las que una checklist sí aporta valor. No porque los auditores adoren las listas, sino porque los despliegues LLM fallan mucho en documentación verificable.
Si solo puedes reunir la mitad de esta lista, no pasa nada dramático de inmediato. Pero al menos ya sabes qué mitad de tu confianza estaba sostenida por esperanza.
Para entidades financieras en España, la combinación de DORA y despliegues LLM tiene una derivada muy concreta: la presión no viene solo del incidente consumado, sino de la capacidad de demostrar gobierno, trazabilidad y control de terceros antes de que ocurra nada visible. DORA es aplicable desde el 17 de enero de 2025. Eso significa que cualquier caso de uso LLM en procesos de atención, operaciones, fraude, soporte TI, continuidad o gestión documental debería estar ya incorporado al inventario de riesgo TIC y, si depende de terceros, al esquema de supervisión de proveedores.
En la práctica, veo cuatro puntos ciegos bastante españoles, por decirlo con cariño:
La conexión con supervisión financiera es evidente aunque no siempre explícita. Si un LLM participa en funciones críticas o importantes, el análisis de impacto operativo no puede quedarse en el proveedor principal del modelo. Debe incluir dependencias asociadas, recuperabilidad del servicio, capacidad de sustitución y controles de salida. Quien no haya empezado a tratar estos casos de uso como parte del riesgo TIC transversal se encontrará, más pronto que tarde, con una conversación incómoda entre CISO, cumplimiento, compras y negocio. Nadie disfruta de esas reuniones. Menos cuando ya hay una herramienta en producción y demasiados usuarios encantados con ella.
Hay una tendencia comprensible a buscar una solución única: un gateway de IA, un filtro mágico, una plataforma de observabilidad, un proveedor que “ya cumple”. Ojalá. La realidad es menos elegante. Los riesgos del OWASP Top 10 para LLM no se mitigan con una pieza aislada, sino con disciplina de arquitectura, IAM, logging, validación y gobierno de terceros.
Si tuviera que reducirlo a criterios de aprobación serios para producción, serían estos:
Si falta una de esas piezas, lo sensato no es prohibir toda IA generativa. Eso sería tan torpe como desplegarla sin control. Lo sensato es acotar el caso de uso al nivel de riesgo que realmente puedes gobernar. Un asistente de búsqueda documental con fuentes limitadas y sin capacidad de acción puede ser perfectamente razonable. Un agente semiautónomo con acceso amplio a sistemas, datos sensibles y proveedores externos exige otro nivel de rigor. La diferencia entre ambos no es marketing. Es supervivencia operativa.
OWASP ha hecho su parte al ordenar los fallos más probables. Ahora le toca a seguridad y cumplimiento hacer la suya: dejar de tratar los LLM como una categoría exótica y empezar a evaluarlos como lo que ya son en muchas organizaciones, una capa más de tecnología crítica con peculiaridades propias. La novedad técnica impresiona. El regulador, en cambio, suele hacer una pregunta bastante menos romántica: enséñeme el control y enséñeme la prueba.
Guía de referencia
Todo sobre DORA: artículos, obligaciones y plazos
Resumen semanal gratis
Suscríbete al resumen semanal y te avisamos de cada cambio en DORA: registro de proveedores ICT, resiliencia operativa y plazos clave.
¿Necesitas la checklist ya? Empieza un GAP Assessment DORA o descarga plantillas en el Marketplace.
DORA (Reglamento UE 2022/2554) aplica a entidades financieras de la UE (bancos, aseguradoras, gestoras, proveedores de servicios de pago, etc.) y a sus proveedores terceros de servicios TIC considerados críticos.
DORA es plenamente aplicable desde el 17 de enero de 2025. Las entidades deben tener implantado su marco de gestión del riesgo TIC, pruebas de resiliencia y la gestión de riesgo de terceros TIC.
Las entidades deben mantener un registro de información de todos los acuerdos contractuales con proveedores de servicios TIC, identificando los que soportan funciones críticas o importantes (art. 28).
Recursos oficiales
Descarga políticas, checklists y frameworks de cumplimiento elaborados por expertos en regulación Cyber IA.