PROTECCIÓN DATA

BLOG

El conocimiento es poder (Francis Bacon)

Blog
Compartir Facebook Twitter Linkedin
JAVIER CASAL TAVASCI

Aprendizaje federado para impulsar modelos de IA

La Agencia Española de Protección de Datos (AEPD) y el Supervisor Europeo de Protección de Datos (SEPD) acaban de publicar un informe conjunto en el que analizan el papel fundamental del Aprendizaje Federado (Federated Learning) como herramienta para impulsar y desarrollar modelos de inteligencia artificial más respetuosos con la protección de datos personales.

Originalmente, en el ámbito del Machine Learning, los datos y el proceso de aprendizaje estaban centralizados, es decir, los datos se almacenaban en un centro de datos específico donde se realizaba todo el entrenamiento del modelo. Sin embargo, a medida que los conjuntos de datos y la complejidad de los modelos crecieron, el proceso de aprendizaje centralizado se volvió muy costoso en términos de tiempo, capacidad de cálculo y almacenamiento para ser gestionado en una sola máquina.

Como respuesta a dichas limitaciones, los desarrolladores comenzaron a almacenar sus conjuntos de datos en servicios en la nube, optimizados para distribuir tanto los datos como el procesamiento entre múltiples máquinas. Esta arquitectura no solo redujo los costes operativos, sino que también permitió la implementación de técnicas avanzadas como el aprendizaje federado que facilita el entrenamiento colaborativo de modelos manteniendo los datos en su origen y mejorando la privacidad y la eficiencia del proceso.

El Aprendizaje Federado se alinea con los principios relativos al tratamiento de datos personales, como la minimización de datos y la limitación de la finalidad, al asegurar que la información permanece bajo el control del responsable del tratamiento y no se expone a terceros. Además, facilita el cumplimiento de la responsabilidad proactiva y la auditabilidad de los tratamientos.

Entre sus principales ventajas destacan las siguientes:

a) Los datos en bruto nunca salen de su ubicación original, lo que reduce significativamente el riesgo de brechas de seguridad

Al mantener los datos en su ubicación original se minimiza la exposición de la información. Cuando los datos no se transfieren a servidores centrales o a terceros se disminuye la posibilidad de que sean interceptados, robados o manipulados durante el proceso de transmisión. Al evitar el movimiento innecesario de datos, se fortalece la seguridad global del sistema y se cumple con el RGPD.

b) Al mantener los datos localizados, se reduce la superficie de ataque para posibles hackers

Los sistemas locales suelen estar bajo controles de seguridad específicos y personalizados, lo que permite una mejor gestión y monitoreo frente a amenazas. Esta estrategia contribuye a una defensa más robusta y focalizada y es que la superficie de ataque se ve reducida cuando los datos permanecen en su entorno original, se limita el número de accesos y las conexiones externas para procesarlos. 

c) La transferencia de datos reducida se traduce en ahorro de ancho de banda y reducción de latencia en el entrenamiento del modelo

Mover grandes volúmenes de datos entre diferentes ubicaciones consume recursos como el ancho de banda de banda y el tiempo de procesamiento. Al minimizar la necesidad de transferir datos en bruto, se optimizan los recursos disponibles, lo que se traduce en beneficios prácticos (reducción de costos y de la latencia en el entrenamiento del modelo de IA).

Conclusión

El aprendizaje federado es una tecnología de doble uso, por un lado, protege la privacidad y, por otro, impulsa la economía digital, haciendo posible la colaboración entre entidades en el entrenamiento de modelos de IA, incluso cuando los datos son estratégicos, sensibles o confidenciales. No obstante, es necesario implementar medidas de seguridad integrales en todo el ecosistema y garantizar la calidad de los datos para evitar sesgos.

Para maximizar el potencial del aprendizaje federado, el informe conjunto de la AEPD y el SEPD viene a enfatizar la importancia de adoptar un enfoque de protección de datos desde el diseño. Esto implica desarrollar soluciones que reduzcan los riesgos para las personas, faciliten el acceso a los datos y refuercen la confianza necesaria para que distintos actores participen en la economía digital.

Aunque el aprendizaje federado mejora considerablemente la privacidad, no garantiza por sí solo una protección total. Suele complementarse con técnicas adicionales, como la privacidad diferencial y la agregación segura, que proporcionan garantías de privacidad más robustas.

No se pierda nuestro podcast sobre el artículo

 

 

error: El contenido del blog está protegido por derechos de propiedad intelectual mediante su registro en Safe Creative. Queda prohibida la reproducción, distribución, transformación, transcripción, almacenamiento o recuperación total o parcial de este contenido, sin el permiso previa y expreso del titular de los derechos. La infracción de los derechos puede constituir un delito contra la propiedad intelectual (artículo 270 y ss. del CP). Para requerir la autorización pueden dirigirse al titular enviando un correo electrónico a info@protecciondata.es