Saltar al contenido

Artículo

31 octubre 2022

Federated learning: la herramienta para desarrollar modelos de inteligencia artificial respetando la privacidad

Cerebro
También puedes escuchar este post en audio, ¡dale al play!
La inteligencia artificial evoluciona rápidamente por los avances en técnicas de aprendizaje automático impulsadas por el aumento de los recursos de computación y almacenamiento, la actividad de la comunidad investigadora y la capacidad de generar los contenidos, que es la materia prima fundamental para los modelos de IA de clasificación y predicción.

Hasta ahora, el proceso de generación y entrenamiento de modelos se basa en la fuerza bruta: se necesitan grandes volúmenes de datos preprocesados que se consiguen utilizando mano de obra humana y son precisas muchas horas de procesamiento para entrenar el modelo. Este proceso de aprendizaje es muy costoso y se realiza centralizadamente, utilizando una única máquina con hardware especializado y acceso a toda la información.

Sin embargo, todos los sistemas centralizados terminan encontrando su techo. Se hace así necesario hallar soluciones distribuidas para seguir escalando. Esto implica un salto en complejidad como sucede en otras tecnologías como blockchain.

Aunque las mejoras en computación y almacenamiento han sido claves, más importante aún es la capacidad de obtener la información. A nivel privado, las compañías han recogido datos generados por los usuarios (imágenes, textos, localizaciones…) a cambio de darles acceso a servicios gratuitos de alto valor (rutas optimizadas, contenidos clasificados, buscadores inteligentes…).

Todo esto está cambiando. Los organismos y los usuarios están más concienciados sobre el valor de su información y privacidad. Es preciso realizar cambios porque se produce un choque de intereses entre la necesidad de recopilar información para construir nuevos servicios y la oposición que empiezan a hacer los usuarios a compartirla, además de las regulaciones sobre la gestión de datos. Esto requiere encontrar alternativas para realizar modelos de IA.

Aquí surgen nuevas aproximaciones para desarrollar modelos de aprendizaje automático sin comprometer la privacidad de la información:

Tecnologías Privacy-Enhancing Technologies (PET): generan algoritmos capaces de obtener resultados con información encriptada casi de la misma forma que sin encriptar. Los usuarios comparten una versión encriptada de sus datos.

Procesamiento en el origen: la información nunca abandona el dispositivo de origen (móviles o edge con capacidad), formando parte activa en la generación del modelo.

En esta segunda categoría, aparece el federated learning, una técnica de aprendizaje automático en la que varios elementos cliente, como dispositivos edge o móviles, trabajan de forma colaborativa para entrenar un modelo bajo la orquestación de un servidor central en el que los datos del entrenamiento permanecen en el dispositivo propietario u origen de la información.

Los primeros casos de aplicación del federated learning son los relacionados con la salud para recoger datos sensibles de pacientes a través de dispositivos como smartwatches, teléfonos o sensores específicos, y entrenar localmente modelos como los de predicción de enfermedades, compartiendo solo los resultados y no los datos.

En el sector fintech, este enfoque ayudaría a reducir el fraude al aprender localmente el comportamiento del usuario y detectar anomalías. Además, en el ámbito industrial, pueden aparecer muchos casos de uso vinculados con el comportamiento de las máquinas como el mantenimiento predictivo. Los fabricantes también podrán crear mejores servicios que beneficiarán a sus clientes sin necesidad de compartir información entre ellos.

La técnica de federated learning supone una mejora en eficacia, ya que, bajo un modelo centralizado, los dispositivos envían información al servidor para realizar el aprendizaje, pudiendo suponer un problema de rendimiento y latencia. Pero el federated learning tiene sus desafíos. A medida que se resuelvan, se desencadenará un gran potencial al desbloquearse numerosos usos de la IA que están atascados por no poder acceder a la información.

 
Leopoldo Colorado
Leopoldo Colorado

Head of Cloud and LowCode Services en Babel.

logo linkedin compartir en Linkedin Contacto

Otros artículos destacados