Llegamos a ustedes gracias a:



Noticias

Intel y Microsoft se unen para acelerar el cifrado homomórfico

[09/03/2021] Intel se ha asociado con Microsoft en el marco de un programa de la Agencia de Proyectos de Investigación Avanzada de Defensa (DARPA) de EE.UU. que tiene como objetivo desarrollar hardware y software para mejorar drásticamente el rendimiento del cifrado totalmente homomórfico (FHE). Como parte del programa, Intel desarrollará un acelerador de hardware que podría hacer que el aprendizaje automático sea práctico con datos siempre encriptados y que preserven la privacidad.

Si tiene éxito, el esfuerzo de varios años podría permitir a las organizaciones de sectores con estrictos requisitos de confidencialidad de datos, como la sanidad, las finanzas, la banca o la administración pública, compartir fácilmente datos sensibles con socios y servicios de terceros en nubes públicas sin el riesgo de exponerlos.

"Evaluaremos la plataforma en una serie de cargas de trabajo que abarcan el aprendizaje estadístico y el aprendizaje automático", explicó a CSO Rosario Cammarota, ingeniera principal de Intel Labs. "Y el objetivo de rendimiento será muy ambicioso. Ellos [DARPA] pretenden que el rendimiento de la aritmética mejore en más de cinco órdenes de magnitud en comparación con el rendimiento de la implementación del software FHE en las CPU actuales. Es algo muy importante, porque hoy en día no podemos entrenar modelos de aprendizaje automático con datos encriptados, pero esta plataforma, dentro de estos objetivos de rendimiento, sería capaz de realizar este tipo de entrenamiento".

Qué hace que el cifrado totalmente homomórfico sea atractivo

El cifrado totalmente homomórfico es una forma de criptografía que permite realizar operaciones matemáticas directamente sobre los datos cifrados (texto cifrado) sin necesidad de descifrarlos primero. El resultado del cálculo también está cifrado y solo puede acceder a él el propietario de los datos que tiene la clave privada. El resultado es el mismo que si se hubieran realizado las mismas operaciones con una versión no cifrada de los datos (texto plano).

El cifrado puede utilizarse para mantener la confidencialidad de los datos en diferentes estados: en reposo (almacenamiento), en tránsito (transmisión por la red) y en memoria (durante el procesamiento). La seguridad de los datos en memoria ha supuesto históricamente el mayor reto, y por eso se han desarrollado entornos de ejecución de confianza (TEE) en hardware como Intel SGX o ARM TrustZone. Estos enclaves seguros tienen su espacio de memoria separado del sistema operativo principal, y pueden utilizarse para realizar operaciones de forma segura sobre datos sensibles sin exponerlos directamente a los procesos que se ejecutan bajo el SO principal.

Sin embargo, estas soluciones tienen limitaciones. En primer lugar, plantean los mismos problemas de gestión de claves que el cifrado de datos en tránsito o en reposo: La clave secreta tiene que estar presente en el servidor o en el TEE donde se realiza el descifrado, y en el caso de la computación en nube, eso significa confiar en el operador de la nube. En segundo lugar, no abordan realmente la cuestión de la confianza y la confidencialidad en los casos en los que el propietario de los datos es solo el usuario de un servicio o aplicación que se ejecuta en la nube y no es el propietario del servicio o de la propia aplicación.

La propiedad más atractiva de FHE es que puede enviar datos encriptados a un servicio de terceros para que los procesen sin proporcionarles la clave de encriptación, por lo que básicamente obtiene el resultado de esos cálculos sin tener que confiar la confidencialidad de sus datos al proveedor del servicio.

Tomemos, por ejemplo, el caso de un servicio de análisis médico predictivo basado en la nube que utiliza el aprendizaje automático. FHE podría permitir a un centro sanitario utilizar dicho servicio para ayudar a los médicos a realizar mejores diagnósticos sin tener que exponer los datos protegidos de los pacientes. Del mismo modo, la tecnología podría utilizarse para realizar análisis de grandes conjuntos de datos que combinen datos públicos y privados. Por ejemplo, una empresa de desarrollo de medicamentos podría utilizar FHE para analizar de forma segura los datos de los pacientes que probaron tratamientos experimentales, pero no aceptaron formar parte de ensayos clínicos públicos como parte de un conjunto de datos más amplio que incluya datos de dichos ensayos. Esto podría hacerse utilizando un servicio de terceros que se ejecute en la nube.

Según Cammarota, los casos de uso pueden ampliarse aún más con el uso de la encriptación homomórfica de clave múltiple, una forma de FHE en la que varias partes combinan sus datos encriptados por separado en un conjunto, y luego el procesamiento se realiza en todo el conjunto de datos y el resultado solo es visible para las partes que proporcionaron los datos.

Estado actual de FHE

Aunque ya existen implementaciones de software de FHE y varias bibliotecas y kits de herramientas de grandes nombres de la industria como IBM y Microsoft, su rendimiento en las CPU actuales es pobre porque FHE tiene un problema inherente: la corrupción de datos. A diferencia de los esquemas de cifrado típicos que garantizan la integridad de los datos, FHE no lo hace, porque el objetivo es realizar cálculos que alteran el texto cifrado, afectando a su integridad. En términos criptográficos, FHE utiliza algoritmos que son maleables por diseño.

"Con cada cálculo homomórfico se genera una cierta cantidad de ruido -o error- que corrompe la representación de los datos cifrados", explica DARPA. "Una vez que esta acumulación de ruido alcanza un determinado punto, resulta imposible recuperar el texto plano original subyacente. Esencialmente, los datos que necesitan protección se han perdido. Las estructuras computacionales denominadas "bootstrapping" ayudan a resolver esta insostenible acumulación de ruido, reduciéndola a un nivel comparable al del texto plano original, pero que produce una enorme sobrecarga computacional para llevarla a cabo".

Este problema limita en gran medida las aplicaciones prácticas de FHE. Según Cammarota, la inferencia de aprendizaje automático es posible actualmente con algunas limitaciones, pero el entrenamiento de aprendizaje automático con datos de FHE está fuera de su alcance. Para solucionarlo, es necesario desarrollar nuevas técnicas para conseguir mejoras masivas en el rendimiento de las cargas de trabajo de FHE y por eso DARPA creó el programa de Protección de Datos en Entornos Virtuales (DPRIVE).

Intel se une a DPRIVE

El objetivo de Intel como parte del programa DPRIVE, que durará varios años, será desarrollar un acelerador de hardware para FHE en forma de circuito integrado específico para aplicaciones (ASIC). Pero antes de poder fabricar ese sistema en un chip (SoC), la primera fase del programa se centrará en la identificación de los componentes clave para acelerar la aritmética del cifrado totalmente homomórfico, afirmó Cammarota.

Este trabajo se realizará en colaboración con Microsoft, que planea probar la tecnología e incorporarla a sus ofertas en la nube para impulsar su adopción comercial. Tanto Microsoft como Intel son miembros del consorcio de estandarización del cifrado homomórfico formado por la industria, el gobierno y el mundo académico.

Los ASIC son circuitos integrados que suelen funcionar como periféricos y están diseñados y optimizados para una operación o tipo de operaciones concretas. Pueden lograr un rendimiento mucho mayor para tareas específicas que los chips de propósito general. Por ejemplo, los equipos de minería de bitcoins, que básicamente resuelven un problema matemático a cambio de una recompensa de bitcoins, utilizan ASICs en lugar de CPUs normales.

Dicho esto, algunas operaciones que antes requerían aceleradores de hardware se han integrado en las CPU de propósito general con el tiempo. Las unidades de coma flotante (FPU), también conocidas como coprocesadores matemáticos, solían implementarse por separado como complementos, pero ahora son una parte estándar de la mayoría de las CPU y GPU. Los aceleradores criptográficos independientes siguen siendo habituales, pero parte de su funcionalidad también se ha integrado en las CPU. Las nuevas instrucciones del estándar de cifrado avanzado de Intel (AES-NI) son un buen ejemplo de operación criptográfica acelerada por hardware que ahora es estándar en la mayoría de las CPU.

Es posible que, con el tiempo, la tecnología de aceleración por hardware de FHE que se desarrollará como parte de DARPA DPRIVE siga un camino similar, pero eso tiene que ser evaluado por las diferentes unidades de negocio de Intel, indicó Cammarota, señalando que varios equipos de la empresa están colaborando en este proyecto, incluyendo Intel Labs, que es la división de investigación, el grupo de plataforma de datos y el grupo de ingeniería de diseño.

Hacer que el cifrado totalmente homomórfico sea barato es también una forma de democratizar la tecnología. Eso es exactamente lo que hizo AES-NI con el cifrado AES, así que es completamente posible, agregó Cammarota.

Sin embargo, para lograr una adopción generalizada, también es importante que los esfuerzos de estandarización de este tipo de cifrado continúen y maduren en paralelo al desarrollo de la aceleración de hardware FHE. "Cuando se considera el cifrado homomórfico como tecnología de seguridad, es algo extraño", sostuvo Cammarota. "Por un lado, miras la carga de trabajo, y el hecho de que puedas computar sobre datos encriptados es bastante emocionante, porque puede construir nuevos modelos de negocio y puede realmente proteger sus activos ahora. Por otro lado, se trata de una tecnología criptográfica, por lo que, a la hora de desplegarla, la gente no solo se fijará en el entusiasmo, sino que se preguntará: ¿está estandarizada? ¿Podemos desplegarla de forma segura? ¿Sabemos cómo desplegarla de forma segura? Así que habrá una estrecha colaboración entre el resultado del programa [DPRIVE] y la evolución de la normalización".