Llegamos a ustedes gracias a:



Noticias

IBM acelera la recuperación de datos almacenados con unidades de memoria flash

 

[26/07/2011] Con la mira puesta en las necesidades de las organizaciones del futuro, un grupo de investigadores de IBM ha creado un sistema de almacenamiento capaz de leer diez mil millones de archivos en 43 minutos.
Este sistema superó con facilidad a la versión anterior, demostrada en Supercomputing 2007, que leía mil millones de archivos en tres horas.
Un factor clave para este incremento en el desempeño es el uso de la memoria flash rápida para almacenar los metadatos que el sistema de almacenamiento usa para localizar la información solicitada. Tradicionalmente, los repositorios de metadatos residen en el disco, acceso que demora las operaciones.
Si tenemos estos datos en un medio de almacenamiento rápido, entonces podemos ejecutar estas operaciones con mucha mayor rapidez, sostuvo Bruce Hillsberg, director de Sistemas de Almacenamiento de IBM Research Almaden, lugar donde se construyó el cluster. La capacidad de utilizar almacenamiento de estado sólido para las operaciones de metadata realmente nos permite ejecutar algunas de estas tareas administrativas más rápidamente de lo que podríamos si se ejecutaran en disco.
IBM prevé que sus clientes se enfrentarán a mucha mayor información en los próximos años.
En la medida en que los clientes tengan que almacenar y procesar grandes cantidades de datos durante largos períodos de tiempo, necesitarán formas eficientes para administrar esos datos, señaló Hillsberg.
Para la nueva demostración, IBM construyó un cluster de 10 servidores de ocho núcleos equipados con un total de 6,8 terabytes de memoria de estado sólido. IBM utilizó cuatro sistemas de almacenamiento de estado sólido 3025 de Violin Memory. El sistema resultante es capaz de leer archivos a una velocidad de casi 5GB/s (gigabytes por segundo).
El sistema utiliza una versión afinada del sistema de archivos GPFS de IBM versión 3.4. Originalmente desarrollado para sistemas de computación de alto rendimiento, GPFS es cada vez más relevante para otras aplicaciones empresariales intensivas en datos, señaló Hillsberg. GPFS permite a todos los núcleos del procesador leer y escribir datos en los discos en forma paralela, lo que puede mejorar de manera significativa la capacidad de respuesta del sistema de almacenamiento.
Según explicó Hillsberg, los sistemas de archivos actuales no son adecuados para gestionar datos de múltiples sistemas de almacenamiento como un único espacio de nombres. La demostración del 2007 mostró cómo un sistema de archivos paralelo como GPFS podría ser utilizado como base para sistemas de almacenamiento altamente escalables. Este nuevo trabajo demuestra cómo este sistema podría ser mejorado aún más con la adición de discos de estado sólido.
Los investigadores publicaron un white paper que describe la arquitectura a un nivel de detalle que podría ayudar a terceras partes a recrear sistemas similares.
IBM también puede plasmar estas ideas en sus propios productos, sostuvo Hillsberg. Trabajos de investigación previos de IBM en la construcción experimental de sistemas de estado sólido han llevado a la creación de software nuevo como IBM Easy Tier, que ayuda a los sistemas a balancear automáticamente los datos entre los discos de estado sólido y los discos regulares.
Creo que veremos salir cosas muy interesantes de esta investigación, indicó Hillsberg sobre la demostración.
IBM no está solo en su entusiasmo por el uso del almacenamiento de estado sólido para acelerar las operaciones. En la última edición mensual de la publicación Communications de la Association for Computing Machinery, un grupo de investigadores de la Universidad Carnegie Mellon e Intel Labs describió una arquitectura de servidor que combina procesadores de bajo costo con memoria flash, un diseño que podría acelerar significativamente las operaciones de sitios web intensivos en transacciones.
De manera similar al sistema desarrollado por IBM, la arquitectura FAWN desarrollada por los investigadores solo requiere una cantidad relativamente pequeña de memoria flash en la que los datos consultados con mayor frecuencia se pueden almacenar. Ellos señalaron que, aunque los discos de estado sólido pueden costar 10 veces más que los discos tradicionales, también pueden ofrecer un aumento de un 100% en su rendimiento.
La idea de crear servidores asistidos por memoria flash no está tan lejos. La tecnología ya existe, indicó Luiz André Barroso, ingeniero de Google que no ha estado involucrado en el desarrollo de la arquitectura FAWN.
Joab Jackson, IDG News Service