Llegamos a ustedes gracias a:



Reportajes y análisis

Omita el almacenamiento de datos por niveles

Una infraestructura de SSD puede acercarse al costo de las matrices de disco duro.

[08/12/2011] Las empresas desearían poder saltarse el tener que usar arquitectura de almacenamiento por niveles y pasar directamente a una arquitectura completa de SDD, según un nuevo informe de Forrester Research.
En el informe, Forrester afirma que mientras que los SDD de clase empresarial son considerablemente más caros que los discos duros, la deduplicación puede reducir los requisitos de capacidad, haciendo que la memoria flash sea una alternativa más rentable y con un mejor rendimiento.
"Si el costo no fuera problema, usted pondría todos sus datos en media basada en memorias flash SSD", señala el informe. "No solo son mucho más rápidas que los discos giratorios de la actualidad, sino que además no tiene partes móviles, consume menos energía, y elimina el tiempo de búsqueda y el rendimiento variable -y no hay forma de que las unidades de disco se pongan al día en cualquiera de estas áreas".
Los SSD ahora se utilizan como un nivel más alto de almacenamiento en dispositivos de almacenamiento externo, junto con una combinación de diferentes unidades de disco duro, tales como SATA de alta capacidad y unidades SAS y Fibre Channel de menor capacidad, pero de mayor rendimiento. La idea detrás de las infraestructuras en niveles es poner los datos más visitados en las unidades de más alto rendimiento, migrando los datos de uso menos frecuente hacia unidades de alta capacidad pero de bajo costo.
Sin embargo, los principales proveedores de almacenamiento de matrices tienen niveles "unidades flash a medida" en sus colecciones existentes de discos, que pueden traducirse en cuellos de botella de I/O. También significa que los administradores deben conocer qué datos se ponen en el SSD, o confiar en el todavía incipiente software automatizado de jerarquización de datos.
Altos costos, problemas de gestión
De acuerdo a Forrester, las SSD pueden ser hasta 10 veces más caras que los discos duros. Otras empresas de investigación indican que la disparidad entre los costos es mucho más alta. Una investigación de mercado de otras firmas como iSuppli y Objective-Anaysis muestra que el promedio de precios de las SDD es de alrededor de 17 dólares por gigabyte, aunque se espera que baje a 12 dólares por gigabyte el próximo año, y caiga a cinco dólares por gigabyte para el año 2015.
Mientras que las arquitecturas de niveles pueden ofrecer un mejor rendimiento y mayores tasas de utilización de disco, el informe de Forrester indica que también crea problemas de organización en la gestión de datos.
Por ejemplo, muchos departamentos corporativos de TI no utilizan herramientas avanzadas de análisis del rendimiento del almacenamiento, por lo que tienen que determinar manualmente qué datos requieren mayor rendimiento, y moverlos manualmente hacia una arquitectura de niveles. Además, los "datos calientes", o los que son utilizados con mayor frecuencia, cambian en el tiempo. Eso significa que el personal de TI estará ocupado moviendo los datos a medida que cambien.
Si bien existe software automatizado por niveles, como el almacenamiento Fluid Data de Dell Compellent, y el software Fully Automated Storage Tiering (FAST) de EMC, adaptar los sistemas existentes que no fueron diseñados para el movimiento de los sub volúmenes de datos "es un desafío importante", según Forrester.
"La eficiencia y la eficacia de estas soluciones varían. También hay una penalización inherente al movimiento constante", señala el informe. "Finalmente, la información utilizada para tomar decisiones mira hacia atrás -porque una pieza de información que no ha sido muy requerida podría serlo en el futuro".
Ingrese la deduplicación de datos en línea
Sin embargo, en la actualidad una nueva arquitectura que hace olas es una infraestructura completa de SSD, donde se utiliza la deduplicación de datos en línea para reducir los requisitos de backend, mediante la eliminación de datos redundantes establecidos antes de que sean almacenados.
Esto es aún más eficaz que la deduplicación de datos a través de los discos y las SSD porque el excedente del rendimiento y la consistencia de la latencia a través de todos los datos en una solución de solo SSD, permite que la deduplicación en línea y la rehidratación de los datos sean más rápidas que en un disco híbrido y en un sistema de flash, señala Forrester.
Hay una gran diferencia entre el flash de una sola celda (SLC) NAND de clase empresarial y el flash mutli celda (MLC) en términos de rendimiento, durabilidad y precio. SLC NAND almacena un solo bit de datos por celda, en comparación con los dos o tres bits por celda en MLC. Esto se traduce en que SLC tiene un rendimiento nativo superior y una vida útil de diez veces más que MLC.
En la actualidad, el precio de la memoria flash NAND en un factor de forma de SSD es de aproximadamente nueve dólares por gigabyte para SLC flash y cerca de tres dólares por cada gigabyte de flash MLC. Una nueva clase de MLC, llamada MLC empresarial o eMLC, puede soportar hasta 30 veces más escritura que la tecnología MLC para el consumidor, pero también cuesta alrededor de un 20% más.
En comparación, la sunidades Fibre Channel o SAS cuestan entre 50 y 60 centavos por gigabyte.
También hay tarjetas de memoria flash NAND PCIe, como las vendidos por Fusion-io, Texas Memory Systems, Micron o Virident Systems. Las tarjetas de memoria flash se pueden utilizar por sí mismas en todas las matrices flash en los servidores de aplicaciones propias. Si bien los precios pueden estar por los cielos, lo mismo pasa con el rendimiento -gracias a la interconexión de mayor velocidad y a la proximidad de la memoria flash con los procesadores centrales.
El reporte de Forrester se centra en las opciones de SSD solo tres proveedores: Nimbus Data Systems, Pure Storage y SolidFire.
Mientras que otros proveedores ofrecen matrices SDD, no vienen con deduplicación en línea, por lo que no se incluyeron en el estudio, de acuerdo con el analista de Forrester y autor principal del informe, Andrew Reichman.
De acuerdo con Forrester, Nimbus ofrece soporte de protocolo más amplio, permitiendo que los usuarios se conecten con sus controladores a través de Fibre Channel, Gigabit Ethernet o 10GbE iSCSI, CIFS, NFS o por InfiniBand directa.
Recientemente, eBay lanzó una matriz Nimbus SSD de 100TB para hacer frente a los problemas con su cuello de botella de almacenamiento NAS y SAN. La matriz Nimbus S-Class redujo las necesidades de espacio en rack de eBay en un 50%, y redujo el uso de energía en un 78%. Lo más importante es que el rendimiento de la SSD redujo el tiempo que tarda eBay para traer una nueva máquina virtual en línea de 45 minutos a cinco minutos.
La arquitectura de Nimbus se basa en dos controladores basados en x86 que soportan hasta 23 2U (3,5 pulgadas de alto) servidores por grupo, llenos de eMLC flash. El sistema puede almacenar hasta 250TB. La deduplicación es opcional. Nimbus cotiza sus productos de acuerdo a los terabytes - cobra 10 mil dólares por terabyte utilizable.
Pure Storage también es un sistema de controlador dual que escala a 22TB, aunque el vendedor tiene planes para aumentar el número de controladores y la capacidad. Pure Storage es considerado una opción de alta disponibilidad, ya que sus dos controladores están activos. La compresión en línea y la deduplicación del sistema siempre están encendidas y trabajan hasta a 512 bytes. Sobre la base de cinco dólares por gigabyte como precio al por menor, una matriz de 22TB se vendería en 110 mil dólares.
Por último, SolidFire planea salir al mercado en enero con una escalada de productos de almacenamiento en clúster llenos de flash MLC. Se espera que el hardware tenga duplicación y compresión, así como aprovisionamiento estrecho. El aprovisionamiento estrecho permite que el sistema pueda ofrecer la capacidad de los servidores de aplicaciones sobre una base necesaria, en comparación con el enfoque más tradicional de sobre aprovisionamiento. El sistema, que ofrecerá una calidad de servicio garantizada, solo utiliza el protocolo de transferencia de iSCSI con el fin de mantener los precios bajos, de acuerdo con Forrester. Sin embargo, se espera que el sistema escale a 1.000TB, o 1 petabyte de tamaño.
En su informe, Forrester advierte que las matrices de todas las SSD a los que hace referencia son relativamente nuevas en el mercado (este año o el año pasado) y necesitan del escrutinio por parte de los usuarios potenciales para encontrarles deficiencias, tales como la falta de instantáneas de datos, o la replicación y problemas de compatibilidad de aplicaciones . Una infraestructura de almacenamiento SSD depende en gran medida de la eficacia de la deduplicación.
"Aunque la rentabilidad proviene tanto de la caída de los precios del flash y el uso de versiones más baratas, no puede acercarse a los costos de disco sin permitir una mejor deduplicación de datos", señala Forrester.
La mejor capacidad de deduplicación requiere suficiente capacidad de CPU para hacer el proceso en línea, sin disminuir el rendimiento; un algoritmo efectivo de deduplicación; y de datos, como correos electrónicos y otros documentos que se presten a la reducción de datos.
"Mientras que la deduplicación puede hacer que la arquitectura de SSD esté más cercana al costo del disco, queda por ver si esto puede ser una alternativa viable a los sistemas basados en disco", añade Reichman.
Lucas Mearian, Computerworld (EE.UU.)