Llegamos a ustedes gracias a:



Reportajes y análisis

¿Qué preguntar a la hora de elegir una nueva plataforma de almacenamiento?

[12/04/2012] A nadie le gusta remplazar cosas. Pero tarde o temprano tendrá que comprar cosas nuevas para mejorar o aumentar su infraestructura de almacenamiento existente -y cada vez que lo haga necesitará educarse sobre las diversas opciones, como si nunca hubiera visto antes una SAN. Así de rápido cambia la tecnología.
Los que compran nuevos productos de almacenamiento basados únicamente en las listas de funciones, rápidas demostraciones de mesa, y comparaciones de costos, toman un gran riesgo. Aunque es imposible prever todos los riesgos, el truco para evitar una elección desastrosa está en saber hacer las preguntas correctas -y dónde obtener las respuestas.
En última instancia, las fuentes de información más valiosas son los clientes que ya han implementado la tecnología en cuestión. Aquí hay algunas preguntas que puede hacer para llegar rápidamente al corazón de lo que necesita saber.
Todo es sobre el software
Los elementos básicos que forman el hardware de almacenamiento que probablemente esté considerando comprar hoy, han alcanzado en gran medida el estado de productos básicos. Hay muy poca variación en el disco actual o hardware de interfase de disco utilizado en todo el mercado -el disco SAS de 15K 6Gbps de un proveedor va a ser muy similar, si no es idéntico, al de otro. También es cada vez más común ver controladores de hardware basados en los mismos procesadores de uso general Intel y AMD, que encontrará en los servidores en lugar de los procesadores altamente personalizados comunes en generaciones anteriores de almacenamiento.
La amplia disponibilidad de discos rápidos y hardware de servidor de alto rendimiento, han hecho posible que incluso las nuevas empresas de almacenamiento más verdes tienten juntas una matriz de almacenamiento basada en Linux o BSD, que competirá con los grandes nombres en términos de rendimiento de disco en bruto. En esencia, casi ninguno puede manejar juntos a muchos SLC SSD off-the-shelf, discos SAS de 15K, y una placa base multi-núcleo de Intel, para formar una matriz de almacenamiento con un serio potencial de rendimiento.
La diferenciación real entre las opciones de almacenamiento disponibles en el mercado hoy en día es casi totalmente derivada del software que se ejecuta en los procesadores de almacenamiento. Ahí es donde se ven implementados los elementos de cambio, tales como instantáneas, el aprovisionamiento delgado, la deduplicación, y la jerarquización automatizada. La calidad y la fiabilidad de las características del software son las que separan el trigo de la paja.
Por desgracia, es casi imposible obtener una impresión del software sin llegar a utilizarlo durante mucho tiempo. Si bien es cierto que puede aprender mucho de una demostración de mesa, mayormente saldrá con impresiones de la interfase de usuario y la facilidad de uso -no de lo que realmente sucede cuando marque las casillas y empiece a hacer cambios. Estos suelen ser los detalles que querrá conocer cuando busque referencias.
Las instantáneas
Cuando la tecnología de snapshots o instantáneas basadas en la matriz comenzó a aparecer en escena, había una gran cantidad de variación entre las implementaciones de los vendedores. Hoy en día, la mayoría de las plataformas de almacenamiento utilizan un enfoque virtualizado para trazar un mapa de un LUN de almacenamiento presentado en el disco físico subyacente, que es en realidad donde está almacenando ese LUN -una metodología que se presta a la fácil creación de instantáneas de un punto en el tiempo y la clonación/reversión de esas instantáneas. A pesar de que esa tecnología de instantáneas es vieja para estos días, todavía encontrará sorprendentes variaciones entre las implementaciones de los proveedores.
Estas variaciones se basan principalmente en un trade-off entre la eficiencia de la capacidad de las instantáneas y la cantidad de procesamiento de gastos generales necesarios para realizar su seguimiento. Por ejemplo, una matriz determinada puede ser capaz de crear y realizar un seguimiento de un gran número de instantáneas con casi ningún impacto perceptible en el rendimiento del almacenamiento, pero los cambios de disco a nivel de bloque que comprenden esas instantáneas pueden ser rastreados en bloques muy grandes y, como resultado, consumen una gran cantidad de espacio de almacenamiento.
A pesar de su casi ubicuidad en las plataformas de almacenamiento de la empresa, es importante indagar en el meollo de la cuestión de cómo trabajan las instantáneas en la plataforma que está considerando. Por todos los medios, utilícelas -pueden ser una enorme ventaja cuando son aprovechadas adecuadamente. ¿La utilización de las instantáneas tiene un impacto en el rendimiento del almacenamiento? ¿Qué tan eficientes son las instantáneas cuando se aplican a los datos que cambian lentamente? ¿Qué hay de las cargas de trabajo con grandes cantidades de escrituras aleatorias muy pequeñas, tales como bases de datos y servidores de correo?
Aprovisionamiento delgado
El aprovisionamiento delgado es otra característica posible en gran parte por la virtualización del almacenamiento. En lugar de comprometer toda la capacidad de un volumen, el hardware de almacenamiento puede realizar un seguimiento de qué bloques de un volumen no se han utilizado todavía y mantenerlos libres de otros volúmenes -esencialmente permitiéndole asignar sus recursos de almacenamiento.
El santo grial del aprovisionamiento delgado es hacer que la cantidad de almacenamiento utilizable en la matriz de almacenamiento coincida exactamente con la cantidad de datos reales que se están almacenando en sus servidores; por lo que un volumen NTFS de 40GB con 12GB de datos, solo consume 12GB de la SAN. A pesar de que parece sencillo, en la práctica, es todo lo contrario. El truco viene cuando se crea un archivo dentro de ese disco, a continuación, elimínelo. ¿La matriz de almacenamiento es consciente de lo que ha pasado? ¿Puede liberar ese espacio después? ¿Usted necesita ejecutar un proceso manual para permitir que eso suceda? Si es así, ¿es fácil mantenerse en la cima?
Jerarquización automatizada
A medida que las organizaciones grandes y pequeñas tratan con datos que están creciendo a tasas enormes, la capacidad de aprovechar con eficacia las enormes capacidades presentes en SATA de bajo rendimiento y discos NL-SAS se ha convertido en algo muy importante. El problema es que mientras que usted puede ser capaz de comprar un estante de discos de 3TB y presentar una enorme cantidad de capacidad a precios muy bajos, el rendimiento relativamente bajo de esos discos los hace una mala elección para muchas cargas de trabajo transaccionales, tales como bases de datos. Si bien se pueden mezclar en discos SAS/FC de mayor rendimiento -o incluso SSD- para cargas de trabajo más exigentes, esos recursos tienen un costo mucho más alto. Sacar el máximo partido de los recursos de alto rendimiento a altas, medias y bajas capacidades sin necesidad de mucha supervisión de la gestión es cada vez más importante.
Ahí es donde entra en juego la jerarquización automatizada. En un mundo perfecto, el software de la plataforma de almacenamiento de datos siente qué datos, bajo el nivel de bloque, se están utilizando con regularidad y los mantiene en discos más rápidos. Mientras tanto, los datos que se utilizan con menos frecuencia se migran a un disco más lento. Lo ideal sería que todo esto se lleve a cabo sin necesidad de que el administrador de almacenamiento haga otra cosa que no sea vigilar las capacidades y los promedios de carga en los distintos niveles y agregue recursos a cada uno a medida que se requiera.
Como se puede imaginar, un algoritmo de jerarquización pobremente construido puede hacer de esta característica una maldición o una bendición. Obtener una idea de cómo es que los clientes existentes están utilizando estas características y que tan bien trabajan es crítico si espera confiar en ellas. ¿Qué tan eficiente es la jerarquización? ¿Puedo imaginar que un par de discos SSD de 200GB son una extensión de la caché de mi matriz de almacenamiento, o voy a tener que desplegar una gran cantidad de discos SSD para tener un primer nivel eficaz? ¿Cuánto tarda el algoritmo de jerarquización en reaccionar a las características de cargas de trabajo cambiantes? ¿Los datos migran en una base de segundo a segundo, o los promedios de carga utilizados para determinar dónde viven los datos son más largos?
Búsqueda de referencias
Después de conocer las preguntas que quiere hacer, el siguiente paso es encontrar a la gente a quién debe preguntárselas. La mayoría de proveedores de almacenamiento estarán encantados de organizar una llamada de referencia con un cliente existente, pero a menudo se dará cuenta de que estas referencias son parciales, hasta cierto punto. Por el contrario, lanzar esas preguntas en un foro en línea por lo general sirve para exponer las profundas convicciones casi religiosas que tienen algunas personas sobre el proveedor de almacenamiento que podría estar considerando -y no tiene manera de saber si esas personas han utilizado o no el hardware del que está hablando.
En cambio, las palabras salidas directamente de la boca suelen ser la mejor manera de obtener información útil e imparcial. Si conoce a alguien personalmente, eso es genial. Si no lo hace, considere el uso de las oportunidades presentadas por las convenciones de almacenamiento para localizar a los usuarios existentes y ver lo que tienen que decir. A menudo me he encontrado con que, a pesar de no ser una convención de almacenamiento, VMworld, y diversas reuniones VMUG pueden ser excelentes lugares para hacer esto a medida que las personas que aprovechan la virtualización de servidores casi siempre tienen una SAN enviada justo al lado de ella.
No importa lo que haga o dónde obtenga su información, no se conforme con una rápida demostración y una pila de revistas de marketing cuando toma las decisiones de compra sobre el almacenamiento primario. Si se encuentra con personas que utilizan el hardware, y le cuentan lo que les gustó y lo que les decepcionó, estará mucho más seguro en su decisión y más feliz con los resultados.
Matt Prigge, InfoWorld (EE.UU)