Llegamos a ustedes gracias a:



Reportajes y análisis

¿Está considerando RAID de hardware?

Esto es lo que necesita saber

[11/01/2016] Es hora de un cuestionario: ¿Qué es lo más importante en su entorno informático? ¿Es el tamaño de la pantalla conectada? ¿La velocidad de la CPU? ¿La cantidad de memoria? ¿El tamaño del disco duro? ¿La velocidad y la memoria de la tarjeta gráfica? ¿La conectividad de red?

Si bien todos eso puede parecer importante, yo diría que lo más importante en su entorno informático no es ninguna de esas cosas. De hecho, no es nada que se pueda tocar o ver directamente. Son sus datos. Ya sea que los datos sean fotografías o documentos de texto o código, o dibujos CAD en 3D o ilustraciones digitales, sus datos son lo verdaderamente importante. Todo lo demás es hardware, y es reemplazado fácilmente. Sus datos son irremplazables. Es por eso que debe tener un plan de copia de seguridad, ¿no?

Pero tener una copia de seguridad no resuelve todos los problemas: Si una unidad muere, el proceso de sustitución y la restauración de la copia de seguridad puede llevar mucho tiempo. Si utiliza su equipo para su sustento, este tiempo de inactividad puede ser costoso. Restaurar las copias de seguridad y probar los datos restaurados también es un asunto tedioso.

Los problemas con las copias de seguridad empeoran aún más a medida que tiene más y más datos: cuantos más datos tenga, más tiempo se requiere para restaurarlos cuando falla una unidad.

Big Data también causa problemas

Además de las cuestiones de restauración, si tiene muchos datos esparcidos en uno o más discos duros internos y externos, ya sabe lo complicado que resulta almacenar gran cantidad de datos. El espacio en el escritorio, los adaptadores de corriente, y los conectores para las unidades externas son confusos. Los planes de copia de seguridad son confusos. Decidir qué almacenar y dónde es confuso. Reemplazar una unidad externa es confuso. La restauración a partir de una copia de seguridad es confusa. Migrar a un nuevo equipo es confuso.

Lo anterior me describe a la perfección, al menos a la versión reciente de mí: tengo alrededor de 5TB de datos, y hasta hace poco, tenía un total de tres unidades externas y una interna para almacenar todo. Sí, ya sé que ahora hay unidades de 6TB, pero cuando sus datos se acumulan con el tiempo, añade unidades según sea necesario, lo que lleva a una solución de almacenamiento ineficiente. Después de años de hacerlo de esta manera, estaba harto.

Así que me busqué una solución a todos estos problemas. En particular, quería una solución de almacenamiento que pueda:

  • Evitar la pérdida de datos (lo mejor posible)
  • Reducir al mínimo el tiempo de inactividad en caso de falla del disco
  • Proporcionar acceso rápido a datos
  • Tener mucho espacio para el crecimiento futuro
  • Facilitar el proceso de actualización en la compra de una nueva computadora

Con esos objetivos en mente, después de un gran trabajo de investigación, elegí una solución RAID basado en hardware: He reemplazado varias unidades externas con una unidad LaCie 5big Thunderbolt 2 utilizando RAID 10. (Si es usuario de RAID, omita los siguientes detalles y vaya directo a los pros y contras.)

Una breve introducción a RAID

RAID es un acrónimo de Redundant Array of Independent Disks (matriz redundante de discos independientes) que es un método de almacenamiento que combina varios discos físicos en una unidad virtual. Una configuración RAID puede ser más rápida que un solo disco, y proporcionar protección ante la falla del disco que no obtiene con un solo disco. Pero decidir cómo implementar RAID puede ser un proceso complicado.

Hardware vs software RAID

Lo primero que tuve que decidir fue entre hardware versus software RAID. Un hardware RAID es una computadora independiente que ejecuta RAID. Conecte la caja RAID para Mac, instale el software que permite que el sistema operativo le hable a la caja, y ya está.

Un software RAID es uno que es administrado por su equipo, a pesar de que los discos pueden (y normalmente estarán) en una caja externa.

Pero, ¿cuál es el mejor? El software RAID es más fácil y mucho más barato; el hardware RAID es potente pero más caro. Esta tabla resume las principales diferencias entre hardware y software RAID. En pocas palabras, si tiene los fondos, hardware RAID es una mejor solución. Debido a que invertí a largo plazo, elegí la ruta del hardware RAID.

Niveles de RAID

La otra decisión clave es qué nivel de RAID usar, pero para entender los niveles de RAID, lo que necesita saber es un poco más acerca de cómo un RAID almacena los datos en sus unidades.

Las RAIDs pueden utilizar una combinación de creación de bandas (almacenamiento de datos a través de múltiples discos), reflejado (duplicación de un disco a otro), y paridad (que permite la reconstrucción de la unidad a través de la redundancia). Los discos con bandas son muy rápidos, los discos reflejados son redundantes, y la paridad ayuda a recuperar el contenido perdido de discos con bandas o reflejados.

Todas estas configuraciones se mezclan en algo que se llama niveles RAID estándar, que es bueno saber si está teniendo problemas para dormir por la noche. Los niveles más básicos son RAID 0, que separa datos a través de los discos para tener velocidad sin ninguna redundancia y RAID 1, que refleja datos a través de los discos para tener redundancia.

Sin embargo, debido a que quería seguridad y protección, decidí crear un RAID anidado, es decir, uno que utiliza una combinación de los niveles normales. Opté por usar RAID 1 + 0, o solo RAID 10. RAID 10 requiere cuatro unidades, donde los primeros pares están reflejados (RAID 1), a continuación, y luego se dividen (RAID 0). (Tenga en cuenta que para un determinado nivel de RAID (anidado o no), el hardware que utiliza debe ser compatible.)

Esta imagen puede ayudarle a entender la configuración - o puede hacer girar su cabeza.

RAID 10 combina espejos (RAID 1) con franjas (RAID 0) para una matriz redundante rápida.
RAID

El resultado final es que el RAID 10 es rápido (ya que los datos se escriben en varias unidades) y redundante (porque los datos se reflejan). En uno de cuatro discos RAID 10 matriz, dos discos pueden fallar a la vez sin perder la matriz -siempre y cuando no sean una unidad reflejada y su espejo (es decir, el disco 0 y el disco 1 en la imagen). La combinación de acceso rápido, la redundancia, y el apoyo a dos fallas de la unidad a la vez es por lo que decidí utilizar RAID 10.

Pros y contras

He utilizado mi RAID por alrededor de un año, que me ha dado una buena cantidad de tiempo para aprender los pros y los contras de mi configuración. En primer lugar, las partes buenas.

Redundancia de datos: Con una configuración de RAID reflejado, sé que mis datos principales están escritos dos veces, y me da la protección contra una falla del disco. (Antes de que todo el mundo empiece a gritar, ¡sí, RAID no es una copia de seguridad! Todo lo de mi RAID también se copia en unidades externas extraíbles.)

En este sentido, mi RAID se ha desempeñado admirablemente: He tenido una falla del disco, y en esencia ni siquiera lo he notado. Se me informó al respecto, pero la unidad se sustituye en sí (ver más abajo), y no he perdido ningún dato, ni he perdido mi tiempo restaurando desde una copia de seguridad.

Fácil recuperación de fallo del disco: La caja RAID 5Big que elegí tiene cinco unidades. Cuatro se utilizan activamente en el RAID, y la quinta es un "repuesto de emergencia" que sustituirá automáticamente una unidad que ha fallado. Por suerte -o por desgracia, dependiendo de su perspectiva- tuve la oportunidad de ver esto en acción, ya que tenía un disco muerto en mi propiedad.

Cuando eso sucedió, recibí una notificación del RAID, y me fui a la página web de gestión del dispositivo RAID. Allí me di cuenta de que, de hecho, el repuesto de emergencia había sido cambiado en la matriz, y estaba en proceso de reconstrucción.

Después de que muere un disco, el repuesto dinámico se añade automáticamente a la matriz y se reconstruye.
RAID

Para sustituir la unidad muerta, solo saqué e inserté la nueva unidad, todo sin necesidad de apagar el equipo. La unidad que acababa de agregar se convirtió en el nuevo repuesto. Y puesto que la primera unidad murió, no he tenido otras fallas de la unidad. No es más fácil que la recuperación de errores.

Velocidad: Mi caja RAID 10 tiene puntos de referencia de aproximadamente al doble de velocidad que una unidad USB 3, que es lo que estaría utilizando en su lugar. Es bastante lejos de la velocidad del SSD interno, por supuesto -pero de nuevo, no puedo almacenar más de 5TB de datos en el SSD interno.

Utilizando la prueba de velocidad de disco de Blackmagic, aquí está lo que encontré para cada unidad:

SSD USB3 RAID
Tasa de lectura de disco 720,60 148,10 287,40
Tasa de escritura de disco 615,30 147,00 264,60
Datos en MB/seg

Aunque no es tan rápido como el SSD, el RAID es más que suficiente para mi uso general. Llevo casi todo en el RAID; solo las aplicaciones más utilizadas y algunos archivos de trabajo residen en el SSD.

Espacio para la expansión: Mi caja RAID tiene una capacidad formateada de 8TB; con mis necesidades de almacenamiento actuales, todavía tengo más de 4TB de espacio para el crecimiento futuro. En algún momento, si eso se convierte en limitante, debería ser posible intercambiar las unidades de 4TB en mi caja con las unidades de 6TB, lo que me daría 12TB de capacidad. Si hasta eso se convierte en limitante, podría cambiar a otro nivel RAID que ofrece más capacidad de almacenamiento (a expensas de algo de velocidad). En resumen, mi caja RAID debe durar fácilmente siempre que la necesite, sin llenarse.

Esto en cuanto a las cosas buenas. ¿Qué pasa con lo no tan bueno?

Caro: Las soluciones RAID basadas en hardware pueden ser costosas, y yo elegí una gran caja con un precio grande - puede comprar una iMac de gama media con pantalla Retina de 27 pulgadas por lo que pagué por una caja de discos. No hice esta decisión a la ligera, pero decidí que mis datos valían la pena el gasto extra.

La caja en particular que elegí, un modelo de 20TB, viene equipada con cinco unidades de 4TB. Pero la única manera de conseguir 20TB es si ejecuta las cinco discos como RAID 0, que no provee protección de datos (aunque sí brinda gran velocidad). Configurado como RAID 10, consigo 8TB de espacio utilizable. ¿Cómo es que la capacidad cae de 20TB 8TB? Muy fácil: Dos unidades de 4TB se utilizan para el almacenamiento de datos, dos más se utilizan para reflejar los datos, y el último es el repuesto dinámico.

Estoy pagando mucho dinero por almacenamiento que no utilizo en absoluto (la de repuesto), o que uso actualmente para mantener copias de mis datos (los discos espejo). Pero esa es la configuración que elegí, sabiendo que quería mantener mis datos lo más seguros posible.

Punto único de falla: Cuando tiene varias unidades, si una falla no tiene que reemplazar todo, solo una unidad. Con mi RAID, estoy protegido contra fallas de la unidad, pero la caja en sí se convierte en un punto único de falla. Si la fuente de alimentación se apaga, la apago hasta que pueda conseguir que la reemplacen. Las cajas RAID más caras pueden ser equipadas con dos fuentes de alimentación, para tal eventualidad. Mi RAID no tiene esa característica, por lo que el colapso de la fuente de alimentación es una preocupación. (Es, sin embargo, un bloque de alimentación externa, por lo que la sustitución debe ser fácil, si alguna vez tengo que hacerlo. Incluso podría pedir un repuesto, solo para tenerlo a la mano.)

Para facilitar el trabajo de la fuente de alimentación, dejo la RAID activada todo el tiempo, a pesar de que duerme cuando puede y cuando el equipo duerme. También la tengo conectada a una fuente de alimentación ininterrumpida, por lo que un corte de energía no va a forzar que se apague -o encienda, cuando se restablezca el suministro.

Requiere controladores para operar: Muchas cajas RAID de terceros requieren controladores para trabajar con OS X; LaCie es una caja de este tipo. Si la conecta a un Mac sin los controladores LaCie instalados, no podrá ver la unidad en absoluto. En este caso, el software de la unidad OS X es tan importante como el hardware. Y como se puede ver, hay algo que instalar.

El instalador del software LaCie instala muchas aplicaciones de línea de comandos de para ejecutar el cuadro de RAID.
RAID

En general, el software LaCie está bien. Usted gestiona la RAID a través de una página web, que funciona bastante bien, aunque todo apunta a que fue escrita en 2003. El problema más grande es el software a nivel de sistema: cuando los principales cambios se liberan, tiene que asegurarse de que el software funcionará antes de actualizarlo.

Este era un problema con la reciente actualización de El Capitán, como LaCie no salió con los controladores oficiales hasta una semana después de la liberación de El Capitán. (En mis pruebas, el controlador en realidad funcionaba bien si ya estaba instalado, pero no se podía instalar una caja de RAID como nueva dentro de El Capitán.)

Estoy, en esencia, en deuda con LaCie para mantener la actualización de su software para la futura compatibilidad OS X. De todos los contras, este es el que más me preocupa, porque la falta de actualizaciones de software puede convertir una RAID completamente funcional en una caja de discos inútil.

Envolviendo todo

¿Mi solución es para todos? Absolutamente no; si no tiene muchos datos, y no le importa el tiempo de inactividad en la restauración de la copia de seguridad, no hay razón para siquiera considerarlo. Pero si tiene muchos datos, y/o si desea minimizar el tiempo de inactividad en caso de falla del disco, un RAID de hardware es una solución razonable.

Hay ventajas y desventajas involucradas, y espero que mi discusión de esas compensaciones pueda ayudarle a tomar su propia decisión. Personalmente, he estado encantado con la RAID y su desempeño y manejo de datos, así que estoy bien con algunos de los riesgos que implica. Con un poco de ayuda del departamento de software de LaCie, es de esperar que pueda ser mi solución de almacenamiento para siempre.