Llegamos a ustedes gracias a:



Conversando con...

Enrique Forbes, gerente de ventas de la región Cono Sur, División de Sistemas de Backup Recovery de EMC

El momento del respaldo y la deduplicación

[19/06/2012] Hace unos días conversamos con Enrique Forbes, gerente de ventas de la región Cono Sur, División de Sistemas de Backup Recovery de EMC. Con el ejecutivo charlamos sobre la conciencia que ya han adquirido las empresas sobre la necesidad de hacer el respaldo (backup) de su información.
Ya no se trata simplemente de tener una copia por si algo ocurre, sino de contar con la seguridad de que la firma pueda seguir operando luego de un evento levemente negativo o incluso uno catastrófico.
Enrique Forbes, gerente de ventas de la región Cono Sur, División de Sistemas de Backup Recovery de EMC, nos habla sobre el backup y la deduplicación de datos.
Pero también conversamos sobre una de las tecnologías que más bien han hecho a esta industria: la deduplicación. Con ella se reducen tiempos y se ahorra espacio. ¿No es una excelente propuesta?
¿Es difícil explicar el tema del backup a las empresas o esto ya ha cambiado?
Cada vez más las empresas tienen una mayor conciencia de la necesidad de estas herramientas. El tema del backup está muy relacionado con el tema de la contingencia; es decir, el backup existe en la medida en que uno tenga que hacer un restore. Backup es el proceso de guardar una copia de la información, y el restore es el proceso de volver esa copia a lo que se llama ambiente productivo.
Y el backup lo tienen que hacer por muchos motivos. En particular, últimamente ha habido muchos desastres naturales, y este tipo de contingencias son las más fuertes porque son las que debilitan un data center entero. Entonces, ante este tipo de eventualidades, si las empresas no están preparadas para volver rápidamente a operar con sus sistemas, corre riesgo el negocio.
Hay un estudio que señala que el 50% de las empresas que no estaban preparadas para recuperar su información a tiempo en el lapso de 12 meses dejaron de existir. Es un indicador bastante claro de la importancia para las empresas el tener respaldada su información. A la hora de necesitar el backup, y no contar con él, inhabilita tremendamente el negocio. El caso de los desastres naturales es el extremo pero hay instancias intermedias como la rotura de servidores, borrados accidentales, etcétera.
Por ejemplo, los bancos pueden tener multas muy fuertes de los organismos de control si no tuviesen backup. Es decir, hay un impacto fuerte en el negocio, el backup dejó de ser algo que se tenía por si pasaba algo. Y ahora es importante porque los sistemas comandan todo el negocio, de punta a punta.
Por eso las empresas han entendido la importancia del backup.
¿Esta conciencia adquirida es más fuerte entre las empresas grandes o también en las chicas?
La realidad es que tenemos clientes de todos los tamaños. Obviamente, tenemos clientes de grandes empresas porque tenemos productos de gran desempeño; pero tenemos clientes en todo el territorio y de todo tamaño, y lo que tenemos es una familia de productos que empieza desde un pequeño producto, hasta productos grandes. La tecnología que se encuentra dentro de ellos es la misma y el respaldo es igual. Esto habilita que empresas pequeñas puedan acceder a la misma tecnología.
¿Como ha impactado el tema de la nube en el backup?
Todos hablamos de la nube pero nadie vende la nube, todos vendemos cosas que permiten a las empresas llegar a la nube. En el tema del backup es fundamental porque en realidad cuando vas a la nube vas a un almacenamiento que no sabes dónde está ni es relevante para ti dónde está, pero sabes que está ahí.
Pero el proveedor que te brinda el servicio de información o almacenamiento en la nube tiene que asegurarte también el respaldo de esa información y la disponibilidad de esa información. Es decir, realiza un backup de la información que está en la nube. Con lo cual el concepto de backup también se encuentra en la nube, y esto se aplica tanto a una nube pública como a una privada o híbrida.
Por ejemplo, uno de los pilares de la nube es la virtualización, y virtualización es VMware que es de EMC. Nosotros tenemos un producto que es específico para realizar un backup de máquinas virtuales, y es súper eficiente ya que no requiere que haya gente detrás de él accionándolo.
Si una empresa tiene 500 servidores en el mundo físico, es una gran tarea. En el mundo virtual esto se simplifica mucho porque envías un agente y la red lo instala en cada máquina y se hace el backup.
¿Qué es lo que las empresas guardan en el backup?
Hay dos conceptos: respaldo de la información y el otro es retención de la información. Parecen lo mismo pero hay diferencias. El respaldo o backup es sobre todo aquello que está vivo, que está en movimiento y que es parte del día a día del negocio. Generalmente, se trata de la información de entre tres meses y un año. Algo que guardas en un dispositivo y que ante cualquier contingencia tienes que rápidamente volver a ponerlo.
Luego está la retención. Ésta es todo aquello que típicamente, por disposiciones regulatorias, tienes que mantener por un largo periodo de tiempo. Generalmente, es de todo aquello de un año o más. Ahí tienes registros históricos antiguos que son estáticos, que no se modifican y a los que nadie accede, pero que se deben guardar porque de lo contrario se puede tener problemas.
Es más un archivo histórico. Y las empresas manejan generalmente estos dos componentes de la información.
¿Hay herramientas para acelerar el proceso de backup si este se realiza externamente?
Hay algo que se llama deduplicación, que es una tecnología que ya tiene unos cuatro o cinco años y donde somos líderes. Hay varios que la hacen pero nosotros tenemos el 65,5% de participación de mercado a nivel mundial, de acuerdo a IDC. Y el siguiente competidor nuestro tiene 14%, que es IBM, y que tiene cautivo el mercado de mainframes, sin ellos probablemente tenga el 5%.
Nuestra empresa tiene mucho foco en esto, otras empresas lo toman como un producto más de su cartera. Nosotros tenemos mucho foco y somos muy eficientes en este segmento de mercado y las empresas reconocen esto.
Entonces, la deduplicación lo que te permite hacer es hacer más eficiente un proceso muy ineficiente. Hacer backup es guardar información varias veces; se repite entonces la información muchísimas veces, se guarda siempre el mismo dato.
Lo que hace esta tecnología es crear un proceso que tiene una inteligencia -que se encuentra en el dispositivo que utilizamos- que empieza a buscar y hace comparaciones de la información que va llegando y busca toda aquella que está repetida. Y todo lo que está repetido lo guarda una sola vez, y las demás veces le pone una referencia.
Si haces backup con cinta, que es lo más obsoleto, o incluso a disco, pero sin deduplicación la diferencia puede ser de 20 a 1. Un cliente nuestro guarda su backup de 300TB de información en 20TB. Entonces lo que uno tiene es un enorme ahorro de espacio de almacenamiento, y un enorme ahorro de tiempo en el procesamiento. La eficiencia del proceso es altísima.
Hay dos formas de hacer la deduplicación: en origen y en destino. EMC es el único que tiene las dos deduplicaciones. La deduplicación en destino es lo más tradicional. Es la deduplicación que ocurre en el lugar en donde está la información, generalmente en el centro de datos. Es decir, la información viaja por la red interna de la empresa, sin deduplicar, llega al dispositivo de backup con deduplicación, el dispositivo la deduplica en línea a medida que entra la información y la graba una sola vez deduplicada. Lo recalco porque hay dispositivos en el mercado que la graban toda sin deduplicar, y luego hay un post proceso en el cual la deduplican.
En el origen, en cambio, típicamente se usa en oficinas remotas o en el caso de máquinas virtuales. En el caso de las oficinas remotas es muy claro, si quiero hacer backup en el destino tendría que enviar toda la información sin deduplicar y eso es inviable por muy costoso.
Tenemos una tecnología que instala un pequeño dispositivo en el origen de la información, éste hace la deduplicación en el origen y envía la información deduplicada a través de la red, y se almacena en un dispositivo central pero ya deduplicada, lo cual es tremendamente eficiente; reduce las necesidades de ancho de banda hasta en un 99%.
Tenemos muchos clientes que usan las dos porque resuelven problemáticas de negocio distintas.
Jose Antonio Trujillo. CIO Perú