Qué es el computational storage y cómo está cambiando la forma de pensar los datos

En el último siglo nada ha crecido más rápido en el mundo tecnológico que la capacidad de almacenamiento, sin embargo la forma en que este almacenamiento interactúa con el resto de los elementos computacionales se ha mantenido prácticamente sin cambios.

RAMAC 350, el primer disco duro comercial que IBM lanzó en 1956, no se diferencia demasiado de uno moderno (o incluso de una memoria SSD) en cómo desempeñan sus funciones: básicamente trasladan información por tandas a una memoria RAM, que luego es movida también por secciones para ser procesada en la CPU.

Aun cuando las tasas de transferencia han crecido enormemente el mundo moderno exige procesamiento en tiempo real. Deep data, IoT y computación Edge ya requieren de latencias mucho menores que, aparentemente, sólo pueden conseguirse al eliminar los intermediarios y reducir al mínimo el movimiento de datos de un componente a otro: el computational storage ha surgido como una respuesta a esta necesidad.

El computational storage es una arquitectura de IT en la que la información es procesada directamente en el dispositivo de almacenamiento, de esta forma se evita trasladar datos entre la CPU y la memoria que los aloja y así aumenta la velocidad de cómputo mientras se evitan cuellos de botella.

La economía de los datos quiere todo al instante

Para nadie es una sorpresa que los datos están al centro del negocio hoy en día, por lo mismo organizaciones de todo tipo y tamaño están intentando capturar y almacenar la mayor cantidad de información que puedan, ya sea en data lakes o bases de datos tradicionales. Sin embargo, estos datos necesitan ser limpiados, integrados y estructurados para que cumplan alguna función en la empresa. La tarea ha resultado más difícil de lo que se pensaba, en especial cuando la información necesita ser analizada en tiempo real. La ventaja del computational storage es que al contar con una unidad de procesamiento directamente ligada al lugar en donde descansa la información es capaz de clasificarla u ordenarla en respuesta a las necesidades de cada organización; además, es posible programar software específico que administre los datos con un nivel de exactitud y eficiencia que hasta ahora no estaba disponible.

Con el rápido advenimiento de la inteligencia artificial y el aumento en las tasas de transmisión inalámbrica que impulsará 5G, la necesidad de acercar el procesamiento cada vez más al almacenamiento sera cada vez mayor.

Algunos casos en donde se logra percibir la urgencia a la que el computational storage responde es en los procesos que no pueden darse el lujo de tener un retraso. Unas cuántas milésimas más al hacer un cálculo pueden causar un choque en el caso de los autos autónomos, o un desastre de mayor escala en industrias críticas como la de energía o minería, que cada vez dependen más de sensores IoT y respuestas en tiempo real para su funcionamiento.

La demanda por este tipo de soluciones ha crecido enormemente en los últimos años en parte también gracias a los centros de dato de hiperescala: las titánicas instalaciones que soportan la operación de compañías como Facebook, Google o Netflix, o que sostienen la nube para los servicios de empresas como Amazon Web Services. Cualquier disminución en latencias o incremento en la velocidad de análisis de información significa beneficios económicos de alta magnitud.

Con el rápido advenimiento de la inteligencia artificial y el aumento en las tasas de transmisión inalámbrica que impulsará 5G, la necesidad de acercar el procesamiento cada vez más al almacenamiento sera cada vez mayor.

Un centro de datos en miniatura

En tanto tendencia emergente, diferentes proveedores y emprendimientos han desarrollado aproximaciones y tecnologías disímiles a la hora de entrar al computational storage.

Una de las primeras soluciones fue creada por NGD Systems, una empresa que nació en 2013 con una capitalización de mercado en torno a los $25 millones de dólares. Según refiere el sitio especializado en virtualización Kamshin, NGD surgió de veteranos del almacenamiento flash que quisieron llevar un paso más allá las posibilidades de guardar información.

El dispositivo de NGD Systems cuenta con almacenamiento NVMe SSD, un procesador ARM y módulos RAM (de 2GB por cada 4TB de flash), además de un Application-specific integrated circuit (ASIC) que procesa sets de datos específicos. Pero un dispositivo de computational storage no se termina en el hardware. Al no ser tan pasivo como un disco duro, estos dispositivos necesitan de instrucciones específicas para saber qué hacer a cada momento, por lo que también va cargado con un pequeño sistema operativo o alguna forma de recibir instrucciones. En el caso de NGD es una distribución de Linux que permite incluso ejecutar aplicaciones contenedorizadas directamente en el almacenamiento.

Otras compañías han tenido aproximaciones distintas, como Samsung y su SmartSSD, a la que define como un «subsistema inteligente» que se comporta como computadoras en cluster al cargar varias en un servidor. La SmartSSD (que aún no ha sido lanzada oficialmente) no tiene un sistema operativo propiamente tal, por lo que no es capaz de ejecutar software en memoria; sin embargo, sí cuenta con una librería para correr instrucciones.

Proveedores como ScaleFlux, Eideticom y Nyriad también se han subido a la tendencia, con estrategias tan distintas como el uso de GPUs, aceleradores FPGA o un enfoque en seguridad de datos.

Frente a esta variedad de alternativas, la Storage Networking Industry Association (SNIA) creó el Computational Storage Technical Work Group (TWG), un esfuerzo por generar estándares que promueva la interoperatividad entre dispositivos de computational storage , además de definir interfaces comunes para el despliegue de sistemas, aprovisionamiento, administración y seguridad.

Si bien aún se encuentran en una etapa primitiva, el crecimiento esperado de las soluciones de computational storage permiten aventurar que estarán mucho más presentes en un futuro próximo, y que además les queda mucho espacio para sofisticarse y representar un nuevo y eficiente salto tecnológico en el fundamental campo del almacenamiento.

 

 

 

 

Christopher Holloway

http://salalacalleymuere.tumblr.com

Director editorial de IT Masters Mag. Experto en gatos, libros y en los intrincados procesos tecnológicos que atraviesan el funcionamiento de las sociedades en todas sus expresiones.

Related posts

Deja un comentario