Tal y como muestra Steinemann, empresas de todo tipo y tamaño están adoptando herramientas de IA para mantenerse competitivas, lo que significa que el gasto está aumentando. Y mucho. Y no solo en las propias herramientas de IA, los costes de la nube también están aumentando.
Las plataformas en la nube son el lugar idóneo para ejecutar modelos de IA, almacenar conjuntos de datos masivos y acelerar la potencia informática sobre la marcha. Facilitan experimentar y escalar con rapidez, pero también pueden provocar una desagradable sorpresa cuando llega la factura mensual. A medida que aumentan los proyectos de IA, también lo hace la necesidad de una potencia mucho mayor; lo siguiente suele ser el uso de la nube (y su coste).
También debes tener en cuenta que, una vez que toda tu información esté "dentro", debes prepararla para la IA, lo que podría significar aún más soluciones y costes fragmentados a menos que, como en el caso de Steinemann, estas soluciones estén integradas.
En un mundo ideal, podrías alimentar los modelos de IA con cualquier conjunto de datos, y podrías diferenciar los datos valiosos de los que son poco útiles. Por desgracia, no estamos en ese punto (al menos de momento). Hasta entonces, los datos deben cumplir ciertos criterios para que la IA pueda usarlos de inmediato, lo que supone un ahorro de tiempo del 50 %, o bien un valor de 2,5 millones de dólares, cuando se trata de datos.18 Recuerda que en la parte 2, "estar preparado para la IA" significa tener datos diversos, oportunos, exactos, seguros, reconocibles y consumibles.
Además, ¿quién quiere pasar horas limpiando o moviendo datos manualmente? Nadie. Las herramientas con características de IA de bajo código o sin código pueden gestionar gran parte de este trabajo repetitivo, como la transformación de datos, la desduplicación y la asignación de formato, para que tu equipo pueda centrarse en los conocimientos reales. Además, también reducen los errores y aceleran los procesos.
Otra cosa por la que la gente no quiere esperar: el procesamiento por lotes. Al menos no cuando puedes obtener conocimientos a medida que se introducen los datos. Si usas herramientas de streaming como Kafka o Kinesis, configurar la ingesta en tiempo real significa que tus modelos de IA siempre tienen datos nuevos con los que trabajar. Es más rápido, reduce el almacenamiento adicional y ayuda a tu equipo a reaccionar sobre la marcha.
Finalmente, evita el desperdicio de datos a toda costa. Si todos los usuarios tienen acceso a todos tus datos, es muy probable que estés duplicando datos, aumentando los costes de almacenamiento y también los costes de cálculo al consultar el almacén de datos en la nube. Un paso sencillo como configurar el acceso basado en roles ayuda a mantener los datos en orden. Pero asegúrate de que cada equipo relevante tiene lo que necesita. De esa manera, no pagas por datos no utilizados o irrelevantes en tus sistemas.