La acelerada transformación digital provocada por la pandemia en el último par de años ha generado una explosiva generación de información, los cuales necesitan analizarse y utilizarse de la mejor manera. Es por esto que el científico de datos se encuentran cada vez más ocupado que nunca, buscando adaptar procesos y prácticas.
En este momento, los científicos de datos son lo que están ayudando a descubrir y aprovechar grandes oportunidades en la industria, y al mismo tiempo enfrentando retos derivados de los distintos niveles de liderazgo, sistemas, culturas corporativas y la naturaleza de una extensa diversidad de negocios que se encuentran generando y valorando la gran relevancia que tiene el análisis de datos.
Esta nueva realidad ha logrado despertar la curiosidad respecto a cómo ha cambiado el entorno en el que trabaja el científico de datos, y qué pueden hacer para encarar los desafíos y aprovechar mejor las oportunidades. Específicamente, vale la pena conocer el impacto que la pandemia ha tenido en su labor, cuánto tiempo dedican hoy a sus actividades, qué obstáculos enfrentan, y las habilidades necesarias para llevar a cabo su tareas.
Un reciente estudio realizado por SAS, La transformación digital acelerada, busca responder a estas y otras interrogantes desde la perspectiva de estos protagonistas.
Una de las primeras revelaciones es su percepción sobre la productividad de su labor desde que estalló la pandemia. En este sentido, los encuestados aseguraron que desde entonces a la fecha la cantidad de trabajo se ha elevado (45%) o ha permanecido sin cambios (28%), y consideran que su trabajo es más importante hoy que antes (53%); únicamente el 38% dijo que conservó su mismo nivel de importancia y el 9% que es de menor importancia.
El mayor impacto de la pandemia en el trabajo del científico de datos se deriva, indudablemente, de la transformación digital, la cual provocó un efecto dominó en la adaptación de procesos, prácticas y parámetros operativos y supuestos. Entre estos destacan el considerable crecimiento del comercio electrónico, las alteraciones a la cadena de suministro y al aumento de los costos de su transporte, y a las impredecibles fluctuaciones de personal.
Enfoque en los datos
Ante el crecimiento del trabajo de los científicos de datos, estos la industria ha tratado de distribuir de la mejor manera las tareas fundamentales de los proyectos que encabezaron. Uno de los hallazgos notables del estudio es que están dedicando mucho más tiempo a reunir, explorar, gestionar y limpiar los datos (58%); en contraste, dedicaron sólo 11% de su tiempo a crear modelos de cómputo.
Y es que no importa el tamaño de la organización, la gestión de datos requiere una gran cantidad del tiempo del científico de datos, incluso con la disponibilidad de herramientas que utilizan poco o ningún de código y de los algoritmos de inteligencia artificial y machine learning desarrollados para esa tarea. El quid radica en los datos que se tienen y cómo decidir cuáles son relevantes, esto depende en gran medida del tipo de industria y organización que se trate. Lo mismo aplica a la forma en que se desarrollarán los modelos, sabiendo qué datos son relevantes y por qué tiene que ver con los problemas que se están tratando de resolver.
Los principales obstáculos
Al igual que sus colegas de otras áreas, los científicos de datos han enfrentado en los últimos meses obstáculos y desafíos en el momento de ejecutar su trabajo. Entre los cinco principales que han citado destacan: las políticas de la empresa/la falta de apoyo gerencial y financiero para el equipo de ciencia de datos (46%), datos desorganizados (43%), los resultados de la ciencia de datos no son utilizados por los tomadores de decisiones (42%), explicar la ciencia de datos a otros (35%) y la necesidad de coordinarse con TI (33%).
Asimismo, el estudio consideró las prácticas éticas en relación a la inteligencia artificial con el propósito de saber si existían algunas barreras para los esfuerzos de limitar las aplicaciones no deseables, no éticas o tendenciosas de la tecnología. Si bien este es un tema de gran relevancia, en el estudio el 43% de los participantes señaló que su organización no realiza revisiones específicas de sus procesos analíticos respecto a sesgos o discriminación. De igual forma, la IA responsable parece no tener el mismo nivel de prioridad en todas partes, pues sólo el 26% indicó que un sesgo tendencioso se utiliza como medida del éxito de los modelos en su organización.
De igual forma, se cuestionó a los profesionales de datos cuáles eran los mayores obstáculos respecto a asegurar que los resultados de los procesos analíticos fueran imparciales y objetivos. Las respuestas estuvieron encabezadas por la falta de comunicación entre quienes recolectan los datos y quienes los analizan (39%), la dificultad para recolectar los datos suficientes sobre grupos objetivo (38%) y la dificultad para identificar y seleccionar las métricas de evaluación adecuadas (28%).
Factores de éxito
Finalmente, y dada la complejidad del mundo de negocios actual, no debe sorprender la amplia gama de habilidades que los científicos de datos necesitan para considerarse exitosos. Al pedirles mencionar cuáles eran las habilidades que mejor dominaban para ello, más de la mitad indicó las siguientes: ciencia/método científico, gestión de datos estructurados, conocimiento de contenidos en dominios especializados, estadística y modelado estadístico y comunicación.
Por otro lado, menos de una tercera parte dijo tener dominio avanzado o experto en habilidades como gestión de nubes, administración de bases de datos, programación front-end y back-end, PLN y minería de textos, y administración y diseño de sistema.
Ahora bien, ¿cómo pueden los científicos de datos aprovechar toda esta inercia generada por la acelerada transformación digital de los últimos dos años? El estudio sugiere cinco acciones concretas:
- Adoptar la preparación de datos como el primer paso para el modelado. La constante necesidad de analizar datos impulsará el desarrollo de aplicaciones de IA y machine learning para realizar esas tareas.
- Elegir un obstáculo y encontrar una solución viable. No importa cual, lo importante es elegir uno y comenzar, dedicándole el tiempo y los recursos que tengan a su disposición, y continuar con el siguiente.
- Ser parte del cambio que se desea ver con la IA responsable. Si la organización no ha emprendido el camino hacia la IA responsable, es buen momento de iniciar con un proyecto propio y encontrar formas de añadir los medios para detectar y medir los sesgos.
- Participar en las decisiones. Los científicos de datos necesitan colaborar con sus clientes internos y encontrar formas de ser incluidos en las discusiones estratégicas en las etapas de planeación y de toma de decisiones.
- Mejorar sus habilidades. Las habilidades empresariales les ayudarán a formular las preguntas una vez que se comience a descubrir lo que yacía oculto en los datos; las habilidades de ingeniería de datos/ programación les permitirán ampliar su experiencia y visión.
Para los científicos de datos, la transformación digital es, por lo tanto, una oportunidad excepcional de evolucionar hacia un rol mucho más estratégico y participativo en las decisiones que tomarán las empresas no solamente en lo que se refiere al rumbo que tomará el negocio, sino también con la relación que mantendrán con clientes y socios en los años por venir.
Por Nelly Marina, Global Academic Program Manager, SAS LATAM.