La escuela española ID Boot Camps señala que la demanda de Científico de Datos (Data Scientist) ha aumentado 50% en 2020, y su ascenso es vertiginoso, ya que se requiere en todo el mundo de Científicos de Datos, basta con mencionar que la cantidad de información en 2018 ascendía a 33 zettabytes, pero para 2025 se espera que se llegue a 133 zettabytes. La ciencia de datos los analiza para proporcionar información y utilizar algoritmos para tomar decisiones bien comprobadas.
Entonces ¿qué es un Data Scientist? Es un experto en Data Science (Ciencia de datos) cuyo trabajo consiste en extraer conocimiento a partir de los datos para poder responder a las preguntas que se le formulan. Esta «Ciencia de los Datos», nacida del método científico, es la evolución de lo que hasta ahora se conocía como Analista de Datos, pero a diferencia de éste que sólo se dedicaba a analizar fuentes de datos de una única fuente, el Data Scientist debe explorar y analizar datos de múltiples fuentes, a menudo inmensas (conocidas como Big Data), y que pueden tener formatos muy diferentes.
David Pérez, Country Manager de B12 Admark México, comenta al respecto que Data Scientist es uno de los perfiles profesionales de los que se anticipa más demanda ahora y en el futuro, por lo que hay que poner atención a las cualidades de esta disciplina de la era digital, ya que debe tener una fuerte visión de negocio para ser capaz de extraer y transmitir recomendaciones a los responsables de las empresas. A continuación, las 5 características que debe tener un Científico de Datos.
- Dominio de técnicas basadas en datos
Su hard skill principal es conocer los datos y saber trabajar con ellos, porque los programas y herramientas utilizados en la era digital se basan en datos. Inteligencia Artificial, Machine Learning, Big Data o Deep Learning son algunos de estos sistemas que precisan de un gran volumen de datos para desarrollar sus funciones adecuadamente. Un Científico de Datos debe organizar la información y saber cómo prepararla para trasladarla a la siguiente fase de la cadena. El objetivo es extraer valor y tomar decisiones que ayuden a mejorar los procesos operacionales del negocio. Exploración, limpieza, filtrado, construcción de modelos y presentación de resultados son algunas de las tareas a las que un Data Scientist debe enfrentarse en su día a día.
- Comprensión de lenguajes de programación
Un Data Scientist no puede conocer todos los lenguajes de programación, pero mientras mejor esté capacitado podrá optar a mayor rango en su organización. Al trabajar con Big Data, Inteligencia Artificial y Machine Learning se usan gran cantidad de lenguajes, frameworks y herramientas específicas de almacenamiento y procesado de información, como, por ejemplo: Spark, Hadoop, Cassandra, entre otros muchos. Algunos de los más importantes son R (lenguaje de programación dedicado a la estadística); Python (lenguaje de programación orientado a objetos); y SQL (Structured Query Language es un lenguaje de consulta estructurado).
Tal vez te interese: Low Code permite materializar las estrategias de transformación digital en muy corto tiempo
- Conocimiento de estadística y matemáticas
El mundo de los datos incluye matemáticas como alma máter para el adecuado desarrollo y funcionamiento de los sistemas, frameworks y otros elementos. Los Data Scientist son expertos en el manejo, análisis y desarrollo de métodos que serán usados en los procesos de investigación, interpretación, estimación, manejo de índices de errores y resultados. Al hacer uso del método científico, tendrán que apoyarse en las matemáticas, donde tendrán que tener conocimientos como lógica, cálculo (derivadas, diferenciales, integrales, funciones vectoriales), álgebra lineal, estadística, teoría de números, probabilidad, y algoritmos, entre otros.
- Comunicación y colaboración
Los datos son una valiosa fuente de información para las empresas del Siglo XXI. Sus conocimientos y aplicación a la data ayudan a tomar las mejores decisiones, pero analizar la información no sirve de mucho si no se transmite ese valor a las áreas dependientes de desarrollo del proyecto y la toma de decisiones. Los Científicos de Datos también deben ser expertos en gestionar situaciones de crisis y, en el caso de que sea necesario, tomar decisiones difíciles que determinen y solventen la situación de la mejor manera posible.
- Visión de negocio
Aparte de las hard skills, un Científico de Datos debe incluir en su currículum profesional una serie de soft skills entre las que se encuentra la visión generalizada del negocio, ya que debe estar atento a las tendencias y novedades que se produzcan en el sector y que puedan afectar al negocio, generar nuevas oportunidades o promover cambios en la estructura organizacional. Este perfil se basa en datos, sí, pero también debe orientar esos datos a obtener un resultado eficiente que determine la mejor dirección para la empresa.
Pérez anota: “La necesidad de trabajar con datos ha creado una alta demanda de perfiles con conocimientos en datos, el problema es que falta personal. Actualmente existe un agujero en el mercado que las empresas quieren rellenar, ya que es un experto con muchas habilidades y conocimientos que el Data Scientist se ha convertido en uno de los más valorados y mejor pagados en términos laborales. El futuro augura buenos propósitos y grandes oportunidades para todas aquellas personas que dirijan su carrera profesional hacia los datos.”