Data Scientist: ¿Qué es y qué funciones cumple?

Data Scientist: ¿Qué es y qué funciones cumple?

La información cada vez vale más y las empresas lo saben. Por eso los analistas y los científicos de datos son muy demandados y sus sueldos están en alza. Suponemos que has escuchado hablar de ellos últimamente, pero tal vez no tengas demasiado claro qué hace un data scientist. Ahora te diré qué es, qué hace, por qué son tan demandados y cómo convertirte en uno.

¿Qué es un data scientist?

Un científico de datos es un especialista en el análisis e interpretación de la información que se encuentra en las grandes bases de datos.

Para que quede más claro, tenemos que entender la diferencia entre datos e información. Aunque muchas veces se usa los dos términos como sinónimos, la información se refiere a aquellos datos que ya han sido procesados y transmitidos de tal forma que pueden ser entendidos e interpretados por su receptor. Entonces, un data scientist debe tomar miles o millones de datos y transformarlos en información que sea relevante para la toma de decisiones.

Para cumplir con este rol debe basarse en sus conocimientos de matemática, estadística y programación.

¿Qué hace un data scientist?

Para entender el rol y la tarea de un científico de datos, tomemos el ejemplo de Meta, el nuevo nombre de Facebook. Este gigante tecnológico es dueño de Facebook, Instagram y WhatsApp.

Cada vez que un usuario ve una publicación, hace clic en el botón de me gusta, comparte algo, reacciona a una story, compra a través de una tienda conectada a Facebook, está generando un dato. Multiplica eso por los millones de usuarios que entran cada día a estas plataformas. Si todos esos datos están dispersos y sin analizar, no tienen ninguna utilidad para Facebook.

En cambio si esos datos van a una base de datos y un experto en análisis los procesa, Facebook puede saber cuál es la mejor hora para mostrar una publicidad, qué colores son los que más le gustan a las personas de un determinado rango etario, la extensión que tiene que tener un artículo para que sea más leído, cuáles publicidades generar más clics, entre otros.

Otras empresas pueden saber qué tipo de enfermedades tienen sus clientes, qué remedios toman, con qué frecuencia asisten al médico, entre otros. Cada industria necesita analizar diferentes datos para asistir mejor a sus clientes, y brindar productos y servicios que se adapten mejor a los usuarios.

A su vez, el procesamiento de toda la información por parte de los científicos de datos les permite a las compañías anticipar o predecir el comportamiento futuro de los consumidores y en base a eso tomar decisiones.

Entonces, podemos resumir el rol de los data scientists como el de proporcionar información sobre el comportamiento de los usuarios, la competencia, los empleados y sobre las acciones de la propia empresa, para que esta pueda crear estrategias y planes que le permitan cumplir con sus objetivos.

¿Cuáles son las principales funciones de un científico de datos?

Cada empresa tendrá un rol específico para un científico de datos, pero en términos generales podemos decir que estas son las funciones que cumplirá dentro de una compañía:

  • Extraer datos. obtener la mayor cantidad posible de datos, y de tantas fuentes como pueda. Las bases de datos pueden ser de distintos tamaños, las más grandes son las que están involucradas en lo que se conoce como Big Data.
  • Limpiar los datos. dentro del océano de datos que puede encontrar una empresa, tiene que rescatar lo que le sirve para tomar de decisiones. Entonces, primero tiene que eliminar todo lo que no sea relevante, lo que esté duplicado, lo que sea obsoleto, entre otros. Luego tendrá que normalizar los valores, establecer márgenes de error, y más.
  • Procesar los datos. Una vez que se tienen separados los datos relevantes, se deben aplicar métodos estadísticos, pasarlos por softwares de análisis, usar modelos de predicción de comportamiento, entre otros.
  • Visualizar y presentar la información. Luego de haber procesados los datos y obtenido la información, se debe decidir cuál es la mejor forma de presentarla para que sea clara, permita sacar conclusiones y tomar decisiones a quienes corresponda.

¿Qué se necesita estudiar para ser data scientist?

¿Qué se necesita estudiar para ser Data Scientist?

El perfil de data scientist es bastante complejo, ya que las empresas necesitan que quien lo ocupe cumpla con requisitos técnicos y tenga habilidades blandas.

Título en alguna especialidad técnica

Debido a que el científico de datos debe tener conocimientos sólidos en lo que es matemática y estadística, se suele pedir un título de nivel superior en carreras técnicas, como pueden ser algunas ingenierías. También puede ser alguna Especialidad en Matemática o algo más cercano a los negocios, como puede ser un Licenciado en Administración o en Economía.

Para muchas empresas el título no es un requisito obligatorio, y se enfocan en evaluar los conocimientos que la persona tiene en las materias que deberá utilizar para desempeñar su trabajo. Por otro lado, ya son muchas las universidades que ofrecen especialidades y posgrados para científicos de datos.

Lenguajes de programación

Los 3 programas más populares en los puestos en los que se usa la ciencia de datos son: SQL, R y Python. Esto no significa que tengas que ser experto en los 3, pero deberías dominar uno y tener algún conocimiento básico de los demás.

Preferiblemente, debes conocer bien SQL, que será el programa encargado de las bases de datos. SQL se usa para modificar, buscar y chequear información de sistemas de gestión que usan bases de datos relacionales.

Python es un lenguaje de propósitos múltiples, y es uno de los preferidos por los data scientist. Es un lenguaje de programación orientado a objetos, con una sintaxis fácil de aprender. Además de usarlo para la Big Data, se suele usar para el desarrollo de Machine Learning. Una de las ventajas que tiene Python es la variedad de librerías que trae, y en este caso la que importa es Panda, que es la que se usa para la ciencia de datos.

Mientras que R se usa para análisis estadístico, es decir que es más específico. Así como Python es la opción favorita de los que llegan a esta área desde la programación, R es el lenguaje que elijen los que llegan desde la matemática y la estadística. R tiene la ventaja de tener bibliotecas que facilitan el ordenamiento y la exposición de la información.

Aquí te dejo un post con todo lo que necesitas para aprender Python.

Conocimientos sobre algoritmos, Machine Learning y más

Otros requisitos comunes en los puestos de científico de datos es el de contar con conocimientos teóricos y prácticos de una gran variedad de terma. Los conocimientos que te pidan dependerán de la empresa, la industria y el puesto en sí. Esos temas pueden ir desde algoritmos, Machine Learning, bases de datos SQL y NoSQL. También pueden pedir contar con experiencia en entornos de Big Data o conocimientos de análisis predictivo.

Habilidades blandas

  • Capacidad de comunicación escrita y oral. Muchas veces tendrás que pedir información a otras áreas y presentar informes de forma oral y escrita a diferentes grupos de interesados.
  • Capacidad para resolver conflictos. No todos los problemas están estructurados ni todos los informes serán iguales, por lo que tendrás que tener capacidad para innovar, investigar y tomar decisiones para resolver los problemas y conflictos que surjan.
  • Voluntad de aprendizaje continuo. La tecnología y las tendencias cambian, por lo que debes actualizarte sobre lo que necesitas para hacer más eficiente tu puesto y sobre lo que la empresa necesita.
  • Visión de negocio. Al realizar estas tareas dentro de una empresa, siempre debes tener claro cuál es el objetivo final de la empresa. Esto te permitirá identificar cuáles son los datos trascendentes y qué tipo de decisiones necesita tomar la compañía.

¿Cuánto gana un científico de datos?

Podemos ver en Glassdoor que el sueldo de un data scientist varía mucho de un país a otro. En Argentina el sueldo promedio es de $160 000 pesos por mes (9600 dólares al año). En Colombia es de 5 millones de pesos mensuales (16 200 dólares por año). Mientras que en España un científico de datos gana 36 000 euros al año (39 000 dólares al año), y en Estados Unidos la cifra sube hasta los $117 000 por año.

Acabo de hablarte de una de las profesiones en las que podrías usar tus conocimientos de programador. Sin embargo, si esta no te parece atractiva, tal vez te guste más ser desarrollador de videojuegos.

Nicolas Bonder

Graduado en Administración en la Universidad Nacional de Córdoba en el año 2008. Después de haber trabajado en distintas industrias y distintos puestos decidió convertirse en viajero y trabajar como escritor freelance. Publicó crónicas en el Diario Hoy día Córdoba y en la revista Brando. Además, hace años tiene su propio blog de viajes y ha publicado libros de cuentos. Hace un par de años volvió a cambiar el rumbo y comenzó a estudiar programación. Lo hace de forma autodidacta, aprovechando los cursos online que ofrecen diferentes plataformas. Nicolás ve en el desarrollo web una muy buena carrera para usar toda su creatividad, hacer cosas nuevas y ayudar a los clientes desde un punto de vista diferente. Se especializó en programación Front End. Actualmente trabaja con JavaScript, React.js y Redux.

Deja un comentario