sábado, 28 de mayo de 2016

De data miners a data scientists

En octubre de 2012 se publicaban los artículos 'Data Scientist: The Sexiest Job of the 21st Century' y 'Big Data: The Management Revolution', en Harvard Business Review. Ambos están muy relacionados y alcanzaron una importante difusión posterior.

Si acudimos a Google Trends, la fecha coincide con el despegue exponencial del interés en las búsquedas de Google (lo que equivale a decir en todas las búsquedas de Internet), por el término data scientist (e igualmente por big data). Casualidad o causalidad?. En la misma evolución puede verse la caída allá por 2006 del imperio de los data miners como profesión que suscita interés.




Si en lugar de por ocupaciones buscamos por conceptos, notamos que la tendencia es mucho menos abrupta y solo muy recientemente el interés por el término data science ha superado a data mining.

Puede verse además una buena correlación entre clustering (técnicas básicas de segmentación) con data mining, mientras data science va de la mano del concepto más avanzado de machine learning (algoritmos predictivos). Significa esto que data science fuera el siguiente paso al data mining exploratorio? o quizá un término más general que englobase al primero?.



Pero qué es exactamente un data scientist o científico de datos?. Haciendo un compendio de las definiciones que podemos encontrar, vendría a ser una suerte de analista de datos con conocimientos profundos de programación y estadística, pero además con una importante orientación de negocio.



Uno se pregunta si esto es realmente algo nuevo. En el reciente artículo, también de Harvard Business Review, 'Creative Job Titles Can Energize Workers', hablan sobre cómo un nombre original para un puesto de trabajo puede motivar al que lo sustenta. Me recuerda a una película en que se apodaba irónicamente a los señores del camión de la basura como "ingenieros en higiene", así que creo que puede haber mucho de psicológico también en este tema de la ciencia de datos.

Sea como sea, aprovechando un cambio de puesto laboral esta semana he hecho la prueba de introducir el término en el perfil de LinkedIn: "TV Planning & Data Scientist". El tropel de recomendaciones de empleo relacionadas no tardó ni 24h en llegar, y continúa:


La conclusión que saco es que tanto si el término data scientist es algo diferenciador que ha venido para quedarse, como si solo se trata de una moda léxica que antes o después tendrá su caída (como la hemos visto en Google Trends para los pobres data miners), si quieres que te encuentren hoy, estar ahí ayuda.


1 comentario:

Por claridad del blog, por favor trata de utilizar una sintaxis lo más correcta posible y no abusar del uso de emoticonos, mayúsculas y similares.