Certificat Data Science

Les technologies de génération et de stockage de données sont actuellement disponibles pour toutes les entreprises, que ce soit sous forme de services Cloud ou sous forme de plateforme open source. Par contre, ce qui manque cruellement, selon les témoignages de plusieurs chefs d’entreprises, ce sont les usages et surtout les compétences qui permettent de valoriser cette manne de données Big Data, à savoir celles que doivent posséder tous les Data Scientists.

 

Si un Data Scientist doit posséder une connaissance approfondie du métier au service duquel il intervient, il doit aussi être un modélisateur, un analyste, un statisticien, un créateur de corrélations… Alors qu’un statisticien pose des questions précises et cherche à mettre en évidence des effets déjà identifiés au moyen de plans d’expériences, la tâche d’un Data Scientist est plus créative. Il lui est demandé, non pas d’appliquer des méthodes et d’utiliser des modèles existants, mais plutôt d’en imaginer de nouveaux sur la base de sa connaissance du métier.

 

Là où un statisticien opère avec des échantillons constitués de données structurées et scrupuleusement sélectionnées, un Data Scientist doit travailler avec des quantités massives de données non-structurées et non-nettoyées. Aux méthodes traditionnelles d’analyse statistique, il substitue des techniques de data mining, qui permettent de révéler des propriétés inconnues dans un jeu de données, ou celles du « machine learning » qui cherchent à prédire des comportements futurs sur la base de données connues. Des compétences en analyse sémantique et en traitement du langage naturel s’avèrent par ailleurs indispensables pour analyser de vastes corpus de données textuelles ou de sons.

 

Les individus qui réunissent les trois facettes du Data Scientist idéal, à savoir des compétences en programmation, en gestion et analyse de données, et en compréhension du business font assurément figure de compétences rares et donc recherchées. En effet d’après McKinsey, il manquerait déjà près de 200 000 analystes de données aux Etats-Unis seulement, et ce chiffre pourrait dépasser le million d’ici 2017.

Contacts

Responsable de la formation
Khalid Belhajjame
Maître de Conférences
Université Paris-Dauphine

 

Assistante de la formation
Gaëlle Ferez
Mail : gaelle.ferez@dauphine.fr 
Tel. : 01 44 05 84 70

Actualités

Réunion d'information
mardi 29 novembre 2016 à 17h30
Merci de vous inscrire

Démarrage de la prochaine session
Mars 2017

Accréditation

L'Université Paris-Dauphine est accréditée