Urban Linker
Seeking new talents ? Choose this profile
Marketing profile
Marketing profile
Marketing hero
Technical profile
Technical profile
Code ninja
Creative profile
Creative profile
Creative from Mars
Sales profile
Sales profile
Sales champion
All profiles
All profiles
Secret identity

The job of Data Scientist by Pierre from Dataiku

28.11.2016

J’ai 26 ans, j’ai fait  l’école d’ingénieur des Mines Nancy. Pendant cette formation, je ne savais pas ce vers quoi j’allais me diriger. Je me cherchais un peu, c’est pourquoi j’ai décidé de faire une année de césure pendant laquelle  j’ai effectué deux stages, dans deux secteurs radicalement différents. Dans le premier, je faisais de la gestion de portefeuille  et dans le second j’étais en charge de la prévision des ventes en supply chain chez Lu. À la fin de cette année, je me suis orienté vers la spécialisation Data mining de l’ENSAE qui était davantage reconnu que les Mines de Nancy dans ce domaine. J’ai opté pour le Master spé Data science, à la fin duquel j’ai fait un stage en Bio statistiques. J’analysais les data pour la détection des cancers. À la suite de ce stage, je souhaitais poursuivre l’aventure dans une startup en tant que data scientist, et j’ai été recruté par Dataiku chez qui je travaille depuis 1 an et demi.

 

Un des outils le plus utilisé par le Data scientist est sans conteste Hadoop  qui permet d’exploiter des grosses bases de données.  Je me sers du langage python pour le machine learning et l’exploration de data set  (essentiellement des bases de données de petite  taille). Chez Dataiku, nous proposons, à nos clients,  un outil  qui s’appelle data science studio, qui m’aide au quotidien dans mon travail de data scientist. Enfin pour le domaine de la Business intelligence,  j’ai recours à Vertica et Greeplum qui me sont très utiles pour travailler sur des bases de données dites «  plus verticales » (en colonne).

Pour moi, la différence majeure se situe dans le type de données analysées. Un data analyst manipule des données déjà plus ou moins formatées qui sont exploitables immédiatement. En revanche, le data scientist part quasiment d’une feuille vierge avec une quantité de datas brutes impressionnantes à exploiter. Celui-ci travaille plus en amont de la chaîne que le data analyst, il est en charge d’extraire toutes les données  et d’en donner une signification. C’est en quelque sorte le travail préliminaire à celui du data analyst. Il est beaucoup plus orienté business qu’un data scientist et se situe à la fin du process de data science.

A l’heure actuelle, il y a très peu de data scientists, empiriquement parlant. C’est un métier qui est amené à se développer dans les prochaines années. Les besoins des entreprises sont grandissants, je pense qu’il va y avoir une croissance importante du nombre de data scientists aussi bien dans les grandes entreprises que les startups. La Data est un enjeu majeur pour les sociétés, nous le constatons tous les jours chez Dataiku. De plus, à l’avenir, on assistera à une segmentation du métier. En effet, certains data scientists seront plus spécialisés sur le machine learning, d’autres sur l’architecture. Je crois également que la dimension conseil va s’exporter de plus en plus afin de montrer aux entreprises, les opportunités à saisir grâce à la data.

Vous voulez connaître le salaire d'un data Scientist ? C’est par ici !
Webzine articles and dream jobs
07.09.2015
Technique

Head of R et D - h/f

Paris, France

In R&D we trust !

CDI Start-up 70 à 100 k€

Turn your tablet