Retour aux actualités
Article suivant Article précédent

Revue TELECOM 177 - La science des données, à la croisée des métiers

Articles Revue TELECOM

-

15/10/2015



LA SCIENCE DES DONNEES, A


LA CROISEE DES METIERS

Par Isbelle Robin dans la revue TELECOM n° 177
 
Animal hybride, créature rare, le data scientist attise toutes les convoitises du fait de ses capacités réputées très étendues. Mais quelles sont vraiment ses compétences ?

Le sexiest job of the century attire des profils variés au sein des entreprises et si le terme a le vent en poupe, il n’est pas toujours facile de distinguer le data scientist  d'un statisticien, d'un développeur ou d'un data mineur . A la croisée de plusieurs métiers, les data scientists jonglent entre des domaines très variés et doivent posséder un arsenal de compétences pointues pour faire parler les données.

Le data scientist est un profil d’un genre nouveau et les contours de ce métier sont donc encore mal définis. Pour parvenir à exploiter le potentiel des données, il lui faut maîtriser des compétences variées. Ce profil hybride doit disposer d’un solide bagage en mathématiques et statistiques, maîtriser les outils et infrastructures de traitement des données mais également savoir présenter ses résultats de manière pertinente et se faire comprendre par ses interlocuteurs métier. Voici un tour d’horizon des compétences que l’on attend d’un data scientist dans chacun de ces domaines.

Décrire et modéliser les données

La maîtrise des bases en statistique est indispensable à l’analyse descriptive des données. La panoplie des concepts à assimiler est large et passe par des notions très évidentes comme les moyennes, écarts-type et quantiles aussi bien que par des outils plus fins comme les tests statistiques ou l’analyse en composantes principales.

 


Ces notions doivent être complétées par une connaissance suffisamment étendue des algorithmes d’apprentissage automatique (machine learning) qui constitue l’un des fondamentaux de la science des données . Il s’agit avant tout d’en maîtriser les grands principes pour savoir quel type d’algorithme utiliser selon la nature du jeu de données étudié, ainsi que d’éviter de tomber dans le travers d’un modèle peu généralisable. De nombreuses bibliothèques, en particulier sur R et Python, proposent des implémentations « clé en main » du vaste bestiaire des algorithmes de machine learning et permettent ainsi souvent d’économiser de nombreuses heures de développement ad-hoc. Toutefois, un data scientist n’est pas une simple encyclopédie d’algorithmes, car il doit pouvoir comprendre le fonctionnement d’un nouveau moteur, ce qui demande très souvent des connaissances en algèbre linéaire et en optimisation.

Elaborer des prototypes concrets des modèles

Mettre en œuvre ces algorithmes nécessite d’être à l’aise en développement informatique, en particulier pour la rédaction de scripts en Python, R ou même BASH. La maîtrise de ces outils permet au data scientist de développer, tester et valider ses modèles par lui-même.
Au-delà du côté algorithmique, manipuler les données nécessite également de savoir manipuler leur système de stockage : que ce soit une base de données relationnelles ou non relationnelles (technologies NoSQL comme Cassandra ou MongoDB) mais également les technologies dites « big data » (Hadoop, Storm, Spark, etc.) qui se révèlent parfois indispensables pour le traitement efficace de larges volumes de données et nécessite un effort permanent de veille scientifique et technologique. C’est cette veille constante qui permet au data scientist d’identifier les technologies matures comme les naissantes.

Mettre en lumière les données

Pour réaliser des modèles et des algorithmes pertinents, le data scientist doit être en mesure de comprendre des problématiques métier précises et d’identifier les enjeux propres à un secteur. Les expériences professionnelles passées jouent ici un rôle très important, mais dans tous les cas, il est nécessaire d’avoir de grandes capacités d’écoute afin de travailler avec les interlocuteurs métier. Scientifique et geek, le data scientistdoit également être un bon communicant pour donner un sens métier aux résultats des algorithmes, et les enrichir en fonction de ses caractéristiques.
En matière de données, communiquer revient également à visualiser les données sous un éclairage pertinent. L'utilisation d'un ou plusieurs outils de visualisation doit donc aller de pair avec de la créativité et de l'aisance à rendre l'information accessible sous forme visuelle.

Des profils variés pour des compétences éclectiques

Alors, les 
data scientists sont-ils de véritables couteaux suisses qui doivent cocher toutes les cases de ce panel de compétences ? Pas nécessairement. Si la palette des outils à utiliser reste globalement la même quel que soit le domaine, selon la mission et l’entreprise il sera plus intéressant de développer certaines capacités en particulier. Les profils recrutés sont donc souvent très divers : du data technologist dans une start-up qui développe un produit au data scientist 
dans un département R&D en passant par le data creative spécialiste des visualisations pour la communication interne ! Métier à la fois en création et en reconstruction, la science des données attire aussi bien des profils juniors à la pointe des innovations scientifiques que des profils plus expérimentés en pleine reconversion, qui peuvent apporter toute l’expertise métier nécessaire à la pleine compréhension des enjeux et des données. 

Biographie de l'auteur
Isabelle Robin 
Diplômée de l'Ecole des Mines de Nantes, j'ai choisi une formation portée à la fois sur l'informatique et les mathématiques appliquées, notamment sur l'optimisation sous contraintes et la théorie des graphes. Lors d'un stage au sein d'un laboratoire Big Analytics de Thales Communications & Security, je me suis orientée vers la Data Science et j'ai pu découvrir les outils et enjeux du Big Data. Séduite par le dynamisme et les compétences de son équipe, j'ai rejoint Quantmetry en 2014 en tant que consultante Data Scientist. Au sein d'un environnement stimulant, j'accompagne nos clients dans leurs ambitions sur ces thématiques.
 

174 vues Visites

J'aime

Commentaires0

Veuillez vous connecter pour lire ou ajouter un commentaire

Articles suggérés

Articles Revue TELECOM

Revue TELECOM 195 - 5G : une révolution numérique des télécoms ?

User profile picture

Melina LAURICELLA

16 janvier

Articles Revue TELECOM

Revue TELECOM 195 - Dans la lumière Brune

User profile picture

Rédaction Revue TELECOM

15 janvier

Articles Revue TELECOM

Revue TELECOM 195 - Onboarding, intégration, rétention... what for ?

User profile picture

Rédaction Revue TELECOM

15 janvier