Retour aux actualités
Article suivant Article précédent

Revue TELECOM 177 - A la rencontre des data scientists - Le Mastère Spécialisé Big Data

Articles Revue TELECOM

-

15/10/2015


A LA RENCONTRE DES DATA

SCIENTISTS



Le Mastère Spécialisé Big Data

 
 

Lancé en septembre 2013 à l’initiative du professeur Stéphan Clémençon, le Mastère Spécialisé Big Data a vite rencontré un franc succès. Alors que la seconde promotion est actuellement en stage, le recrute- ment de la troisième est déjà bien avancé, avec plus de 60 dossiers reçus pour 30 places. L’occasion de reve- nir sur la première promotion : quels sont leurs profils ? Qu’ont-ils retenu de ces 15 mois de formation ? Et dans quelles entreprises font ils fructifier leurs compétences ?

Une enquête menée en février 2015 donne une première idée du devenir des étudiants. Les résul- tats concernent 14 répondants, soit 50 % de cette promotion. Alors que tous n’avaient pas encore sou- tenu leur mémoire, 70% des répondants étaient en CDI et la moitié gagnait au moins 50 k€ annuels. En termes de place dans l’entreprise, 40% d’entre eux étaient rattachés à la R&D et 45% occupaient une po- sition stratégique et/ou transverse. Mais le plus important, c’est que 9 sur 10 occupaient une fonction au cœur de la chaîne big data et la même proportion était satisfaite de l’intérêt des missions proposées. Rencontre avec cinq data scientists épanouis dans leur métier.



QUENTIN-GABRIEL THURIER (2014)- NETBOOSTER


Quentin est allé très vite : dès la fin des cours il a démarré un CDI chez NetBooster, une entreprise spécialisée dans le 
webmarketing qui cherche à actionner tous les leviers incitant un internaute à se rendre sur le site d’un annonceur : e-mailings, liens sponsorisés…

Diplômé d’une école de statistique, Quentin avait auparavant travaillé 3 ans à la Société Générale, dans la section de lutte contre la fraude, sur la détection des signaux faibles et des comportements atypiques. 

 
« Je rencontrais déjà des problèmes de volumétrie et de sources hétérogènes,
avec des données en provenance de dix services différents. »

Chez NetBooster, Quentin travaille au sein d’une équipe transversale « data et analytics ». Des tags mis en place sur les sites des clients permettent de suivre les visiteurs et d’établir des correspondances entre plusieurs visites. Quentin en retire beaucoup d’informations : pages visitées par chaque client, temps resté sur chacune, transactions, origine du visiteur (accès direct ou via un moteur de recherche, clic sur une bannière ou dans un mail…).

« Je cherche à mettre en relief trois choses : la probabilité de transition d’une page X à une page Y, la combinaison de leviers web marketing qui amènent le plus efficacement à une conversion et enfin le clustering de parcours, en se basant sur les matrices de similarité entre les séquences de pages visitées. »

Quentin utilise beaucoup Python, ce qui lui permet de traiter des logs d’une centaine de giga-octets par mois. Alors que pendant le Mastère Spécialisé, les étudiants travaillaient sur le cloud d’Amazon, maintenant Quentin utilise celui de Google, dont les coûts sont moins élevés et qui permet des passerelles avec Google Analytics.


« Chez NetBooster, le Web est dans notre ADN, et le traitement de la donnée est quelque chose de stratégique : nous investissons et recrutons dans ce domaine. L’avenir du web marketing se fera par la donnée. »

SANAE EL MEHDAOUI (2014)- SAEGUS


Sanae est diplômée d’une école d’ingénieur avec une spécialité en Business Intelligence. 


« Le Mastère Spécialisé a été un véritable tremplin pour moi, il m’a permis de voir comment aborder des problèmes que je n’avais pas rencontrés dans mon cursus ingénieur. »

Elle a rejoint début janvier Saegus, un cabinet de conseil en digital, filiale du groupe Colombus Consulting qui emploie une vingtaine de personnes. Elle y travaille comme Consultante en analyse de données et architecture distribuée.

 

« Notre travail consiste à aider nos clients à tirer le meilleur de leurs données. Notre approche repose principalement sur la conviction que le big data est un moyen, pas la finalité, et que la véritable valeur se situe dans les nouveaux usages et modèles économiques dont l’innovation technologique permet chaque jour l’émergence. »

Sanae travaille en ce moment pour deux clients : pour l’un sur des problématiques de science des données, statistiques, algorithmes de machine learning et pour l’autre sur la mise en place d’une base de données NoSQL.
 

« Ce qui m’a été le plus utile pendant la formation ? les cours de machine learning avec leur panorama complet sur les algorithmes existants. Les mathématiques nous ont permis de jouer avec ces algorithmes afin de les améliorer. L’étude du Web sémantique et l’analyse textuelle ont été très utiles également. »

Sanae était dans les 10 premiers embauchés lors de la création de Saegus. Ils sont maintenant une vingtaine. « Ce qui est bien quand on est présent dès le début de l’aventure d’une entreprise, c’est l’évolution que cela permet. D’ici 3 ou 4 ans j’aimerais m’orienter vers un poste d’architecte, où je pourrai mettre en valeur les technologies de l’entreprise et les projets que j’aurai pilotés auprès de nouveaux clients. »


JONATHAN BIBAS (2014)– ELLIS-CAR


Le Bac en poche à 16 ans, Jonathan est parti étudier l’informatique et le management à Londres puis à l’Université de Californie, dans un environnement d’entrepreneurs de la Silicon Valley. « Cette ambiance particulière m’a donné envie d’entreprendre », dit-il. Devant l’engouement croissant pour le big data et les objets connectés, il intègre le Mastère Spécialisé à son retour en France.

« La formation est très pratique, il y a beaucoup de TP, de projets… C ’était donc un cadre favorable pour créer en parallèle ma start-up, Ellis-Car. Plusieurs enseignants de l’École s’intéressent à la création d’entreprise et m’ont apporté leur soutien. »

Ellis-Car cherche à prédire la probabilité qu’un accident de voiture arrive à un conducteur en fonction de sa façon de conduire. A l’aide d’un objet connecté dans la voiture, Ellis-Car collecte de nombreuses données qui sont analysées pour estimer la qualité de la conduite. Le projet a tout de suite intéressé les assureurs, les constructeurs automobiles et les gestionnaires de parc. En 2014, Ellis-Car a été lauréate du Concours mondial de l’innovation. Elle compte une dizaine de personnes et ne cesse de s’agrandir.

« Notre objectif est de donner des notes de conduite pour sauver des vies, réduire le nombre d’accident, d’accrochages… On avertit le conducteur de ses erreurs pour lui permettre de les comprendre et de s’améliorer. Pour cela nous travaillons énormément la visualisation. Il faut trouver des approches attractives, interactives, ainsi nous pouvons récolter de plus gros volumes de données et renforcer la fiabilité de nos modèles. »

Jonathan privilégie l’utilisation de Python et de ses bibliothèques, car d’après lui, le machine learning se développe clairement autour de ce langage. Il s’appuie sur un serveur Node JS qui peut gérer des millions de sources simultanément, un avantage dans le domaine de l’objet connecté. Et pour la visualisation, il utilise D3 (data driven document), une bibliothèque javascript très riche permet- tant de créer des animations.

« Dès le mois de juin nous aurons des centaines de véhicules connectés en circulation et nous entrerons dans une nouvelle phase du projet » se félicite le jeune entrepreneur.


SORAYA BELHADJ-AISSA (2014) – YUZU.CO


Après un diplôme d’ingénieur en informatique, Soraya a réalisé un stage chez Thalès.

 
« C ’était assez précurseur, je travaillais sur la gestion de logs de données aériennes avec Hadoop et MongoBD. Mais je voyais bien que tout ce qui était machine learning me manquait.» 

Elle intègre donc le Mastère Spécialisé un an plus tard et choisit pour son stage la toute jeune start-up Yuzu.co où elle est recrutée par la suite. L’entreprise, qui compte une quinzaine de personnes, gère la diffusion d’offres promotionnelles entre e-commerçants.

La matière première de Soraya, ce sont les données comportementales issues des sites des clients de Yuzu.co : historique des achats, ajout de produits au panier, consultation d’avis, mais aussi données de navigation permettant de savoir si l’internaute est connecté depuis un poste fixe ou un mobile. A

cela s’ajoute les données clients issues du CRM (Customer Relationship Management)

« Au quotidien, je fais beaucoup de machine learning et je suis surtout confrontée à des problèmes de scalabilité : nous devons diffuser des offres en temps réel avec de très gros volumes de données. Les cours de machine learning m’ont donc beaucoup aidé. Les séminaires du jeudi, où les entreprises viennent présenter leurs projets et leurs méthodes de travail, m’ont étés très utiles car beaucoup d’entre elles se positionnent dans le marketing. »

En fonction des phases du projet, Soraya travaille sur du text-mining, des algorithmes de recommandation, de l’analyse de sentiment. Elle participe aussi à la conception d’architectures distribuées pour optimiser les temps de réponse.
Le business model de Yuzu.co étant basé sur la performance, la start-up 
a misé dès sa création sur le recrutement d’un data scientist : pari gagnant puisqu’elle affiche un fort taux de transformation entre le clic et l’achat…

« Je suis toujours en contact avec le Mastère Spécialisé puisque nous avons proposé un projet fil rouge aux étudiants et nous sommes très satisfaits des résultats ! ».

La boucle est bouclée.



ALEXANDRE DAVID (2014)- UBISOFT


Alexandre travaille comme data scientist au siège international d’Ubisoft, un des leaders mondiaux du jeu vidéo, depuis janvier 2015.

« Je travaille au département BI-CRM sur une base de données volumineuse qui va puiser dans une vingtaine de sources différentes pour un total de 130 millions d’utilisateurs et plus de 400 jeux. Elle a été conçue pour centraliser toutes les données possibles sur nos clients : profils démographiques, activités de gaming, fréquence, horaires et style de jeux… On croise cela avec les données non structurées issues des forums d’Ubisoft et des contacts avec les services clients ».

Alexandre cherche à tirer des insights intéressants de ces données pour les valoriser auprès de plusieurs départements, marketing, CRM et Uplay principalement, et leur permettre d’avoir des informations utiles pour prendre des décisions data driven. Pour tout ce qui est analyse, il se sert principalement de Python et de R, avant de passer à Spark ou Mahout dans le futur Cloud qui se met actuellement en place.

« Je travaille aussi sur le prédictif, pour optimiser certains process opérationnels : anticiper le churn et améliorer le lifecycle CRM en envoyant des informations aux clients à des moments clés. La visualisation de données est très importante également pour permettre aux équipes d’avoir des informations utiles et accessibles. J’ai enfin une mission d’évangélisation pour expliquer l’intérêt de mon travail aux différentes équipes. »

Chez Ubisoft, des data scientists travaillent également dans d’autres départements tels que le user research lab dans le but d’étudier le comportement des joueurs et fournir des informations pertinentes aux équipes de production.

« Le data scientist est une personne qui comprend les enjeux business de l’entreprise et qui peut proposer des analyses pour prendre des décisions, optimiser l’opérationnel pour être plus performant et avoir une relation plus personnalisée avec chaque client » conclut Alexandre.

422 vues Visites

J'aime

Commentaires0

Veuillez vous connecter pour lire ou ajouter un commentaire

Articles suggérés

Articles Revue TELECOM

Quels rôles jouent les technologies numériques dans l’évolution de la médecine du travail ? Groupe Santé#196

photo de profil d'un membre

Rédaction Revue TELECOM

01 avril

Articles Revue TELECOM

Le numérique au service de la décarbonisation #196

photo de profil d'un membre

Rédaction Revue TELECOM

01 avril

Articles Revue TELECOM

DC Brain nommé au prix de la croissance #196

photo de profil d'un membre

Rédaction Revue TELECOM

01 avril