Retour aux actualités
Article suivant Article précédent

Revue TELECOM 177 - La plate-forme Teralab

Articles Revue TELECOM

-

15/10/2015


LA PLATE-FORME TERALAB

Par Ivan de Lastours et Anne-Sophie Taillandier dans la revue TELECOM n° 177

Quand l’État facilite l’accès au big data pour l’innovation, la recherche et l’enseignement.

Teralab (www.teralab-datascience.fr) est la première plate-forme big data sponsorisée par l’État français. Issue du plan d’investissements d’avenir, elle a pour objectif de doter l’innovation, la recherche et l’enseignement d’importantes capacités de traitement big data : infrastructure, logiciels, équipe. Elle est pilotée par l’Institut Mines-Télécom et le GENES.

Des moyens inédits en France

 

L’équipe Teralab est composée d’experts et d’administrateurs d’infrastructure et plate-forme, de data scientists et de business developers. Elle est également appuyée par des chercheurs reconnus dans l’analyse des données et le machine learning. Cette équipe met à disposition une infrastructure, un environnement logiciel et un ensemble de conseils pour répondre au mieux aux utilisateurs de Teralab.

Teralab est une infrastructure de confiance

Elle est disponible sous deux formes. La première, hébergée aux Mines de Douai, est constituée d’un ensemble de serveurs dit « commodity » et d’une machine « teramemory » répondant à la consommation d’importantes quantités de mémoire vive. Cette flexibilité au niveau de l’infrastructure permet à Teralab de couvrir un large spectre de cas d'utilisation. Chaque projet évolue dans un espace cloisonné et sécurisé. La seconde forme est réservée à des données ultra-sensibles pour lesquelles le GENES met à disposition son infrastructure ultra sécurisée par une identification biométrique.

L'environnement logiciel installé varie également, selon les cas d'utilisation. L'offre Teralab inclut des systèmes d'exploitation, des distributions 
Hadoop (emblématique du big data), des environnements de développement R ou Python, des bases de données noSQL, des outils de visualisation, des ateliers intégrés tels que Dataiku... Tout élément nécessaire à l’étude du cas d’utilisation traité est mis à disposition.

L’équipe de Teralab aide les différents acteurs à choisir le format de projet le plus adapté à leur besoin : projet collaboratif de type Plan d’investisse- ment d’avenir, projet Européen, labo- ratoire commun, Challenge, «Proof of Concept »… ainsi que l’accompagnement juridique adéquat. Les précieuses données sont ensuite chargées dans un environnement dédié, accessible uniquement aux utilisateurs du projet.

Mais l’apport de Teralab ne s’arrête pas là et peut aller bien au-delà de la simple mise à disposition de ressources. L’équipe Teralab intervient également sur des projets en impliquant directement des chercheurs data scientists qui vont orienter les choix techniques ou algorithmiques.

Une grande variété de projets d’innovation et de recherche

L’entrée sur Teralab se fait via des projets de recherche impliquant des acteurs industriels. Les principaux dispositifs éligibles sont les projets colla- boratifs nationaux (FUI, ANR...), les projets collaboratifs européens (ITEA EIT, H2020), les projets bilatéraux avec un laboratoire de recherche de l’Institut Mines-Télécom ou du GENES, les challenges big data du type de celui de Cap Digital et les projets d’enseignement. Avec l’implication d’acteurs industriels et académiques, les dispositifs garantissent à la fois l’aspect recherche et développement et le potentiel économique du cas d’utilisation.

Après 18 mois d’existence, plus de 15 projets sont déjà hébergés sur Teralab et certains sont d’un haut niveau de confidentialité, preuve de la confiance des utilisateurs en la sécurité de la plate-forme. Celle ci tourne déjà à 80% de ses capacités et a été mise à niveau à l’été 2015 pour pouvoir intégrer les nombreux projets à l’étude. Les cas d’utilisation vont de tests de performances techniques à de la détection de fraude en passant par de la sécurisation de frontières maritimes. Elle sert aussi à des écoles pour les enseignements.

 

Projet CAP

Le projet CAP, lauréat ITEA 2, regroupe 27 partenaires, une dizaine de pays et une dizaine de « use case ». L’objectif de CAP est de fournir une plate-forme flexible permettant de stocker et d’accéder à des données hétérogènes en temps réel, de les analyser pour des domaines d’activités variés. Actuellement pour le partenaire La Poste, Teralab héberge deux laboratoires de recherche de l’Institut Mines-Télécom (Télécom Bretagne, Télécom ParisTech) et Bluestone ou encore Thalès, investis dans l’analyse de 6 To de données.

Projet Intersec

Intersec, acteur de référence du big data dans le secteur des télécommunications, a utilisé fin 2014 les capacités de la platle-forme Teralab pour mener des tests de performances. Leur objectif était de comparer précisément les performances des diffétentes technologies de stockage des données (disques durs, RAM et flash) sur des environnements fortement " scalables ". Il ressort des tests que la mémoire RAM est très significativement plus rapide que l’accès disque, avec une vitesse de traitement de données pour une requête simple atteignant 1,6 million d’événements par seconde, contre quelque 620 000 pour la mémoire disque. Ces tests permettront à Intersec de recommander une architecture de stockage à ses cllients et à être plus précis lors de la prévision de temps de chargement et de calcul.

Projet Square Predict

C’est un projet big data ambitieux pour le monde de l’assurance. Square Predict est mené avec plusieurs partenaires dont un géant de l’assurance, trois laboratoires de recherche (LIPN, LIPADE et LARIS), deux éditeurs et un expert en protection de la vie privée. Il a pour objectif de bâtir une plate-forme permettant aux assureurs de réaliser des prédictions à partir des données de leurs assurés, croisées avec celles disponibles sur Internet (réseaux sociaux, web sémantique, open data…).

L’enjeu pour les assureurs est d’exploiter cette avalanche de données pour ne pas se voir concurrencés dans la distribution de leurs produits par des géants comme Google, Facebook ou Amazon. En effet, leur capacité à proposer des produits ciblés, en traitant les immenses volumes de données en leur possession donne un avantage concurrentiel sans égal à ces grands acteurs de l’Internet.

Square Predict doit permettre aux assureurs de valoriser et monétiser le patri- moine de données qu’ils ont accumulées depuis des années, pour par exemple estimer l’impact des dégâts causés par un événement climatique, prédire les risques d’incendie ou détecter l’apparition de la grippe. Square Predict a été l’un des premiers projets de Teralab et a permis une familiarisation précoce et accélérée avec la technologie Spark, emblématique de l’évolution vers le temps réel du big data en général et d’Hadoop en particulier.

Quelle place dans l’écosystème big data ?

Le Plan national pour l'industrie du futur, le partenaire public-privé big data lancé par Nelly Kroes (dont l'Institut Mines-Télécom est membre), l'Alliance big data, les actions des pôles de compétitivité comme Cap digital, les SATT, les instituts Carnot,... tous ces acteurs constituent un écosystème riche et dynamique au cœur duquel s’inscrit Teralab. Teralab est un catalyseur ayant pour ambition le développement de la société numérique des données.

Cette plate-forme n’est pas figée, elle est évolutive et de nouveaux choix techniques sont constamment faits pour la maintenir au meilleur niveau technique et d’intégration. Teralab entre aujourd’hui dans une seconde phase d’exploitation et est prête à accueillir des projets industriels ambitieux. A vous de saisir cette chance et d’investir sur des projets big data !


Biographie de l'auteur

Ivan de Lastours  travaille sur du financement de projets R&D à la direction de l'innovation de l'institut Mines-Télécom. Il travaille plus particulièrement sur les problématiques Big Data et digital publishing. Il est ingénieur diplômé de l'Epita, titulaire d'un Master de gestion de l'université díAix en Provence et du Master Finance de l'ESCP Europe.

 




Biographie de l'auteur
Anne-Sophie Taillandier est diplômée de Supelec (92) et a soutenu une thèse en mathématiques appliquées (statistiques et réseaux de neurones) à l'Ecole Normale Supérieure de Cachan en 1998 sous la direction de Robert Azencott.  
Elle dÈbute sa carriËre à la Direction de la recherche et développement de Dassault Systèmes en 1998 sur le logiciel CATIA. Après 10 années et différents postes (de la R&D aux ressources humaines), elle prend de nouvelles fonctions de directrice du développement chez Dictao  (inclus dans Safran Morpho depuis 2014), éditeur logiciel spécialisé dans líauthentification forte.  En 2012, elle devient CTO de LTU Technologies, Èditeur logiciel en reconnaissance díimages. Par ailleurs, en 2013, elle rejoint la commission connaissance de Cap Digital.  Depuis Juin 2015, elle a rejoint la Direction de l'Innovation de l'Institut Mines Telecom pour diriger le programme Teralab et soutenir les activités autour de l'industrie du futur.

 











S































 

354 vues Visites

J'aime

Commentaires0

Veuillez vous connecter pour lire ou ajouter un commentaire

Articles suggérés

Articles Revue TELECOM

Comment la France peut réussir dans le quantique # 197

photo de profil d'un membre

Rédaction Revue TELECOM

28 juillet

Articles Revue TELECOM

ORDINATEUR QUANTIQUE ET CRYPTOGRAPHIE POST-QUANTIQUE #197

photo de profil d'un membre

Rédaction Revue TELECOM

13 juillet

Articles Revue TELECOM

Editorial l'informatique quantique # 197

photo de profil d'un membre

Rédaction Revue TELECOM

13 juillet