Ils ont fait le MVA
Témoignage Parcours MVA start-up
Martin Plouy
« Le Master MVA m’a permis d’acquérir de nombreuses connaissances techniques et d’améliorer ma rigueur scientifique.
Grâce à sa très grande diversité de cours, j’ai été en mesure de choisir les cours les plus susceptibles de m’aider dans le développement de ma Start-Up : GipsyBot.
En effet, les différents cours autour du NLP m’ont permis d’approfondir mes connaissances du sujet et m’ont donné les bases nécessaires pour améliorer nos différents algorithmes qui détectent lorsqu’une tâche est demandée au sein d’une conversation.
Le parcours MVA Start-Up m’a permis de me faire réfléchir sur les innovations que nous apportons au marché de le gestion des tâches et ainsi de comprendre notre position sur un marche très concurrentiel qu’est celui de la gestion des taches,
Sur les points que je conseillerais d’approfondir au sein de ce parcours:
Se concentrer sur la partie start-up
Trouver un équilibre entre cours scientifique théorique et théorie de la start-up. »
Témoignage Data Science
Guillaume Obozinski
GUILLAUME OBOZINSKI MET L’APPRENTISSAGE STATISTIQUE AU SERVICE DES AUTRES DISCIPLINES
Chercheur à l’École des Ponts, Guillaume Obozinski travaille à la construction d’algorithmes d’apprentissages plus efficaces. Sa recherche porte sur les méthodes dites parcimonieuses et les algorithmes d’optimisation rapide. Il s’intéresse beaucoup aux applications depuis la compréhension du rôle des protéines jusqu’à la reconnaissance de scènes 3D en passant par la prévision des consommations électriques.
Il hésitait entre les neurosciences théoriques ou l’intelligence artificielle (IA)… ce sera finalement l’apprentissage statistique. Une révélation pour Guillaume Obozinski qui, sur les conseils de ses professeurs à l’École normale supérieure de Cachan (aujourd’hui École normale supérieure Paris-Saclay), a suivi à la fois des cours de théorie de probabilités, de statistiques, d’analyse et des cours d’informatique. « Ce double bagage m’a beaucoup aidé par la suite », souligne-t-il.
Lors d’un stage de recherche pendant son master MVA, il découvre la science telle qu’on la pratique aux États-Unis. Il adore : « le rapport à la science y est très différent de ce que l’on connaît en France, observe-t-il. Nous apprécions la précision, la rigueur, l’excellence, la théorie, tandis que les Américains aiment rêver la science, la pratiquer expérimentalement. Aux États-Unis, je passais des soirées à regarder des étoiles au télescope avec des étudiants passionnés d’astrophysique. » À l’époque, il était pertinent de partir aux États-Unis, car de nombreuses branches de l’apprentissage n’étaient encore que peu développées en France, mais aujourd’hui « le programme de formation du MVA est aussi riche que celui des meilleures universités américaines, et avec l’apparition d’un grand nombre de start-up dynamiques dans le domaine, la constitution d’équipes spécialisés en IA et data science dans plusieurs grand groupes européens, il existe de nombreuses opportunités en France et en Europe, notamment pour réaliser une thèse CIFRE1 en entreprise avec un encadrement académique », rappelle le chercheur.
COMBINER THÉORIE ET PROBLÉMATIQUES APPLIQUÉES
Aux États-Unis, Guillaume Obozinski poursuit une thèse à l’université de Berkeley en Californie sous la direction de Michael Jordan (pas le basketteur, bien-sûr, mais lui aussi très connu dans son domaine). Sa thèse est à la fois théorique et orientée vers les applications en bio-informatique. En particulier, il tente de prédire les fonctions des protéines, c’est-à-dire de deviner leur rôle dans l’organisme à partir de leur séquence ADN et de leur forme. Pour cela, il utilise des modèles dits « parcimonieux » : ce sont des modèles statistiques adaptés aux situations dans lesquelles on a plus de variables que de données (ici, plus de gènes à étudier que de patients). L’idée est alors de sélectionner les variables les plus pertinentes à étudier grâce à un algorithme.
Après sa thèse, le chercheur hésite entre rester aux États-Unis ou rentrer en France. Il est alors contacté par Francis Bach, un ancien du master MVA, directeur de Sierra, une équipe de recherche en apprentissage statistique à l’INRIA/ENS, qui lui propose un post-doc. Quelques années plus tard, il rejoint le laboratoire d’informatique de l’École des Ponts. Aujourd’hui, Guillaume Obozinski mène ses recherches sur plusieurs thématiques – toujours cette envie de combiner théorie et problématiques appliquées, et de mener plusieurs activités de front. L’un de ses doctorants travaille sur la « sémantisation » de scènes 3D en environnement urbain : comment reconnaître automatiquement des éléments tels que les rues, les arbres, les véhicules ou les piétons ? Ces recherches nécessitent de construire des algorithmes d’apprentissage rapide prenant en compte les dépendances qui existent entre les différentes variables, par exemple le fait qu’un arbre ne flotte pas, ou qu’une fenêtre est rarement située au niveau du sol.
Un autre doctorant tente d’améliorer les modèles de prévision des consommations électriques, en collaboration avec Réseau de transport d’électricité (RTE), l’entreprise chargée d’acheminer l’électricité haute tension. Un troisième fait une thèse co-encadrée par Facebook sur « l’apprentissage de représentations pour le raisonnement dans les bases de données de connaissance ». L’idée est que les machines deviennent capables d’inférer à partir de nouvelles connaissances sans même qu’on leur indique les règles logiques ou les relations existantes. Par exemple, qu’elles soient capables de repérer que les gens nés aux États-Unis sont américains, sans qu’on leur indique cette règle, et même s’il y a des exceptions.
SON CONSEIL AUX DATA SCIENTISTS :
De son riche parcours, Guillaume Obozinski a tiré quelques conseils pour les étudiants. Notamment d’apprendre à dialoguer avec les experts des domaines d’applications sur lesquels ils travaillent. Il est souvent nécessaire d’acquérir des connaissances dans le domaine appliqué, pour parler « la même langue ». Par exemple la connaissance fine des caractéristiques de la consommation électrique était cruciale pour la construction de modèles de prévision.
Car « ce qui est passionnant, c’est qu’il ne s’agit pas de maths pour les maths : au départ, il y a quelque chose de non mathématique, qu’il faut formuler au mieux en termes mathématiques. » Le chercheur suggère aussi de travailler, du moins au début, avec des personnes expérimentées. « Il peut être tentant d’aller dans une start-up ou une entreprise sans culture de l’intelligence artificielle, mais il est nécessaire de côtoyer d’autres experts, lors d’une thèse ou dans un environnement où l’on peut échanger sur les aspects techniques. »
CÉCILE MICHAUT
(Source: https://dataanalyticspost.com/guillaume-obozinski-met-lapprentissage-statistique-service-autres-disciplines/)
1 Ce dispositif de « convention industrielle de formation par la recherche » permet aux entreprises de bénéficier d’une aide financière pour recruter de j