Génération de Données en IA par Transport et Débruitage
S. MALLAT
Deep LearningImage processingModelling

Objectif du cours

Le cours étudie l’état de l’art de la génération d’images, de sons et de données scientifiques par réseaux de neurones profonds. Cela s’obtient par échantillonnage de  distributions de probabilités, grâce à une équation de transport. Le cours se concentre sur l’équation de score diffusion. Elle transforme un bruit blanc, en effectuant un débruitage progressif pour générer des données (images, sons,…). Cela nécessite d’estimer le score de la densité de probabilité, avec un réseau de neurone profond. Le cours introduit les bases mathématiques, algorithmiques et certaines applications.
Les sujets suivants seront abordés:
– Transport de probabilités en apprentissage profond. Génération et échantillonnage par transport.
– Équation de Fokker Plank donnant l’évolution de la densité de probabilité d’un système dynamique. Équation de Langevin pour l’échantillonnage de probabilités
– Génération de données par score diffusion. Applications à l’image et au son.  Lien avec le débruitage et la formule de Tweety-Myasawa.
– Apprentissage du score avec des réseaux de neurones profonds. Généralisation de l’apprentissage pour la génération de données.
– Interprétation des réseaux. Débruitage et parcimonie dans des bases orthogonales.
– Génération de données conditionnée par une information complémentaire
– Interpolant stochastiques pour la prédiction. Applications à la prédiction de systèmes physiques chaotiques comme la météorologie.

 

SITE WEB : https://www.college-de-france.fr/fr/chaire/stephane-mallat-sciences-des-donnees-chaire-statutaire

Organisation des séances

Le cours aura lieu du 15 Janvier jusqu’au 12 Mars, de 9h30 à 12h30, dans l’amphithéâtre Navarre du Collège de France.

Une séance de cours de 9h30 à 11h00 est suivie d’une présentation par un chercheur d’un domaine de recherche en lien avec le cours de 11h15 à 12h30.

Le cours est en Français.

Mode de validation

Le cours est validé par un projet sur l’un des challenges proposé par le site challenge.data.ens.fr . L’examen est un oral qui a lieu fin mars, avec la remise d’un rapport.

 

Les intervenants

Stéphane MALLAT

(ENS Ulm / Collège de France)

voir les autres cours du 2nd semestre