Mineures Informatiques pour les non informaticiens

-

Etre inscrit en L2 ou L3 : M, P, GC, EEA, C, PC, ST, SV

S3 - S5
m3b-I : Pré-traitement de données en Python
Prérequis :
Pour les C, PC, ST et SV : avoir suivi "Compétences numériques" en L1 contenant "Introduction à la programmation"
Pour les M, P, GC, EEA : avoir suivi les cours d'informatique de L1

Mineure Informatique (m3b-I)

Semestre : S3

39h – 4 ECTS

-

UE Pré-traitement de données en Python

12h de CM et 27h de TD

-

Prérequis

Algorithmique, Programmation Python

**********************************************************************************

Compétences visées

Après une introduction dans l’algorithmique et la programmation, les étudiants seront familiarisés avec la programmation Python en utilisant des données représentées sous différentes formes : vecteurs, matrices, graphes, flux de données. La deuxième partie du cours est dédié aux calculs matriciels et statistiques en utilisant les librairies numpy, pandas et la librairie matplotlib pour une introduction à la visualisation de données. Enfin, la dernière partie du cours concerne la qualité de données et notamment le nettoyages de données en utilisant des techniques adaptés à la détection des informations non-relevantes et aberrantes, notamment les méthodes de recherche des motifs fréquents. Enjeux du cours Les étudiants seront capable de traiter différents types de données en Python, faire des calculs matriciels et statistiques. Ce cours permettra aussi aux étudiants d’améliorer la qualité de données en détectant les données non-pertinentes et aberrantes.
-

Programme du cours

Introduction et rappel en algorithmique (3h CM)

Introduction à l’algorithmique et la programmation

Paradigme et langages de programmation

Algorithmique sur les tableaux

Représentation de données (3h CM ; 6h30 TD)

Types de données : introduction

Données vectorielles et tabulaires

Données de type graphes et flux de données

Importation et traitement de différents types de données en Python

Calculs matriciels en Python

Introduction aux calculs matriciels et définitions de base (1h30 CM et 2h TD)

La librairie Numpy pour les calculs matriciels (3h30 TD)

L’analyse statistiques avec Python (1h30 CM et 2h TD ; 3h TD)

Introduction à la visualisation de données et la librairie Pandas (3h30 TD)

Nettoyage de données : (3h CM ; 3h30 TD ; 3h TD)

Introduction au nettoyage de données

Données non-pertinentes et aberrantes : détection et transformation

Recherches des motifs fréquents dans les données
--

S4 - S6
m4b-I : Analyse de données et visualisation
Prérequis :
Avoir suivi la mineure m3b-I

Mineure Informatique (m4b-I)

Semestre : S4

39h – 4 ECTS

-

UE Analyse de Données et Visualisation

12h de CM et 27h de TD

-

Prérequis

Avoir suivi la mineure m3b-I : Prétraitement de données en Python

**********************************************************************************

Enjeux du cours

Les étudiants seront capables d’effectuer une analyse univarié et bivarié sur des données réelles en utilisant des techniques de projection de données. Ce cours permet également d’avoir les capacités de visualiser des données multivariées et d’utiliser l’apprentissage artificiel pour la régression linéaire et la classification.

-

Compétences visées

Après une introduction dans l’analyse de données en utilisant des méthodes de prétraitement et de normalisation, ce cours se focalise sur la visualisation de données bi-variés et multi-variés.

Pour la visualisation de données, les méthodes de projection qui permettent de prendre en compte la topologie de données sont utilisés. Les travaux pratiques pour l’analyse et la visualisation de données sont effectués en Python en utilisant les librairies pandas, numpy, stats et matplotlib.

La dernière partie du cours concerne une introduction à l’apprentissage artificiel et notamment l’utilisation de la régression linaire et le classificateur Naïf Bayes. Les travaux pratiques pour cette partie seront faits en utilisant le librairie sklearn en Python.

Tout au long du module, un Projet sera réalisé par les étudiants qui permettra de mettre en œuvre les aspects statistiques, de visualisation et d’apprentissage artificiel sur un exemple réel (un dataset réel).

-

Programme du cours
 

I. Pré-traitement de données (3hCM 3h30 TD)
          Introduction à l’analyse de données
          Techniques de transformation et normalisation de données
          Travail pratique en Python en utilisant des datasets réels pour l’analyse et la normalisation

II. La visualisation de données (3hCM 3h30 TD)
          Principes et problématique de la visualisation
          Introduction à l’analyse et visualisation de données univariés et bivariés
          Visualisation des mesures statistiques sur les données
          Travail pratique en utilisant matplotlib pour la visualisation des données
-

Projet - Phase 1 - Introduction (3h TD)

Cette phase du projet contient l’analyse et le pré-traitement de données, la transformation, la normalisation et le nettoyage de données, ainsi que la visualisation.
-

III. Analyse topologique de données (3hCM, 7h30TD)
          Introduction à l’analyse topologique et problématique
          Modèles linéaires et non-linéaires pour l’analyse topologique
          Extraction des connaissances topologiques à partir de données réelles
          Applications
          Travaux pratiques en utilisant des modèles topologiques en Python
-

Projet - Phase 2 - Avancement (3h TD)

Durant cette phase du Projet, les méthodes topologiques et d’apprentissage artificiel (régression et classification) doivent être utilisés pour l’extraction et la visualisation des connaissances extraites.
-

IV. Méthodes d’apprentissage artificiel pour l’analyse et la projection de données (3h CM, 3h30TD, 3h30TD)
          Introduction à l’apprentissage artificiel et la projection de données
          Méthodes de régression : corrélations et régression linéaire
          Méthodes de classifications : l’approche Naif Bayes
​​​​​​​          Travaux pratiques pour la régression et la classification en utilisant la librairie sklearn en Python
​​​​​​​-

-

Etre inscrit en L2 ou L3 : M, P, GC, EEA, C, PC, ST, SV

S5
m5g-I : Traitement de données et apprentissage
Prérequis : Avoir suivi les mineures m3b-I et m4b-I

Saisissez ici le contenu ici

S6
m6g-I : Introduction à l'intelligence artificielle
Prérequis : 
Avoir suivi les mineures m3b-I et m4b-I et m5g-I 

Saisissez ici le contenu ici