Vous êtes ici :
- 🏠
- CY Cergy Paris Université
- Syllabus ST
Mineures Informatiques pour les non informaticiens
-
Etre inscrit en L2 ou L3 : M, P, GC, EEA, C, PC, ST, SV
- S3 - S5
m3b-I : Pré-traitement de données en Python
Prérequis :
Pour les C, PC, ST et SV : avoir suivi "Compétences numériques" en L1 contenant "Introduction à la programmation"
Pour les M, P, GC, EEA : avoir suivi les cours d'informatique de L1 -
Mineure Informatique (m3b-I)
Semestre : S3
39h – 4 ECTS
-
UE Pré-traitement de données en Python
12h de CM et 27h de TD
-
Prérequis
Algorithmique, Programmation Python
**********************************************************************************
Compétences visées
Après une introduction dans l’algorithmique et la programmation, les étudiants seront familiarisés avec la programmation Python en utilisant des données représentées sous différentes formes : vecteurs, matrices, graphes, flux de données. La deuxième partie du cours est dédié aux calculs matriciels et statistiques en utilisant les librairies numpy, pandas et la librairie matplotlib pour une introduction à la visualisation de données. Enfin, la dernière partie du cours concerne la qualité de données et notamment le nettoyages de données en utilisant des techniques adaptés à la détection des informations non-relevantes et aberrantes, notamment les méthodes de recherche des motifs fréquents. Enjeux du cours Les étudiants seront capable de traiter différents types de données en Python, faire des calculs matriciels et statistiques. Ce cours permettra aussi aux étudiants d’améliorer la qualité de données en détectant les données non-pertinentes et aberrantes.
-Programme du cours
Introduction et rappel en algorithmique (3h CM)Introduction à l’algorithmique et la programmation
Paradigme et langages de programmation
Algorithmique sur les tableaux
Représentation de données (3h CM ; 6h30 TD)Types de données : introduction
Données vectorielles et tabulaires
Données de type graphes et flux de données
Importation et traitement de différents types de données en Python
Calculs matriciels en PythonIntroduction aux calculs matriciels et définitions de base (1h30 CM et 2h TD)
La librairie Numpy pour les calculs matriciels (3h30 TD)
L’analyse statistiques avec Python (1h30 CM et 2h TD ; 3h TD)
Introduction à la visualisation de données et la librairie Pandas (3h30 TD)
Nettoyage de données : (3h CM ; 3h30 TD ; 3h TD)Introduction au nettoyage de données
Données non-pertinentes et aberrantes : détection et transformation
Recherches des motifs fréquents dans les données
-- - S4 - S6
m4b-I : Analyse de données et visualisation
Prérequis :
Avoir suivi la mineure m3b-I -
Mineure Informatique (m4b-I)
Semestre : S4
39h – 4 ECTS
-
UE Analyse de Données et Visualisation
12h de CM et 27h de TD
-
Prérequis
Avoir suivi la mineure m3b-I : Prétraitement de données en Python
**********************************************************************************
Enjeux du cours
Les étudiants seront capables d’effectuer une analyse univarié et bivarié sur des données réelles en utilisant des techniques de projection de données. Ce cours permet également d’avoir les capacités de visualiser des données multivariées et d’utiliser l’apprentissage artificiel pour la régression linéaire et la classification.
-
Compétences visées
Après une introduction dans l’analyse de données en utilisant des méthodes de prétraitement et de normalisation, ce cours se focalise sur la visualisation de données bi-variés et multi-variés.
Pour la visualisation de données, les méthodes de projection qui permettent de prendre en compte la topologie de données sont utilisés. Les travaux pratiques pour l’analyse et la visualisation de données sont effectués en Python en utilisant les librairies pandas, numpy, stats et matplotlib.
La dernière partie du cours concerne une introduction à l’apprentissage artificiel et notamment l’utilisation de la régression linaire et le classificateur Naïf Bayes. Les travaux pratiques pour cette partie seront faits en utilisant le librairie sklearn en Python.
Tout au long du module, un Projet sera réalisé par les étudiants qui permettra de mettre en œuvre les aspects statistiques, de visualisation et d’apprentissage artificiel sur un exemple réel (un dataset réel).
-
Programme du cours
I. Pré-traitement de données (3hCM 3h30 TD)
Introduction à l’analyse de données
Techniques de transformation et normalisation de données
Travail pratique en Python en utilisant des datasets réels pour l’analyse et la normalisation
II. La visualisation de données (3hCM 3h30 TD)
Principes et problématique de la visualisation
Introduction à l’analyse et visualisation de données univariés et bivariés
Visualisation des mesures statistiques sur les données
Travail pratique en utilisant matplotlib pour la visualisation des données
-Projet - Phase 1 - Introduction (3h TD)
Cette phase du projet contient l’analyse et le pré-traitement de données, la transformation, la normalisation et le nettoyage de données, ainsi que la visualisation.
III. Analyse topologique de données (3hCM, 7h30TD)
-
Introduction à l’analyse topologique et problématique
Modèles linéaires et non-linéaires pour l’analyse topologique
Extraction des connaissances topologiques à partir de données réelles
Applications
Travaux pratiques en utilisant des modèles topologiques en Python
-Projet - Phase 2 - Avancement (3h TD)
Durant cette phase du Projet, les méthodes topologiques et d’apprentissage artificiel (régression et classification) doivent être utilisés pour l’extraction et la visualisation des connaissances extraites.
IV. Méthodes d’apprentissage artificiel pour l’analyse et la projection de données (3h CM, 3h30TD, 3h30TD)
-
Introduction à l’apprentissage artificiel et la projection de données
Méthodes de régression : corrélations et régression linéaire
Méthodes de classifications : l’approche Naif Bayes
Travaux pratiques pour la régression et la classification en utilisant la librairie sklearn en Python
-
-
Etre inscrit en L2 ou L3 : M, P, GC, EEA, C, PC, ST, SV
- S5
m5g-I : Traitement de données et apprentissage
Prérequis : Avoir suivi les mineures m3b-I et m4b-I -
Saisissez ici le contenu ici
- S6
m6g-I : Introduction à l'intelligence artificielle
Prérequis :
Avoir suivi les mineures m3b-I et m4b-I et m5g-I -
Saisissez ici le contenu ici