Cours « science des données » à Mines ParisTech (2021–2022).
Organisation de ce repo
environment.ymlpermet de charger l'environnement conda pour les notebooks via l'interface graphique d'Anaconda ou
conda env create -f environment.yml -n sdd2022
conda activate sdd2021Notez que cet environnement vous fait utiliser JupyterLab et non pas Jupyter Notebook. JupyterLab est plus moderne et plus agréable d'utilisation (voir la documentation). En particulier, JupyterLab permet de copier des cellules entre notebooks, et l'extension "Table of contents" qui facilite la navigation dans un notebook y est native.
poly/contient tous les fichiers permettant de compiler le poly. La dernière version compilée à jour s'intitulesdd_2021_poly.pdfpc/contient un répertoire par PCprojet/contient les données et instructions relatives au projet numérique.
Équipe pédagogique
- Responsables de cours : Bruno Figliuzzi et Adeline Fermanian
- Chargé·e·s d'enseignement :
Emploi du temps
-
lundi 30/05 :
- 13h45-15h15 : cours 1 — Introduction et statistique descriptive (Chapitres 1 & 2)
- 15h30-17h00 : cours 2 — Estimation et propriétés d'un estimateur (Chapitre 3, sections 3.1 à 3.4)
-
vendredi 3/06 :
- 9h00-10h30 : cours 3 — Techniques d'estimation (Chapitre 3, sections 3.5 & 3.6)
- 10h45-12h15 : PC 1 — Statistique inférentielle (TD)
-
vendredi 10/06 :
- 9h00-10h30 : cours 4 Réduction de dimension (Chapitre 5)
- 10h35-12h15 : PC 2 — Réduction de dimension (TP)
-
lundi 13/06 :
- 13h45-15h15 : cours 5 — Tests statistiques (Chapitre 4)
- 15h30-17h00 : cours 6 — Bonnes pratiques (Chapitre 6)
-
vendredi 17/06 :
- 9h00-10h30 : cours 7 - Introduction à l'apprentissage supervisé (Chapitre 7)
- 10h45-12h15 : PC 3 — Pré-traitement & introduction à scikit-learn pour l'apprentissage supervisé
-
lundi 20/06 :
- 13h45-15h15 : cours 8 — Régularisation (Chapitre 8)
- 15h30-17h00 : PC 4 — Sélection de modèles (TP)
-
vendredi 24/06 :
- 9h00-10h30 : cours 9 — Modèles d'apprentissage supervisé non-linéaires (Chapitre 9)
- 10h45-12h15 : PC 5 — Modèles linéaires pour la classification (TD)
-
vendredi 1/07 :
- 9h00-12h15 : cours 10 — Modèles d'apprentissage supervisé non-linéaires et applications pratiques
Pour contribuer à ce repo
Ce repo contient un script pre-commit.sh qui permet de le nettoyer (supprimer les fichiers auxiliaires de latex, nettoyer les notebooks avec nbstripout).
Il est possible de lancer automatiquement ce script lors d'un git commit grâce à un hook. Pour cela, il suffit de le copier dans le fichier .git/hooks/pre-commit ou d'utiliser un lien symbolique (pour conserver le contrôle de version) :
cd .git/hooks/
ln -s ../../pre-commit.sh pre-commit