Python_Explorer

Try anything and everything new in python

Librairies:

Colorama:
Notes:
- "Fore": couleur de premier plan
- "Back": couleur d'arrière plan
- "Style": permet de changer le style

Lois & Thérorèmes:

Loi Faible des Grands Nombres:
Principe: Quand la taille de votre échantillon augmente, la moyenne empirique (observée) converge en probabilité vers la moyenne réelle de la population.
Utilité: Cela garantit que les estimations basées sur des données échantillionnées deviennent fiables à mesure que le volume de données augmente.
Loi Forte des Grands Nombres:
Principe: Plus forte que la loi faible des grands nombres, elle assure que la moyenne empirique converge presque sûrement vers la moyenne réelle, et ce pour presque toutes les réalisations possibles.
Utilité: Vous êtes sûr que vos calculs sur des données répétées (ou simulées) reflèteront la réalité à long terme.
Théroème Central Limite:
Principe: Peu importe la distribution d'origine de vos données, la moyenne d'un grand nombre d'échantillons suit une distribution normale.
Utilité: C'est la raison pour laquelle la normalité est si omniprésente en statistiques; elle permet de faire des ests et des intervalles de confiance, même si les données ne sont pas initialement normales.

Stats:

Standardisation:
Objectif: Transformer les données pour qu'elles aient une moyenne nulle et une variance égale à 1.
Méthode: Chaque valeur de la donnée est transformée en soustrayant la moyenne de la variable et en divisant par l'écart-type de cette variable.
Utilisation: utilisée lorsque les données suivent une distribution normale ou gaussienne. Particulièrement utile pour les algorithmes basés sur les distances (comme les SVM, KNN) et ceux qui utilisent des régularisations (régressions linéaires et logistiques).
Normalisation:
Objectif: Redimensionner les données pour qu'elles se situent dans un intervalle spécifique, souvent [0,1] ou [-1,1].
Méthode: Chaque valeur de la donnée est transformée en soustrayant la vzaleur minimale et en divisant par l'intervalle de la variable (la différence entre la valeur maximale et minimale).
Utilisation: Utilisée lorsque les données ne suivent pas une distribution gaussienne et ont des écarts significatifs en termes d'échelle. Particulièrement utile pour les réseaux de neurones et les algorithmes qui utiisent des distances (comme KNN).
Interprétation d'une ACP:
PC1 = première composante principale
PC2 = deuxième composante principale
Dans l'espace PC1-PC2, LS a pour coordonnées (0.5, 0.85): la composante de PC1 est de 0.5 et celle de PC2 de 0.85
0.85 étant supérieur à 0.5 (en absolu), cela signifie que la LS est plus importante pour PC2.
La longueur du vecteur reflète l'importance de la contribution de LS à la variance des données. Plus le vecteur est long, plus LS contribue à la variance des données dans les deux directions principales.
La direction du vecteur indique où LS contribue le plus à la variance des données.

OpenData links:

Kaggle [https://www.kaggle.com/datasets]
Data Gouv [https://www.data.gouv.fr/fr/datasets/]
Google Data Search [https://datasetsearch.research.google.com]
UCI ML Repository [https://archive.ics.uci.edu]
Amazon Public Datasets [https://aws.amazon.com/marketplace/search/results?trk=868d8747-614e-4d4d-9fb6-fd5ac02947a8&sc_channel=el&FULFILLMENT_OPTION_TYPE=DATA_EXCHANGE&CONTRACT_TYPE=OPEN_DATA_LICENSES&filters=FULFILLMENT_OPTION_TYPE%2CCONTRACT_TYPE]

Liens:

Aquarel : https://medium.com/@alexroz/matplotlib-makeover-6-python-styling-libraries-for-amazing-plots-5152f16992f5
Marimo : https://marimo.io - https://github.com/marimo-team/marimo (jupyter notebook in real time)
Mypy : https://github.com/python/mypy
Taipy : https://taipy.io (web application)

Mémo technique:

pip freeze > requirements.txt : génerer le fichier requirements avec les dépendances et leur version.
python3 -m venv pyenv : créer un environnement virtuel (macOS)
source pyenv/bin/activate : activer l'environnement virtuel (macOS)
pip install -r requirements.txt : importer les dépendances dans l'environnement depuis le fichier requirements

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
assets		assets
img		img
.DS_Store		.DS_Store
.gitignore		.gitignore
Chart_aquarel.py		Chart_aquarel.py
Colorama_package.py		Colorama_package.py
CuteCharts.ipynb		CuteCharts.ipynb
ExtractText_fromPDF.py		ExtractText_fromPDF.py
Localize_phone.py		Localize_phone.py
Mypy.py		Mypy.py
README.md		README.md
Save_as_parquet.py		Save_as_parquet.py
Tips_Linux.py		Tips_Linux.py
Tips_python.py		Tips_python.py
Tips_regex.py		Tips_regex.py
arctic_light.jpg		arctic_light.jpg
python_cheatsheet_1736400088.pdf		python_cheatsheet_1736400088.pdf
requirements.txt		requirements.txt
xlsWriter.py		xlsWriter.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Python_Explorer

Librairies:

Lois & Thérorèmes:

Stats:

OpenData links:

Liens:

Mémo technique:

About

Uh oh!

Releases

Packages

Languages

2FromField/Python_Explorer

Folders and files

Latest commit

History

Repository files navigation

Python_Explorer

Librairies:

Lois & Thérorèmes:

Stats:

OpenData links:

Liens:

Mémo technique:

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages