Skip to content

Commit e730fd3

Browse files
committed
📝 Add comparison between pandas, Polars, Dask and DuckDB
1 parent 9527b7a commit e730fd3

File tree

1 file changed

+28
-1
lines changed

1 file changed

+28
-1
lines changed

docs/workspace/pandas/index.rst

Lines changed: 28 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -31,7 +31,7 @@ pandas genutzt, um
3131

3232
.. tip::
3333
`cusy Seminar: Daten analysieren mit pandas
34-
<https://cusy.io/de/unsere-schulungsangebote/daten-analysieren-mit-pandas>`_
34+
<https://cusy.io/de/our-training-courses/analysing-data-with-pandas.html>`_
3535

3636
.. seealso::
3737
* `Home
@@ -43,6 +43,33 @@ pandas genutzt, um
4343
* `GitHub
4444
<https://github.com/pandas-dev/pandas/>`_
4545

46+
pandas vs. Polars vs. Dask und DuckDB
47+
-------------------------------------
48+
49+
Die Wahl zwischen pandas, `Polars <https://pola.rs>`_, :doc:`/performance/dask`
50+
und `DuckDB <https://duckdb.org>`_ hängt von der Art der Arbeitslast ab:
51+
52+
pandas
53+
ist die kanonische Python-DataFrame-Bibliothek für Analysen auf einem
54+
einzelnen Rechner.
55+
Polars
56+
ist in Rust geschrieben und erlaubt leistungsfähige Analysen auf einem
57+
einzigen Knoten oder wenn `Lazy
58+
Evaluation <https://de.wikipedia.org/wiki/Lazy_Evaluation>`_ und
59+
`Expressions-API
60+
<https://docs.pola.rs/api/python/stable/reference/expressions/index.html>`_
61+
wichtig sind.
62+
Dask
63+
ist eine Python-Bibliothek für paralleles Rechnen, die bekannte APIs,
64+
:abbr:`u.a. (unter anderem)` von pandas und `Scikit-Learn
65+
<https://scikit-learn.org/stable/>`_ auf Cluster skaliert.
66+
DuckDB
67+
ist eine In-Process `OLAP
68+
<https://de.wikipedia.org/wiki/Online_Analytical_Processing>`_-Datenbank
69+
für Analysen und SQL über **lokale** Dateien, die häufig pandas DataFrames
70+
ergänzt, da es sich hervorragend für In-Process-Analysen und SQL-Aufgaben
71+
eignet.
72+
4673
.. toctree::
4774
:hidden:
4875
:titlesonly:

0 commit comments

Comments
 (0)