You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
`git-annex <https://git-annex.branchable.com/>`_ konzentriert sich mehr auf die
42
+
Entdeckung und Verwendung von Datensätzen, die dann einfach mit Git verwaltet
43
+
werden. DVC hingegen speichert die Daten, die bei jeden Schritt der Pipeline
44
+
erzeugt werden, in :file:`.dvc`-Dateien, die dann durch Git verwaltet werden
45
+
kann. DVC stellt zudem praktische Tools zur Manipulation und Visualisierung von Daten-Pipelines bereit, siehe :abbr:`z.B.(zum Beispiel)` :doc:`dvc status
46
+
<dag>`. Schließlich lassen sich mit :ref:`dvc remote <dvc-remote>` auch externe
47
+
Abhängigkeiten angeben.
48
+
49
+
Workflow-Management-Systeme wie Airflow und Luigi
50
+
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
51
+
52
+
DVC konzentriert sich auf Data-Science-Workflows und Modellierung; daher sind
53
+
DVC-Pipelines sehr viel leichtgewichtiger, einfacher zu erstellen und zu ändern
54
+
als bei `Airflow <https://airflow.incubator.apache.org>`_ und `Luigi
55
+
<https://luigi.readthedocs.io/en/stable/>`_. Allerdings fehlen DVC erweiterte
56
+
Funktionen wie die Überwachung der Ausführung, Optimierung und Fehlertoleranz.
57
+
Auch ist DVC ein reines Befehlszeilen-Tool ohne grafische Benutzeroberfläche und
58
+
es führt auch keine Daemons oder Server aus. `CML <https://cml.dev>`_ versucht
59
+
hier, einige der Lücken leichtgewichtig mit GitHub, GitLab oder Bitbucket zu
60
+
schließen. DVC und CML eignen sich jedoch gut für iterative
61
+
Machine-Learning-Prozesse; und wenn mit den beiden ein gutes Modell gefunden
62
+
wurde, steht euch immer noch frei, die Pipeline in Luigi oder Airflow zu
63
+
integrieren.
64
+
54
65
Installation
55
66
------------
56
67
@@ -83,9 +94,11 @@ Alternativ kann DVC auch über andere Paketmanager installiert werden:
0 commit comments