Was ist ETL-Pipeline?
Eine ETL-Pipeline (Extract, Transform, Load) ist ein automatisierter Datenprozess, der Daten aus verschiedenen Quellen extrahiert, transformiert und in ein Zielsystem wie ein Data Warehouse lädt. Die Extraktion sammelt Rohdaten aus APIs, Datenbanken und Dateien. Die Transformation bereinigt, normalisiert und reichert die Daten an. Das Laden schreibt die aufbereiteten Daten ins Zielsystem.
Bedeutung
Moderne ELT-Varianten laden Rohdaten zuerst und transformieren sie im Warehouse. Tools wie n8n, Airbyte und Fivetran automatisieren ETL-Prozesse ohne Programmieraufwand.