Schlüsselkomponenten der Explorativen Datenanalyse (EDA)
05.03.2024 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
1. Deskriptive Statistik:
- Mittelpunktmaße: Berechnung von Mittelwerten, Medianen und Moden.
- Streuungsmaße: Analyse von Variabilität durch Berechnung von Standardabweichung, Quartilen und Bereich.
2. Visualisierungstechniken:
- Histogramme, Boxplots, Scatterplots, Heatmaps, Pair Plots.
3. Univariate Analyse:
- Untersuchung von einer einzelnen Variable.
4. Bivariate Analyse:
- Untersuchung von Beziehungen zwischen zwei Variablen.
5. Multivariate Analyse:
- Analyse von Beziehungen zwischen mehr als zwei Variablen.
6. Identifikation von Ausreißern:
- Anwendung von Methoden wie IQR oder Z-Score zur Identifizierung von Ausreißern.
7. Imputierung von fehlenden Daten:
- Bestimmung von Strategien zur Handhabung fehlender Daten.
8. Transformation von Daten:
- Anwendung von Transformationen wie Logarithmen, Standardisierung oder Normalisierung.
9. Hypothesenbildung:
- Aufstellen von Hypothesen auf Grundlage der explorativen Analyse.
10. Kontextualisierung:
- Berücksichtigung des Kontexts der Daten und der Domäne.
Die explorative Datenanalyse ist ein iterativer und interaktiver Prozess, der die Grundlage für weiterführende statistische Analysen und Modellbildung legt.