06.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
Der T-Test ist ein statistischer Test, der verwendet wird, um zu bestimmen, ob die Mittelwerte zweier Gruppen signifikant voneinander abweichen. Es wird normalerweise verwendet, um zu überprüfen, ob eine bestimmte Behandlung oder ein bestimmtes Experiment eine signifikante Wirkung auf eine Gruppe von Personen oder Objekten hat. Der T-Test basiert auf der Annahme, dass die Werte in beiden Gruppen normal verteilt sind.
06.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
Explorative Datenanalyse, auch Explorative Datenanalytik oder Exploratives Datenmining genannt, ist eine Methode zur systematischen Erkundung und Verarbeitung von Daten, um neue Erkenntnisse und Einblicke zu gewinnen. Es ist ein iterativer Prozess, der es dem Forscher ermöglicht, Hypothesen zu bilden, Muster und Zusammenhänge zu erkennen und zu verstehen, wie Daten zusammenhangen und wie sie sich auf neue Erkenntnisse und Einsichten auswirken.
06.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
Die Standardabweichung ist ein Maß für die Streuung einer Gruppe von Werten. Es gibt an, wie weit die Werte von dem Mittelwert (arithmetisches Mittel) einer Gruppe abweichen. Es ist ein quantitativer Indikator für die Varianz in einem Satz von Daten.
06.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
Ein nichtparametrischer Test ist ein statistischer Test, der keine Voraussetzungen über die Verteilung der Daten erfordert. Sie sind besonders nützlich, wenn Sie Daten haben, die nicht normalverteilt sind oder wenn Sie keine Informationen über die Verteilung zur Verfügung haben. Nichtparametrische Tests sind in der Regel weniger leistungsfähig als parametrische Tests, aber in vielen Fällen können sie verwendet werden, um die gleichen Hypothesen zu testen.
06.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
Ein Konfidenzintervall ist ein Intervall, das eine Schätzung einer unbekannten Größe begrenzt. Es gibt eine Wahrscheinlichkeit, dass die unbekannte Größe innerhalb des Konfidenzintervalls liegt. Konfidenzintervalle sind ein häufiges Werkzeug in der Statistik, um eine Schätzung einer unbekannten Größe vorzunehmen. Sie werden häufig verwendet, um die Genauigkeit der Schätzung zu beurteilen und Voraussagen über eine angegebene Grundgesamtheit zu machen.