06.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
Datenintegration ist ein Prozess, bei dem Daten aus verschiedenen Quellen konsolidiert, verarbeitet und harmonisiert werden, um sie zu einem zusammenhängenden Informationssystem zu kombinieren. Der Zweck der Datenintegration ist es, alle relevanten Informationen aus verschiedenen Quellen zu kombinieren, um ein einheitliches Verständnis des Datenbestands zu ermöglichen. Dadurch können Unternehmen auf einheitliche Weise auf die Daten zugreifen und sie in der Entscheidungsfindung und im Geschäftsprozess nutzen.
06.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
Data Governance ist ein formeller Ansatz zur Verwaltung und Steuerung von Daten in einer Organisation. Es umfasst Richtlinien und Prozesse, die das Sammeln, Verarbeiten, Speichern und Verwenden von Daten regeln. Ziel von Data Governance ist es, den Wert von Daten für die gesamte Organisation zu maximieren. Dazu gehören das Definieren, Dokumentieren und Überwachen von Prozessen rund um Daten, um wiederkehrende, konsistente Ergebnisse zu erzielen.
06.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
Datenqualität bezieht sich auf die Genauigkeit, Vollständigkeit, Integrität und Aktualität von Daten. Es ist ein Maß für die Verlässlichkeit und Richtigkeit der Informationen, die in einem Datensatz enthalten sind. Eine hohe Datenqualität erhöht die Zuverlässigkeit von Entscheidungen, die auf dem Datensatz basieren.
06.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
Der Median ist ein zentraler Wert einer Datenreihe, der anzeigt, wo die Mitte der Daten liegt. Der Median wird berechnet, indem man die Werte der Reihe in aufsteigender Reihenfolge sortiert und dann den Wert in der Mitte auswählt. Der Median kann ein besserer Indikator als der Durchschnitt sein, da er weniger durch extreme Werte beeinflusst wird.
06.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
Der Mann-Whitney-Test ist ein nichtparametrischer statistischer Test, der verwendet wird, um zu testen, ob zwei unabhängige Stichproben aus der gleichen Grundgesamtheit stammen. Es ist eine Variante des Signifikanztests, die dazu verwendet wird, um zu beweisen, dass zwei Gruppen unterschiedliche Mittelwerte haben, ohne dass eine Normierung vorliegt. Es wird auch als Wilcoxon-Rangsummentest bezeichnet