Was ist Data Cleansing?
06.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
Data Cleansing ist eine Technik, mit der Datenbanken bereinigt werden, um fehlerhafte, unvollständige oder ungenaue Daten zu beseitigen. Es umfasst auch das Korrigieren von Formatierungsfehlern, die Möglichkeit der Datenintegration, die Entfernung von Dubletten und die Aufweichung oder Anpassung von Daten, die nicht den Standards entsprechen. Data Cleansing ist ein wichtiger Bestandteil der ETL-Prozesse (Extract-Transform-Load), bei denen Daten aus verschiedenen Quellen in eine Datenbank importiert und dann in einem benutzerfreundlichen Format gespeichert werden.