06.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
Data Engineering ist ein Teilbereich der Informatik, der sich mit der Entwicklung, dem Design, der Implementierung und dem Betrieb von Datenbanken, Systemen und Anwendungen zur Datenverarbeitung befasst. Es umfasst die Verwendung von Technologien wie Datenbanken, Datenbankabfragen, Datenbankadministration, Datenanalyse, Data Warehousing, Data Mining, Business Intelligence und Big Data. Es ist ein sehr wichtiger Bestandteil der Datenwissenschaft und des maschinellen Lernens.
06.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
Datenaufbereitung ist ein Prozess, bei dem Daten für verschiedene Zwecke aufbereitet werden. Dabei werden die Daten sortiert, strukturiert, analysiert und aufbereitet, um sie für bestimmte Anwendungen nutzbar zu machen. Dies kann durch verschiedene Verfahren wie Datenbanken, Datenaggregation, Datenmanipulation, Datenanalyse und Datenvisualisierung erreicht werden. Die Datenaufbereitung ist ein wichtiger Teil des Data-Warehouse-Designs und der Datenbankmanagementtechnologien.
06.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
Datenbankarchitektur ist ein Teilgebiet der Informatik, das sich mit der Konstruktion, der Organisation und der Verwaltung von Datenbanken befasst. Es beinhaltet die Entwicklung von Datenbankmodellen, die Definition von Speicherstrukturen, die Festlegung von Zugriffsmethoden und die Implementierung der Datenbank. Darüber hinaus umfasst die Datenbankarchitektur auch die Planung und Verwaltung der Netzwerk- und Systemressourcen, die zur Unterstützung der Datenbank erforderlich sind.
06.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
Data Cleansing ist eine Technik, mit der Datenbanken bereinigt werden, um fehlerhafte, unvollständige oder ungenaue Daten zu beseitigen. Es umfasst auch das Korrigieren von Formatierungsfehlern, die Möglichkeit der Datenintegration, die Entfernung von Dubletten und die Aufweichung oder Anpassung von Daten, die nicht den Standards entsprechen. Data Cleansing ist ein wichtiger Bestandteil der ETL-Prozesse (Extract-Transform-Load), bei denen Daten aus verschiedenen Quellen in eine Datenbank importiert und dann in einem benutzerfreundlichen Format gespeichert werden.
05.12.2022 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS
NoSQL ist eine Sammlung von Datenbank-Technologien, die sich von traditionellen relationalen Datenbanken unterscheiden. NoSQL-Datenbanken sind auf horizontale Skalierbarkeit, schnelle Analysen, hohe Verfügbarkeit und fehlertolerante Replikation ausgelegt. NoSQL-Datenbanken können in einer Vielzahl von Anwendungsfällen nützlich sein, insbesondere bei anspruchsvollen Anforderungen an Skalierbarkeit und Leistung. Die meisten NoSQL-Datenbanken verwenden eine andere Art von Datenmodell als die relationalen Datenbanken, die auf einem relationalen Modell basieren.