Was ist Supervised Learning?

20.09.2023 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS

Überwachtes Lernen ist ein Ansatz des maschinellen Lernens, bei dem ein Algorithmus aus markierten Trainingsdaten lernt, um Vorhersagen oder Entscheidungen zu treffen. Dabei werden dem Algorithmus Eingabe-Ausgabe-Paare zur Verfügung gestellt, wobei die Eingabe (auch Merkmale oder Attribute genannt) die Daten und die Ausgabe (auch Etiketten oder Ziele genannt) die entsprechende gewünschte Vorhersage oder Klassifizierung darstellt.

Ziel des überwachten Lernens ist es, dass der Algorithmus ein Mapping oder eine Funktion erlernt, die von den bereitgestellten markierten Beispielen verallgemeinert werden kann, um genaue Vorhersagen oder Entscheidungen für ungesehene oder zukünftige Daten zu treffen. Der Algorithmus lernt, indem er Muster, Beziehungen oder statistische Eigenschaften in den Trainingsdaten identifiziert und dieses Wissen dann nutzt, um Vorhersagen oder Klassifizierungen für neue, nicht gekennzeichnete Daten zu treffen.

Das überwachte Lernen kann in zwei Haupttypen unterteilt werden:

Klassifizierung: Bei Klassifizierungsaufgaben lernt der Algorithmus, den Eingabedaten auf der Grundlage der in den Trainingsbeispielen beobachteten Muster vordefinierte Etiketten oder Klassen zuzuweisen. Bei einem Datensatz von E-Mails, die als "Spam" oder "kein Spam" gekennzeichnet sind, kann ein Klassifizierungsalgorithmus beispielsweise lernen, neue, noch nicht gesehene E-Mails entweder als Spam oder als kein Spam zu klassifizieren.

Regression: Bei Regressionsaufgaben lernt der Algorithmus, auf der Grundlage der Eingabedaten einen kontinuierlichen numerischen Wert oder eine numerische Größe vorherzusagen. Bei einem Datensatz von Wohnungspreisen mit entsprechenden Merkmalen wie Größe, Lage und Anzahl der Zimmer kann ein Regressionsalgorithmus beispielsweise lernen, den Preis eines neuen, noch nicht gesehenen Hauses vorherzusagen.

Sowohl bei der Klassifizierung als auch bei der Regression wird die Leistung des Algorithmus für überwachtes Lernen in der Regel anhand von Bewertungsmaßstäben wie Genauigkeit, Präzision, Wiedererkennungswert oder mittlerer quadratischer Fehler bewertet, je nach dem spezifischen Problembereich.

Überwachtes Lernen ist in verschiedenen Anwendungen weit verbreitet, z. B. in der Bilderkennung, der Verarbeitung natürlicher Sprache, der Stimmungsanalyse, der Betrugserkennung und vielen anderen Bereichen, in denen markierte Daten zum Trainieren des Algorithmus verfügbar sind.

Schlagworte: #analyse #daten #erfolg #fehler #regression #statistisch

Gefällt mir (0)

Kommentar

vorheriger Beitrag
Welche Rolle spielen soziale Medien im Online-Marketing?

nächster Beitrag
Beruf als PR-Berater in Agentur - Das sollte man vor dem Studium be...

Unser Angebot an Sie:

Medien- und PR-Datenbank 2025

Nur für kurze Zeit zum Sonderpreis: Die Medien- und PR-Datenbank mit 2025 mit Informationen zu mehr als 21.000 Zeitungs-, Magazin- & Hörfunk-Redaktionen uvm.

Newsletter

Abonnieren Sie unseren Newsletter und erhalten Sie aktuelle Neuigkeiten & Informationen zu Aktionen:

Aktuelles / Blog: Wissensdatenbank