Teilen:

Wissensdatenbank

Was ist die Likelihood-Ratio-Statistik und wie wird sie verwendet?

10.10.2023 | von Patrick Fischer, M.Sc., Gründer & Data Scientist: FDS

Die Likelihood-Ratio-Statistik (LR-Statistik) ist ein statistisches Maß, das in der Hypothesentestung und Modellauswahl verwendet wird. Sie basiert auf dem Likelihood-Verhältnis, das den relativen Fit zweier konkurrierender statistischer Modelle bewertet.

Um die LR-Statistik zu berechnen, werden zwei Modelle verglichen: das Nullmodell und das Alternative- oder erweiterte Modell. Das Nullmodell stellt die Nullhypothese dar, während das Alternative Modell die alternative Hypothese darstellt. Das Nullmodell ist in der Regel ein vereinfachtes Modell, das von der Annahme ausgeht, dass bestimmte Parameter oder Zusammenhänge nicht vorhanden sind. Das Alternative Modell beinhaltet zusätzliche Parameter oder bietet eine alternative Darstellung der Daten.

Der erste Schritt bei der Berechnung der LR-Statistik besteht darin, die Likelihood-Funktion für jedes Modell zu maximieren. Die Likelihood-Funktion misst die Wahrscheinlichkeit, dass die beobachteten Daten unter den gegebenen Modellannahmen auftreten. Die maximale Likelihood wird erreicht, indem die Parameterwerte gewählt werden, die die größte Wahrscheinlichkeit für die beobachteten Daten liefern.

Die LR-Statistik wird dann berechnet, indem der Logarithmus des Quotienten der maximalen Likelihoods beider Modelle genommen wird. Formal ausgedrückt:

LR-Statistik = 2 * (log-Likelihood des Alternative-Modells - log-Likelihood des Null-Modells)

Die LR-Statistik folgt in der Regel einer Chi-Quadrat-Verteilung, wenn die Stichprobenumfang groß genug ist und bestimmte Annahmen erfüllt sind. Mit der LR-Statistik können Hypothesentests durchgeführt werden, indem kritische Schwellenwerte für die LR-Statistik festgelegt werden. Wenn die berechnete LR-Statistik den kritischen Schwellenwert überschreitet, kann die Nullhypothese verworfen werden, und es gibt Hinweise darauf, dass das Alternative Modell eine bessere Anpassung an die Daten bietet.

Die LR-Statistik wird auch in der Modellauswahl verwendet, um zwischen verschiedenen konkurrierenden Modellen zu entscheiden. In diesem Fall wird das Modell mit der größeren LR-Statistik als das bessere Modell betrachtet, da es eine bessere Anpassung an die Daten bietet.

Es ist wichtig zu beachten, dass die Verwendung der LR-Statistik von bestimmten Annahmen und Voraussetzungen abhängt, insbesondere von der Gültigkeit der asymptotischen Verteilungseigenschaften. Darüber hinaus sollte die LR-Statistik nicht isoliert betrachtet werden, sondern in Verbindung mit anderen Informationen und Überlegungen bei der Interpretation der Ergebnisse.

Gefällt mir (0)
Kommentar

Unser Angebot an Sie:

Medien- und PR-Datenbank 2024

Nur für kurze Zeit zum Sonderpreis: Die Medien- und PR-Datenbank mit 2024 mit Informationen zu mehr als 21.000 Zeitungs-, Magazin- & Hörfunk-Redaktionen uvm.

Newsletter

Abonnieren Sie unseren Newsletter und erhalten Sie aktuelle Neuigkeiten & Informationen zu Aktionen: