Schött-Web

Signifikanztest und Binomialverteilung

Bei einem Signifikanztest gelten die Art der Wahrscheinlichkeitsverteilung (im Folgenden die Binomialverteilung) und alle Parameterwerte bis auf einen als bekannt. Ein Signifikanztest wird nur dann durchgeführt, wenn es Zweifel an einer bereits aufgestellten Hypothese über diesen unbekannten Parameterwert gibt. Weil sich eine solche Hypothese mit Hilfe eines Signifikanztests als null und nichtig erweisen soll, wird sie als Nullhypothese H0 bezeichnet. Es ist allerdings unmöglich, mit Hilfe eines Signifikanztest die Gültigkeit oder Ungültigkeit einer Hypothese zu beweisen. Das Ziel eines Signifikanztests besteht lediglich darin, eine Entscheidung darüber zu ermöglichen, ob die Nullhypothese H0 zugunsten einer Alternativhypothese H1 abgelehnt oder lieber beibehalten werden sollte. Dabei besteht stets die Gefahr eines Irrtums. Um die Wahrscheinlichkeit zu begrenzen, H0 irrtümlicher Weise zugunsten von H1 abzulehnen, wird vor dem Durchführen des Tests ein Signifikanzniveau α vorgegeben, das als obere Schranke für diese Irrtumswahrscheinlichkeit dient.

Im Folgenden wird eine Bernoulli-Kette der Länge n mit einer unbekannten Erfolgswahrscheinlichkeit p betrachtet. Die zugehörige Zufallsvariable X, welche die Anzahl der Erfolge beschreibt, ist also binomialverteilt und soll als Prüfgröße dienen. Die Nullhypothese, H0p=p0, über den Wert von p wird nur dann zugunsten einer Alternativhypothese H1 abgelehnt, wenn der empirische Befund x in einem signifikanten Gegensatz zu H0 steht, der für die Annahme von H1 spricht. Je nach Beschaffenheit von H1 kann man verschiedene Arten von Signifikanztests unterscheiden:

  • H1pp0 (Beidseitiger Test)
  • H1p<p0 (Linksseitiger Test)
  • H1p>p0 (Rechtsseitiger Test)
  • H1p=p1 (Alternativtest)

Diese vier Arten von Signifikanztests können Sie im Folgenden untersuchen.

Alternativhypothese H1

Entscheidungsregel

Bei jeder Art von Signifikanztest muss eine Entscheidungsregel aufgestellt werden, nach der zu entscheiden ist, ob H0 zugunsten von H1 abgelehnt wird oder nicht. H0 wird nur dann zugunsten von H1 abgelehnt, wenn der empirische Befund x in die kritische Region K fällt, die stets mindestens die folgende Bedingung erfüllen muss:

PXKH0α.

Die Wahrscheinlichkeit, mit der die Nullhypothese H0 im Fall ihrer Gültigkeit zugunsten von H1 abgelehnt wird, darf also nicht größer als das vorgegebene Signifikanzniveau α sein. Ob ein empirischer Befund x diese – vor dem Durchführen des Tests festzulegende – Bedingung erfüllt, kann man auch prüfen, ohne zuvor die Grenzen von K bestimmt zu haben. Dazu berechnet man die Wahrscheinlichkeit, mit der man x oder einen noch stärker für das Ablehnen von H0 zugunsten von H1 sprechenden Befund erhielte, wenn H0 gültig wäre. Diese Wahrscheinlichkeit, die als empirisches Signifikanzniveau α bezeichnet wird, darf nicht größer als α sein:

αα.

Bei α handelt es sich nicht um eine Irrtumswahrscheinlichkeit, die nämlich eine Eigenschaft des Tests wäre, sondern lediglich um eine – von H0 abhängige – Eigenschaft des empirischen Befunds x. Deshalb muss α vor dem Durchführen des Tests festgelegt werden, um seriös entscheiden zu können.

Beim Aufstellen der Entscheidungsregel sind je nach Art des Signifikanztests spezielle Bedingungen, die ggf. zusätzlich erfüllt werden müssen, zu berücksichtigen.

Beidseitiger Test

Beim beidseitigen Test werden die kritischen Zahlen klinks und krechts der kritischen Region

K=01klinkskrechtskrechts+1n

so bestimmt, dass klinks die größte und krechts die kleinste derjenigen ganzen Zahlen ist, welche die Bedingung

PXklinksH0α2PXkrechtsH0α2

erfüllen.

Ein empirischer Befund x fällt genau dann in die kritische Region K, wenn gilt:

α=Min2PXxH02PXxH01α.

Linksseitiger Test

Beim linksseitigen Test wird die kritische Zahl klinks der kritischen Region

K=01klinks

so bestimmt, dass klinks die größte derjenigen ganzen Zahlen ist, welche die Bedingung

PXklinksH0α

erfüllen.

Ein empirischer Befund x fällt genau dann in die kritische Region K, wenn gilt:

α=PXxH0α.

Rechtsseitiger Test

Beim rechtsseitigen Test wird die kritische Zahl krechts der kritischen Region

K=krechtskrechts+1n

so bestimmt, dass krechts die kleinste derjenigen ganzen Zahlen ist, welche die Bedingung

PXkrechtsH0α

erfüllen.

Ein empirischer Befund x fällt genau dann in die kritische Region K, wenn gilt:

α=PXxH0α.

Alternativtest

Beim Alternativtest sind zwei Fälle zu unterscheiden:

1. Fall

Im Fall p1<p0 wird die kritische Zahl klinks der kritischen Region

K=01klinks

so bestimmt, dass klinks die größte derjenigen Zahlen ist, welche die Bedingung

PXklinksH0αPX=klinksH1>PX=klinksH0

erfüllen.

Ein empirischer Befund x fällt genau dann in die kritische Region K, wenn gilt:

α=PXxH0αPX=xH1>PX=xH0.

2. Fall

Im Fall p1>p0 wird die kritische Zahl krechts der kritischen Region

K=krechtskrechts+1n

so bestimmt, dass krechts die kleinste derjenigen ganzen Zahlen ist, welche die Bedingung

PXkrechtsH0αPX=krechtsH1>PX=krechtsH0

erfüllen.

Ein empirischer Befund x fällt genau dann in die kritische Region K, wenn gilt:

α=PXxH0αPX=xH1>PX=xH0.

Arten von Fehlern und ihre Wahrscheinlichkeiten

Grundsätzlich sind bei Signifikanztests bis zu drei Arten von Fehlern möglich. Ein Fehler 1. Art wird begangen, wenn H0 gültig ist, aber zugunsten von H1 abgelehnt wird:

Fehler 1. Art: H0XK.

Wenn dagegen H1 gültig ist, aber H0 beibehalten wird, so wird ein Fehler 2. Art begangen:

Fehler 2. Art: H1XK.

Von einem Fehler 3. Art spricht man, wenn sowohl H0 als auch H1 ungültig sind und deshalb jede Testentscheidung falsch ist:

Fehler 3. Art: ¬H0¬H1.

Die folgende Tabelle soll einen Überblick über alle möglichen Fälle liefern, die beim Durchführen von Signifikanztests eintreten können.

Tatsächlicher Zustand der Wirklichkeit
Testentscheidung H0 ist gültig. H1 ist gültig. H0 und H1 sind ungültig.
H0 wird zugunsten von H1 abgelehnt. Fehler 1. Art Richtige Entscheidung Fehler 3. Art
H0 wird beibehalten. Richtige Entscheidung Fehler 2. Art

Bedauerlicher Weise lässt sich in der Regel keine der Wahrscheinlichkeiten, mit denen die drei möglichen Arten von Fehlern jeweils eintreten, berechnen. Dies liegt daran, dass die Wahrscheinlichkeiten P(H0) und P(H1), mit denen H0 und H1 jeweils gültig sind, sowohl vor als auch nach dem Durchführen des Tests unbekannt sind. Im Spezialfall, dass es sicher ist, dass H0 oder H1 gültig ist, – wie es beim beidseitigen Test der Fall ist – kann allerdings der Fehler 3. Art innerhalb des mathematischen Modells, das von einer binomialverteilten Prüfgröße ausgeht, ausgeschlossen werden:

P(H0H1)=1P(¬H0¬H1)=0.

Irrtumswahrscheinlichkeit 1. Art

Unter der Annahme, H0 sei gültig, lässt sich die bedingte Wahrscheinlichkeit berechnen, mit der man einen Fehler 1. Art beginge, falls H0 gültig wäre. Diese hypothetische Wahrscheinlichkeit, die durch das vorgegebene Signifikanzniveau α nach oben beschränkt wird, bezeichnet man als Irrtumswahrscheinlichkeit 1. Art:

Irrtumswahrscheinlichkeit 1. Art: PXKH0.

Wenn zusätzlich zur Irrtumswahrscheinlichkeit 1. Art auch noch die Wahrscheinlichkeit P(H0), mit der H0 gültig ist, bekannt wäre, ließe sich auch die Wahrscheinlichkeit des Fehlers 1. Art berechnen:

P(H0XK)=P(H0)PXKH0.

Diese Wahrscheinlichkeit ist aber ohnehin bedeutungslos, wenn es um die Beurteilung der Güte eines Signifikanztests geht, weil sie eben von P(H0) abhängt. Die Güte eines Signifikanztests darf schließlich nicht von der Wahrscheinlichkeit abhängen, mit der die Nullhypothese gültig ist.

Irrtumswahrscheinlichkeit 2. Art

Unter der Annahme, H1 sei gültig, kann es – je nach Art des Signifikanztests – auch möglich sein, die bedingte Wahrscheinlichkeit zu berechnen, mit der man einen Fehler 2. Art beginge, falls H1 gültig wäre. Diese hypothetische Wahrscheinlichkeit bezeichnet man als Irrtumswahrscheinlichkeit 2. Art:

Irrtumswahrscheinlichkeit 2. Art: PXKH1.

Diese Wahrscheinlichkeit ist allerdings nur dann definiert, wenn H1 einen konkreten Zahlenwert p1 für die unbekannte Erfolgswahrscheinlichkeit p festlegt, wie es beim Alternativtest der Fall ist.

Wenn zusätzlich zur Irrtumswahrscheinlichkeit 2. Art auch noch die Wahrscheinlichkeit P(H1), mit der H1 gültig ist, bekannt wäre, ließe sich auch die Wahrscheinlichkeit des Fehlers 2. Art berechnen:

P(H1XK)=P(H1)PXKH1.

Diese Wahrscheinlichkeit ist aber ohnehin genauso bedeutungslos wie die Wahrscheinlichkeit des Fehlers 1. Art, wenn es um die Beurteilung der Güte eines Signifikanztests geht, weil sie eben von P(H1) abhängt. Die Güte eines Signifikanztests darf schließlich nicht von der Wahrscheinlichkeit abhängen, mit der die Alternativhypothese gültig ist.

Güte eines Signifikanztests

Um die Güte eines Signifikanztests beurteilen zu können, genügt es nicht, nur die Irrtumswahrscheinlichkeiten 1. und 2. Art zu betrachten. Die Güte wird erst dann erkennbar, wenn man das Verhalten des Tests für alle möglichen Werte desjenigen Parameters, dessen tatsächlicher Wert unbekannt ist, untersucht. Diesem Zweck dient die Gütefunktion G, die jedem möglichen Parameterwert diejenige Wahrscheinlichkeit zuordnet, mit der die Nullhypothese abgelehnt werden würde, wenn es sich um den tatsächlichen Parameterwert der Wirklichkeit handelte.

Im obigen Beispiel der Bernoulli-Kette mit unbekannter Erfolgswahrscheinlichkeit p ordnet G jedem p01 die zugehörige Ablehnwahrscheinlichkeit von H0 zu:

G(p)=PXKp mit p01.