Kontingenztafel


Der Mittelwert ist der wichtigste Zentralwert. Man zählt alle vorhandenen Werte zusammen und teilt durch deren Anzahl. Kontingenz hat dabei die Bedeutung des gemeinsamen Auftretens von zwei Merkmalen. Für eine dreidimensionale Tafel drei Merkmale werden zusätzliche Spalten in die Tabelle eingefügt:. Die in Klammern hinzugesetzten Prozentwerte sollen nur den Blick darauf lenken, dass die Produktneigung keinesfalls vom Geschlecht abhängig war:

Navigationsmenü


Verwendet man die Daten der Erhebung nun weiterhin für die gesamte Bevölkerung, ist der Sprung von der Statistik zur Wahrscheinlichkeitsrechnung vollzogen.

Die Schnittmenge dieser beiden Mengen ist also leer. Man kann die Klasseneinteilung einfach machen, man kann jedoch auch eine Wissenschaft daraus machen. Gegeben seinen die beiden Menge A und B mit: Knecht Ruprecht bereitet für den 6. Eine absolute Häufigkeit ist eine Anzahl. Es handelt sich daher immer um eine natürliche Zahl [0; 1; 2; …]. Eine relative Häufigkeit ist ein prozentualer Anteil, also eine Wahrscheinlichkeit.

Es handelt sich daher immer um eine Zahl zwischen 0 und 1 [bzw. Im Normalfall addiert man immer die Häufigkeiten von der betreffenden Zahl bis zu Null runter. Gegeben sei eine Urne mit zwölf bunten und ganz tollen Kugeln. Geben Sie die absoluten, die relativen und die zugehörigen kumulierten Häufigkeiten an.

Die absoluten Häufigkeiten sind eine Anzahl. Die absolute kumulierte Häufigkeiten sind: Geben Sie sinnvolle Klassen an, sowie deren absolute, relative und die zugehörigen kumulierten Häufigkeiten an. In der Aufgabenstellung sind die relativen kumulierten Häufigkeiten gegeben. Da man Anzahlen erhält, in dem man die Gesamtanzahl mit den entsprechenden Häufigkeiten multipliziert, ergibt sich:.

Mittelwert, Median und Modus sind sogenannte Zentralwerte. Eine treffende [wenn auch mathematisch blöde] Formulierung wäre: Bei der Berechnung muss man unterscheiden, ob man: Häufigkeit der ausgesuchten interessanten Klasse.

Folgende Anzahl von Notfällen werden notiert: Familie Günther besitzt eine kleine Farm. Eine Ziege wiegt 40kg, ein Schaf 30kg und ein Hund wiegt 20kg. Die Häufigkeiten davon sind: Die dritte Klasse ist die erste, deren Häufigkeit erstmalig über 0,5 liegt. Für die folgende Formel ist die dritte Klasse für uns interessant. Der Modus ist 0,95 Gramm! Es gibt unzählige Typen von Diagrammen, ungefähr so viele, wie Graffiti in Madrid und die meisten Diagramme sind auch genau so wichtig.

An dieser Stelle werden wir nur drei Typen von Diagrammen betrachten, die die Ehre haben, unsere huldvolle Beachtung zu finden:. Es gibt schier unendlich viele Möglichkeiten und Regeln ein Histogramm zu zeichnen. Eine einfache Möglichkeit ist, die Breite der Balken immer gleich breit zu zeichnen und auf der y-Achse die absolute oder relative Häufigkeit aufzutragen.

Eine andere Möglichkeit wäre, auf der x-Achse die Werte der Daten einzutragen, auf der y-Achse den Quotient zwischen der eingetragenen Balkenbreite und der relative Häufigkeit. Leider ist die Darstellung eines Boxplotdiagramms nicht standarisiert, d. Auf der y-Achse gibt es keine Einheiten. In die Zeichnung wird ein Rechteck gezeichnet, welches links beim ersten Quartil, rechts beim dritten Quartil endet. Im Inneren des Rechtecks zeichnen wir den Mittelwert ein.

Folgende Anzahl von Notfällen werden notiert:. Die auftauchenden Werte tragen wir als Rechtecke ein. Daraus bestimmen wir die zugehörigen Winkel. Natürlich kann man die Kreissektoren auch einfärben oder sonstwie verschönern. Den Mittelwert haben wir in Kap. Was sind überhaupt unsere Daten? Theoretisch ist beim Histogramm und beim Kreisdiagramm beides möglich. Wir zeichnen in dieser Aufgabe [willkürlich] ein Histogramm, in welchem auf der x-Achse die Klassenbreite aufgetragen wird und auf der y-Achse der Quotient aus der Häufigkeit und der Klassenbreite.

Der Erwartungswert ist ein Durchschnitt bzw. Die Varianz hat keine anschauliche Bedeutung, sie ist nur das Quadrat der Streuung. Stellen Sie sich mal folgende Situation vor: Dies kann eine interessante Information sein — es kann aber auch nur ein Trugschluss sein. Die Auswertung der Befragung hinsichtlich des Alters der Kunden ergibt:. Das Kaufverhalten hängt also nicht nur vom Geschlecht, sondern auch vom Alter der Befragten ab.

Das Bedürfnis, beide Informationen über Abhängigkeiten in einen realistischen Bezug zueinander zu bringen, erzwingt die Erarbeitung einer dreidimensionalen Kontingenztafel. Insbesondere durch die statistischen Verfahren, die auf Kontingenztabellen aufbauen, werden Anforderungen an die Kategorien eine einzelne Merkmalsausprägung oder eine Zusammenfassung von verschiedenen Merkmalsausprägungen gestellt:.

Für eine dreidimensionale Tafel drei Merkmale werden zusätzliche Spalten in die Tabelle eingefügt:. Die in Klammern hinzugesetzten Prozentwerte sollen nur den Blick darauf lenken, dass die Produktneigung keinesfalls vom Geschlecht abhängig war: Um dieses Phänomen einleuchtender zu machen, lohnt sich möglicherweise wieder der Blick auf eine diesmal wieder zweidimensionale Kontingenztafel:.

Die jüngeren Kunden bevorzugen das Produkt A — nicht etwa die weiblichen! Es handelt sich bei der Geschlechterrelation aus dem Beispiel nur um ein scheinbares Verhältnis, das aufgrund der unausgewogenen statistischen Menge entstehen konnte. Zur graphischen Darstellung zweidimensionaler Kontingenztabellen bieten sich 3D-Balkendiagramme an.

Ein Nachteil solcher Diagramme ist jedoch, dass je nach Blickwinkel Balken verdeckt werden können. Zudem führt die 3D-Darstellung eine Perspektive ein, die es dem Betrachter schwierig machen kann, die Höhe der Balken miteinander zu vergleichen, um zu erkennen, in welcher Zelle nun mehr Beobachtungen sind.

Für die stetige Gleichverteilung gilt das Gleichheitszeichen. Er ist — wie auch der Median bzw. Die mittlere absolute Abweichung engl. Aufgrund der Extremaleigenschaft des Medians gilt im Vergleich mit der mittleren absoluten Abweichung stets. Durch die Definition ergibt sich im Falle von normalverteilten Daten folgender Zusammenhang zur Standardabweichung:. Die mittlere absolute Abweichung ist ein robuster Schätzer für die Standardabweichung. Weitergeleitet von Streuung Statistik.