Statistik 4.2

Im Moment gehe ich mir hier selber ‚grad mächtig auf die Nerven. Die bisherige Art zu schreiben ist definitiv nicht meine. So nah am Original und mit Zitaten, das muß nicht sein. Da könnte ich ja gleich den Studienbrief abtippen. Allerdings sollte an dieser Stelle erwähnt werden, dass ich es für eine große Leistung halte, theoretische Sachverhalte überhaupt verständlich zu Papier zu bringen. (Wenn ich mir vorstelle, Musiktheorie so aufschreiben zu müssen, dass es jeder lesen und verstehen kann, dann halte ich das fast für aussichtslos.) Also probiere ich heute ‚mal, in eigenen Worten zu schreiben, was es mit der empirischen Verteilungsfunktion auf sich hat und ich muß zugeben, dass mir in den (leider noch wenigen) Augenblicken der Erleuchtung Statistik sogar Spaß macht. (In Moodle würde ich für diesen Satz wohl als bekloppt gelten und deshalb lasse ich solche Äußerungen dort mal lieber sein.) Das liegt vielleicht auch daran, dass mir die vielen Begriffe nun nicht mehr völlig fremd sind und die einsamen Buchstaben ebenso. Ich werde deshalb nicht weiter versuchen, irgendwelche Formeln hier reinzupressen, obwohl ich dank der Hilfe von Thomas Bergen theoretisch wohl in der Lage dazu wäre.

Entzaubert hat sich die empirische Verteilungsfunktion von selbst bzw. durch die bildliche Darstellung in Form einer Treppe. Wenn man zu einer absoluten Häufigkeit (das sind die Zahlen, die wirklich da sind oder anders: mehrere, verschieden hohe Butterpäckchenstapel nebeneinander) die nächste addiert und dazu wieder die nächste usw., kann man gar nicht anders, als auf einen Blick sehen, dass die Werte immer größer werden (man sortiert die Butterstapel der Größe nach und könnte wie auf einer Treppe darauf bist zum obersten gehen, das funktioniert aber nur, wenn die Butter noch fast gefroren ist, ansonsten gibt es ziemlichen Matsch und Ärger im Laden oder bei Muddi). Das ist und heißt im Fachsprech: monoton steigend. Was mich in der Formel immer wieder etwas ratlos macht, ist die -1 (in anderen auch gerne +1). Das muß etwas damit zu tun haben, dass man insgesamt nur auf einen Wert von 1 kommen darf. Aber, das finde ich schon noch ‚raus.

Bei der relativen Häufigkeitsverteilung (das waren die Prozente) wird die absolute Häufigkeit (also die tatsächlichen Zahlen bzw. die Anzahl der Butterpäckchen) einfach durch die Menge des Datensatzes (alle Butterstücke zählen!) geteilt. Das war’s schon, denn damit hat man auch die empirische Verteilungsfunktion.

Bei kleinen Datensätzen ist das alles noch sehr übersichtlich (z. B. in der eigenen Küche). Für größere Datenmengen bietet es sich selbstredend auch hier an, Klassen zu bilden (dafür bitte die Buttermenge wiegen oder ablesen: z. B. bis 5 Gramm im Mehrsternehotel, bis 10 Gramm in der Jugendherberge, bis 20 Gramm zu Hause, …, ab 60 Gramm bei Oma) und die Klassenbesetzungshäufigkeiten in einem Histogramm (das ergibt dasTreppenbild, wenn alle Päckchen vorher zu Paketen zusammengefaßt und sortiert wurden) darzustellen. Das wäre dann sozusagen die Großküche oder der Großkaufhandel. Ich würde mich allerdings nicht trauen, dort solche Experimente durchzuführen.

Eigentlich ist es zu einfach, um richtig zu sein. Deshalb versuche ich mal, anhand eines Beispiels diese wichtige Funktion im Leben eines jeden Menschen zu beschreiben. Schließlich wurde am Anfang des Studienbriefes erklärt, dass wir alle auf statistische Methodenkompetenz in der heutigen Zeit nicht verzichten können. (Das steht übrigens im Vorwort auf Seite i (!).

Stellen wir uns also eine Mannschaft Männer (sonst hieße es ja Frauschaft) vor dem Kühlschrank vor mit der Aufgabe, die Butter dort herauszuholen. Die Hausfrau steht mit der Stoppuhr daneben und mißt die Zeit, in der die Butter den Weg aus dem Kühlschrank findet. Im Extremfall muß die Familie auf das zusätzliche Fett verzichten, weil ein Mann das begehrte Objekt absolut nicht findet, deshalb kann dieser Zeitwert unter den Tisch fallen, ohne ein größeres Hüngernis auszulösen. Jedenfalls ist es möglich, durch die kumulierte, also die Summenhäufigkeit festzustellen, welcher der Testteilnehmer in weniger als einer Minute fündig wurde (den sollte man dann als Ehemann in Erwägung ziehen) bzw. wieviele Männer zwischen fünf und zehn Minuten für diesen Spaß brauchten (die kann man dann den eigenen Freundinnen empfehlen) oder nach wievielen Minuten (eher Stunden, aber ich will mich umrechentechnisch hier ja nicht völlig verausgaben) 90% der Sucher das Experiment entnervt abgebrochen haben. Diese Leute werden zweckmäßigerweise zum Üben in den nächsten Butterladen geschickt. Alles klar?

Quelle: Mittag, H.-J. (2011): Statistik. Eine interdisziplinäre Einführung. Kurseinheit 1: Beschreibende Statistik. Studienbrief 33209. (S. 45-48). Hagen: FernUniversität.

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s