Statistik 3.1

(Wenn man Colonel Potter mit einem General vergleicht, dann handelt es sich sozusagen bei den militärischen Rängen um qualitative Merkmale aus der Rang-/bzw. Ordinalskala. Wenn Potter über diesen General verlauten läßt, sein IQ wäre kleiner als seine Schuhgröße, dann fand ich das bisher ziemlich lustig, obwohl er hier offensichtlich Birnen mit Äpfeln vergleicht. (Das scheint aber bei quantitativen/metrischen Merkmalen möglich zu sein.) Ich kann kaum noch die Zeitung lesen oder MASH folgen, ohne auf Statisik zu stoßen. Wo soll das hinführen, wenn sich schon nach zwei von x Kapiteln die Inhalte der Studienbriefe derart in mein Denken mischen? Wahrscheinlich werde ich irgendwann Statistin, ich meine: Statistikerin.)

Im dritten Kapitel geht es um die Datengewinnung und Auswahlverfahren. (Das wird eine längere Geschichte.) Kapitel 3.1 beschäftigt sich mit den Erhebungsarten und Studiendesigns. Daten werden benötigt, um Forschungsfragen empirisch zu überprüfen (ich dachte immer, empirisch heißt „aus der Erfahrung“, hmm, im Wörterbuch steht „Sinneserfahrung [als Quelle wissenschaftlicher Erkenntnis] – Erfahrung als Überprüfungsmittel? Wahrscheinlich ist das schon wieder nebensächlich, aber meine Erfahrung kann doch nicht Quelle wissenschaftlicher Erkenntnis sein. Wahrscheinlich müssen dazu die drei Kriterien aus 2.3 erfüllt sein: Objektivität, Reliabilität und Validität. [Ich freu mich wie ein Schnitzel, dass ich die Wörter inzwischen nicht nur auswendig schreiben kann, sondern auch noch weiß, was sie bedeuten.]). Die Aussagequalität hängt von der Datenqualität ab und die Aussagen werden aus den analysierten Daten abgeleitet. …Die Vorgehensweise zur Datenerhebung soll man sorgfältig planen, aber das ist ja wohl eh klar. Die Datengewinnung wird auch Datenerhebung genannt und die Planung der Datengewinnung Erhebungsdesign (nein, ich denke nicht an Schuhe!). Datenerhebungen lassen sich klassifizieren (das scheint den Statistikern sowieso Spaß zu machen, alles zu klassifizieren), z. B. nach der Art der Datenquelle. So gibt es 1) Primärerhebungen, bei denen Daten direkt für die Untersuchung gewonnen werden, 2) Sekundärerhebungen, bei denen die Daten schon in anderen Quellen vorhanden sind (ich glaube, in der Hausarbeit im Modul 2A wird so eine Sekundäranalyse gefordert, aber bis dahin muß ich erst mal kommen) und schließlich gibt es noch 3) Tertiärerhebungen (das war was mit Geographie – Scherz!), bei denen man zwar Daten aus vorhandenen Quellen nutzt, diese aber nicht original, sondern aggregiert (= verdichtet, in Gruppen oder als Mittelwert) serviert bekommt. Das heißt natürlich (irgendwo hatte ich das schon mal aufgeschrieben), dass dabei ein paar Informationen verloren gegangen sind. Trotzdem sollen Wissenschaftler sehr an diesen Daten interessiert sein (da wäre eine Begründung hilfreich, denn wenn immer mehr verkürzt, verloren und verdichtet wird, ist das am Ende wie das Spiel Stille Post – warum wollen also Wissenschaftler ausgerechnet diese Daten? Wahrscheinlich spielen mal wieder Zeit und Geld eine Rolle.)

In den Sozialwissenschaften (auch Psychologie und Medizin) sind Primärerhebungen beliebt. Es werden drei Arten der Datengewinnung unterschieden: Befragung, Beobachtung und Experiment. Die Befragung (erinnert ja doch etwas an Fragstatt) kann mündlich (persönlich oder per Telefon), schriftlich oder internetgestützt erfolgen. (Ich versuche mal, mich mit Kommentaren zurückzuhalten, sonst komme ich nicht vorwärts.) Mündliche Befragung erfolgt unstrukturiert ( –> offener Charakter, ohne Fragebogen), teil- oder strukturiert (teilweise oder ganz standardisierte Befragung, wobei die Fragebögen mit teilweise oder geschlossenen Fragen verwendet werden). Was es mit den offenen und geschlossenen Fragen auf sich hat, wird sicher noch auf einer der restlichen 900 Seiten erklärt. Interviews werden übrigens mit softwaregesteuerter Interviewführung geführt und die Ergebnisverarbeitung erfolgt automatisch (na toll und ich soll die ganzen Formeln auswendig und dazu noch rechnen können). CAPI und CATI haben nichts mit Urlaub zu tun, sondern sind interviewer-administrierte Interviews (computer assisted personal/telephone interviewing). Bei der schriftlichen Befragung werden Fragebögen per Post oder E-Mail an ausgewählte Adressen geschickt oder auf Internetseiten bereitgestellt. Ha, und um gute Rücklaufquoten zu erhalten, gibts manchmal eine Belohnung. (Oh, oh, ob das im Sinne der objektiven Wissenschaft ist? Ich sag ja nicht, dass in der Pädagogik dieses Mittel nicht auch sehr beliebt ist.) Das ist auch noch schön: bei der netzbasierten schriftlichen Befragung kann mittels interaktiver Befragungsprogramme durch den Fragenkatalog geführt und die Antworten selbst eingegeben werden, wahrscheinlich (dieses Wort traut man sich ja kaum noch zu schreiben) wie beim Willenstest von Markus Deimann. (Den Test mache ich jetzt mal lieber nicht.) Deshalb heißen diese Verfahren selbst-administrierte computergestützte Befragungen.  Die Form der Befragung ist abhängig von der Größe des Datensatzes (das kann man eigentlich zu diesem Zeitpunkt noch nicht wissen), der Zielgruppe, dem Budget und Zeitrahmen.

Beobachtung. Im Prinzip kann alles beobachtet werden: Objekte, technische Prozesse, Renditen, Beschäftigungsquoten, Verhalten von Personen. In der Sozialwissenschaft und Psychologie werden Einzelpersonen und oder Gruppen offen oder verdeckt, aber auf jeden Fall systematisch geplant beobachtet und die Ergebnisse in einem Beobachtungsprotokoll festgehalten, natürlich für einen bestimmten Forschungszweck. (Kommt das jemandem bekannt vor?) Es wird noch schrecklicher: die verdeckte Beobachtung nennt man nicht-reaktive Erhebungsverfahren: Logfile(?) – Analysen beschäftigen sich mit dem Verhalten von Internetnutzern. Frequenzzählungen oder die Aufzeichnung von Blickbewegungen und -winkeln von Kunden beim Einkaufen (oje, schnell das Kilo Nutella zurück ins Regal stellen), Geoinformationssysteme messen Pendlerströme, GPS-Daten die Verweildauer der Besucher vor Tiergehegen. Die Gesellschaft für Konsumforschung (GfK) erfaßt mittels einer speziellen Armbanduhr die Radio- und TV-Nutzung.

Experiment.  Anwendungsfelder für Experimente finden sich in den Agrar- und Naturwissenschaften, der Technik, Medizin und Psychologie. Durch Experimente sollen Hypothesen über kausale (= Zusammenhang zwischen Ursache und Wirkung) Zusammenhänge zwischen Merkmalen empirisch überprüft werden. Diese Überprüfung erfolgt anhand einer geplanten Untersuchung und sieht so aus: Die Ausprägungen von Merkmalen (= unabhängige Variablen = Einflußfaktoren) werden unter Laborbedingungen systematisch variiert. Dabei soll der Effekt (= die Wirkung) auf ein anderes Merkmal (= abhängige Variable = Zielgröße) beobachtet werden. Die Untersuchungsanordnung soll „den Einfluß weiterer Variablen möglichst ausschalten“, das heißt dann „Kontrolle der Störvariablen„. Es gibt dafür einen Versuchsplan, der die Untersuchungsanordnung festlegt. (Na, das Thema Plan machen hat Brecht schon besungen.) In den Sozial- und Wirtschaftswissenschaften werden eher Feldbeobachtungen und weniger Laborexperimente durchgeführt, weil der Beobachtungszusammenhang auch auf den Einfluß einer dritten Variable zurückgeführt werden kann. (Hierzu soll das Kapitel 9.2 verglichen werden. Bis jetzt war dies ein „ich-versteh-das-so-langsam-Abschnitt“, aber in 9.2 wimmelt es nur so von Formeln. Wie soll ich die in den PC [vom Kopf ganz zu schweigen] kriegen? Deshalb schnell wieder hierher zurück.)

Unterschiede zwischen Experimenten ergeben sich in verschiedenen Fachbereichen aus der Natur der Objektmerkmale, z. B. unbelebte wie Werkstoffe, Autos oder der Luftwiderstand im Windkanal (das wird richtig flötenmäßig hier).  Die Messungen und Meßwiederholungen sind leicht und unproblematisch (ne, geht doch nicht, auch wenn die Flöte einen Windkanal hat). In der Psychologie gibt es Experimente bzgl. der Merkmale von Personen (das finde ich etwas unheimlich, aber ich bin ja kein Psychologe). Weil diese Merkmale oft den Charakter von hypothetischen Konstrukten (Motivation, Aggression, Zufriedenheit) haben, wird es schon mit der Operationalisierung der latenten Variablen schwierig. Probleme kann es auch bei der Verhinderung von Störeinflüssen oder bei der Messwiederholung geben (das glaub ich auf Anhieb). Deshalb wird neben der Versuchsgruppe, in der die Einflußfaktoren geändert werden, auch noch eine Kontrollgruppe gebildet, natürlich ohne Änderung der Einflußfaktoren. (Mit Verlaub: Wie soll denn das mit Menschen funktionieren? Das klappt ja noch nicht mal in der Schule, wenn man die gleiche Stunde in verschiedenen Klassen hält. Da bin ich ja mal gespannt, wie die Wissenschaftler das glaubhaft erklären werden.) Die zufallsgesteuerte Zuordnung der Personen zu den Gruppen ist ethisch nicht immer vertretbar oder realisierbar. Bei neuen Behandlungsmethoden in der Medizin können Probanden selbst entscheiden, zu welcher Gruppe sie gehören wollen. Das Erhebungsdesign heißt bei nicht-randomisierter (randomisieren = eine Zufallsstichprobe ziehen) Zuordnung Quasi-Experiment. (Das ist alles einleuchtend, aber völlig unbefriedigend: Wenn man schon strenge Vorschriften für wissenschaftliche Untersuchungen macht, dann sieht das für mich an dieser Stelle aus, als würden eben jene Vorgaben so lange aufgeweicht, bis es in den Kram paßt. Will ich so forschen? Entweder ich halte mich an die drei Kriterien oder ich lass‘ es ganz sein.)

Bsp. 3.2, S. 24 für die Arten der Datengewinnung: Politk/Wirtschaft – die Ergebnisse des Mikrozensus stammen aus mündlichen Befragungen (CAPI + Notebook), Arbeits- und Organisationspsychologie – offene Beobachtung menschlichen Verhaltens im Vorstellungsgespräch (aha), relevante Merkmale werden auf einer Ratingskala bewertet (die hätte ich ja gern mal gesehen), Lernpsychologie – im Experiment „Lernerfolg in der Statistikgrundausbildung mit und ohne neue Medien“ soll der Lernerfolg über die Punktzahl in der Klausur dargestellt werden (ich sag nix). Dafür werden zwei Gruppen gebildet, aber die Beteiligten dürfen sich die Gruppen nicht aussuchen, denn die nicht-zufällige Zuordnung kann Verzerrungen oder Störeinflüsse nach sich ziehen (hmm, höchstens, wenn einer viel und der andere wenig Ahnung von und mit „neuen“ Medien hat).

Klassifikation von Erhebungen nach dem zeitlichen Zusammenhang von Daten. Beobachtungsstudien können nach Quer- und Längsschnittstudien unterschieden werden. Bei Querschnittsreihen werden zu einem festen Zeitpunkt an verschiedenen Merkmalsträgern die Ausprägungen eines Merkmals erfaßt. Bei Zeitreihen/Längsschnittstudien hingegen wird ein Merkmal im Zeitverlauf an einer statistischen Einheit verfolgt. Ein Panel (= 1. eingegrenzte Fläche, 2. „für die Meinungsforschung repräsentativ ausgewählte Personengruppe, die regelmäßig nach einem bestimmten Programm befragt wird“, Fremdwörterbuch, S. 408) kombiniert Querschnitts- und Zeitreihenanalysen. Merkmalsausprägungen werden an den selben Objekten wiederholt durchgeführt. Bei Personen muß über einen längeren Zeitraum mit Panelmortalität (= Sterblichkeit) und dadurch mit Verzerrung gerechnet werden. (Keine Fragen.)

Einteilung nach dem Datenumfang. Hier wird zwischen Voll- und Teilerhebung unterschieden. Die Vollerhebung bezieht alle Elemente der Grundgesamtheit in die Erhebung ein (eigentlich klar), z. B. bei Volkszählungen. Im Jahre 2011 wurde die Volkszählung mit Daten aus dem Verwaltungsregister durchgeführt (= registergestützter Zensus [Zensus = statistische Datenermittlung]). Die Fortschreibung der Daten aus der letzten Volkszählung (Mikrozensusdaten) und die Hochrechnungen daraus sind unzuverlässig, weil aktuell um eine Million Menschen zu hoch. (Das ist Mist bei Planungen für Schulen und Krankenhäusern, dem Länderfinanzausgleich oder den Beitragsbemessungen Deutschlands für den EU-Haushalt.) Bei Teil- oder Stichprobenerhebungen werden nur Daten für eine Teilmenge der Grundgesamtheit ermittelt (Mikrozensus, soll wohl kleine Datenermittlung heißen). Vorteile der Stichprobenerhebungen: Bei großen Grundgesamtheiten sind sie nicht so teuer, weniger aufwändig und praktikabeler. Sie liefern zuverlässigere Daten, weil mehr Zeit für die einzelnen Merkmalsträger bleibt. Problem: In der Industrie ist manchmal die Zerstörung der Merkmalsträger für die Qualitätsprüfung nötig. Hier gibt es keine Alternative zur Stichprobenprüfung. Bei der Prüfung von sicherheitsrelevanten Produkten (Airbags oder Reißleinen) sind keine Stichproben möglich, weil das Restrisiko zu hoch wäre. (Werden die alle vorher ausprobiert?)

Beispiel 3.3, S. 26, erläutert ein paar Abkürzungen. SOEP bedeutet z. B.  sozioökonomisches Panel. Das gibt es seit 1984 und ist eine stichprobenbasierte Befragung in 12.000 gleichbleibenden Haushalten durch persönliche Interviews. Das DIW (Deutsches Institut für Wirtschaft) gibt die anonymisierten Mikrodaten an die interessierte Fachöffentlichkeit weiter (wer gehört dazu und warum sind diese Daten nicht der gesamten Öffentlichkeit zugänglich?). Die Teilnahme an der Befragung ist freiwillig. ALLBUS heißt die Abkürzung für Allgemeine Bevölkerungsumfrage der Sozialwissenschaften. Diese Mehrthemenbefragung gibt es seit 1980 und zwar im Zweijahresrhythmus. Für die Stichprobe werden ca. 3.000 Personen ausgewählt, um den gesellschaftlichen Wandel dauerzubeobachten. Bei jeder Erhebung wird für das Querschnittsdesign eine neue Stichprobe gezogen und die Marktforschungsinstitute wechseln sich bei der Befragung ab. Den gesamten Auftrag dafür erteilt die GESIS = Gesellschaft Sozialwissenschaftlicher Infra Struktureinrichtungen. Seit 2009 heißt sie GESIS – Leibniz-Institut für Sozialwissenschaften. Die Ergebnisse gibt es auch hier wieder nur für die Fachöffentlichkeit.

Quelle: Mittag, H.-J. (2011): Statistik. Eine interdisziplinäre Einführung. Kurseinheit 1: Beschreibende Statistik. Studienbrief 33209. (S. 19-26). Hagen: FernUniversität.

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s