statistik und excel - luis · pdf fileexcel – statistische funktionen, 05.08.10 seite 2...
TRANSCRIPT
Statistik und Excel
Excel – Statistische Funktionen, 05.08.10 Seite 2
Statistik ...
bietet Methoden, um große Datenmengen zu quantifizieren, zu beschreiben und zu beurteilen.
bereitet große Datenmengen auf und analysiert diese. analysiert große Mengen an zählbaren Daten. stellt Datenmaterial in Form von Tabellen und Diagrammen dar.
Excel – Statistische Funktionen, 05.08.10 Seite 3
Beispiel
Prognosen von Wahlen. Anteil Erwerbstätiger / Rentner etc. an der Bevölkerung. Berechnung der mittleren Temperatur in einem Jahr. Umsatzentwicklung eines Unternehmens.
Excel – Statistische Funktionen, 05.08.10 Seite 4
Statistische Masse...
beschreibt den zu analysierenden Datenbestand. muss präzise beschrieben werden. Beispiel:
Die Anzahl Drucke der Druckmaschinen A3 und A4 des RRZN werden für das erste Quartal des Jahres 2010 gezählt. Räumliche Eingrenzung: RRZN. Sachliche Eingrenzung: Anzahl der Drucke der
Druckmaschine A3 und A4. Zeitliche Eingrenzung: Erstes Quartal des Jahres 2010.
Excel – Statistische Funktionen, 05.08.10 Seite 5
Merkmalsträger ...
wird statisch untersucht. Was wird erhoben? können ...
natürliche Personen (Mitarbeiter, Studenten), Institutionen (Niedersachsen, Unternehmen xyz), Sachen (PC, Buch), Ereignisse (Geburten, Konkurse) sein.
Excel – Statistische Funktionen, 05.08.10 Seite 6
Merkmale oder Variablen ...
beschreiben ein Objekt. Zum Beispiel wird ein Drucker durch die IP-Adresse, dem Hersteller, dem Gewicht und der Seitenzahl pro Minute beschrieben.
sind Eigenschaften des Merkmalträgers, die für die statische Untersuchung benötigt werden.
beantworten die Frage: Welche Art von Werten soll erhoben werden?
haben einen Wert (Ausprägung), der zum Beispiel mit Hilfe einer Messung oder Umfrage ermittelt wurde. Zum Beispiel hat ein Drucker das Merkmal „Hersteller“. Das Merkmal kann die Ausprägung „Canon“, „HP“, etc. besitzen.
Excel – Statistische Funktionen, 05.08.10 Seite 7
Qualitative Merkmale ...
benötigen keine physikalische Einheit. sind Bezeichnungen wie zum Beispiel Bezeichnungen von
Gegenständen, Orten oder Zeugniszensuren. werden ohne definierte Abstände auf einer Skala aufgetragen. können nominal oder ordinal sein. Es kann die Häufigkeit des Vorkommens oder der Anteil an der
Gesamtdatenmenge berechnet werden.
Excel – Statistische Funktionen, 05.08.10 Seite 8
Nominale Merkmale ...
besitzen keine natürliche Rangfolge. sind eine Aufzählung von Ausprägungen. sind Aussagen ohne eine Wertigkeit. können nur auf Gleichheit geprüft werden. werden häufig mit Zahlen verschlüsselt, um sie zu vergleichen.
Zum Beispiel „ledig = 1“, „verheiratet = 2“, „geschieden = 3“, „verwitwet = 4“.
Excel – Statistische Funktionen, 05.08.10 Seite 9
Beispiele
Fest, flüssig und gasförmig beschreibt den Aggregatzustand von Stoffen. Die Aggregatzustände haben keine Wertigkeit.
Rot, Grün, Gelb beschriebt die Farben einer Ampel. Die Farben haben die gleiche Gewichtung.
Die Beschreibung des Familienstandes (ledig, verheiratet, etc.) wird häufig mit Hilfe von Zahlen codiert.
Excel – Statistische Funktionen, 05.08.10 Seite 10
Ordinale Merkmale ...
spiegeln eine natürliche Rangfolge wider. haben aber keinen messbaren Abstand zueinander. sind numerisch nicht auswertbar. sind sortierbar.
Excel – Statistische Funktionen, 05.08.10 Seite 11
Beispiele
Bewertungen wie „sehr gut“, „gut“, „befriedigend“. Bewertung von Produkten wie sehr zufrieden, zufrieden,
weniger zufrieden, mangelhaft. Hohes, mittleres oder niedriges Einkommen.
Excel – Statistische Funktionen, 05.08.10 Seite 12
Pseudo-metrische Daten
werden für die Kodierung von ordinalen Merkmalen eingesetzt. ermöglichen die Berechnung einer Standardabweichung oder
Normalverteilung. sind zum Beispiel:
“sehr gut“ = 1; „gut“ = 2; „befriedigend“ = 3 … Schnellster Läufer = 1; Zweitschnellster Läufer = 2; ...
Excel – Statistische Funktionen, 05.08.10 Seite 13
… setzen
Mit Hilfe der Funktion VERWEIS() kann Text etc. automatisch durch numerische Werte ersetzt werden.
Der Funktion werden folgende Argumente übergeben: Nach welchen Text soll gesucht werden? In welcher Spalte soll dieser Text sortiert werden? Diese
Zeile muss von a...z oder 0..9 sortiert sein. Welcher Text soll für den Suchtext angezeigt werden?
Excel – Statistische Funktionen, 05.08.10 Seite 14
Quantitative Merkmale
benötigen immer eine Maßeinheit. haben eine messbare Dimension wie zum Beispiel Zentimeter,
Kilogramm, Jahre etc. werden durch wiegen, messen etc. erfasst. können stetig oder diskret sein.
Excel – Statistische Funktionen, 05.08.10 Seite 15
Diskrete Merkmale ...
sind endlich abzählbar. können nur bestimmte Werte annehmen. sind zum Beispiel:
Die Seitenzahl pro Minute kann nur positive Werte annehmen.
Die Anzahl Studenten im Fach „Informatik“ im Wintersemester 2009 ist immer eine positiver Wert.
Anzahl der ausgeliehenen Bücher pro Tag.
Excel – Statistische Funktionen, 05.08.10 Seite 16
Stetige Merkmale ...
haben einen unendlichen Wertebereich in einem bestimmten Intervall.
sind zum Beispiel: Temperaturangaben. Körpergrößen. Wasserstand in einem See.
Excel – Statistische Funktionen, 05.08.10 Seite 17
… nutzen Intervall-Skalen
Es werden die Abstände zwischen zwei Ausprägungen angezeigt.
Der Nullpunkt ist aber willkürlich gewählt. Es lassen sich Durchschnittswerte und Differenzen berechnen.
Ein Größenvergleich ist möglich.
Excel – Statistische Funktionen, 05.08.10 Seite 18
Beispiel
Am Morgen beträgt der Pegelstand des Flusses 1,20 m. Am Abend beträgt der Pegelstand des Flusses 2,40 m.
Die Aussage „Der Fluss ist um 1,20 m gestiegen“ ist korrekt. Die Aussage bezieht sich auf den Abstand zwischen den beiden Werten.
Die Aussage „Der Pegelstand am Abend ist doppelt so hoch wie am Morgen“ ist nicht korrekt. Pegelstände werden vom Nullpunkt gemessen. Auf einem Pegelstand von 50 m am Morgen und einen Pegelstand von 100 m am Abend trifft diese Aussage auch zu, aber nicht die Aussage „Steigung von 1,20 m“.
Excel – Statistische Funktionen, 05.08.10 Seite 19
… nutzen Verhältnis-Skalen
Es werden die Abstände sowie die Verhältnisse zwischen zwei Ausprägungen angezeigt.
Der Nullpunkt ist exakt festgelegt. Addition, Subtraktion, Multiplikation von Ausprägungen ist
möglich. Größenvergleiche sind möglich.
Excel – Statistische Funktionen, 05.08.10 Seite 20
Beispiel
Entfernungsangaben bestehen sich immer auf eine bestimmte Ausgangsposition. Die Ausgangsposition wird mit Null definiert.
In einer Befragung werden die Angaben 50 m sowie 100 m gemacht.
Die Wegstrecke 50 m ist doppelt so lang wie 100 m. Diese Aussage ist korrekt. Beide Angaben haben eine definierte Ausgangsposition.
Excel – Statistische Funktionen, 05.08.10 Seite 21
Art der Erhebung
Es werden alle Merkmalsträger betrachtet. Die Grundgesamtheit der Daten wird in einem Diagramm etc. dargestellt. Es wird eine Vollerhebung der Daten vorgenommen.
Es werden nur bestimmte Merkmalsträger betrachtet. Der Statistiker zieht eine Stichprobe aus der Grundgesamtheit der Daten.
Excel – Statistische Funktionen, 05.08.10 Seite 22
Deskriptive Statistik ...
oder beschreibende Statistik. beschreibt Daten in Form von Tabellen oder Diagrammen. charakterisiert mit Hilfe von Kennwerten Daten. Zum Beispiel
wird mit Hilfe des Durchschnitts der Datenbestand zusammengefasst und beschrieben.
interpretiert den Datenbestand nicht.
Excel – Statistische Funktionen, 05.08.10 Seite 23
Ablauf
Welche Daten sollen für welches Problem erhoben werden? Das Problem muss genau analysiert werden. Aufgrund einer falschen Ausgangsbasis können falsche Ergebnisse oder Zusammenhänge erzeugt werden.
Vorhandenes Datenmaterial wird auf Brauchbarkeit getestet. Noch notwendige Daten werden erhoben und erfasst. Wenn
möglich, sollten die Daten mit Hilfe einer Excel-Tabelle erfasst werden.
Die Daten werden mit Hilfe von Methoden der deskriptiven Statistik betrachtet.
Excel – Statistische Funktionen, 05.08.10 Seite 24
Datenmaterial sortieren
Wichtig bei langen Datenreihen wie Temperaturwerte etc. Das Register Start ist aktiv. Die zu sortierenden Daten sind markiert. Klicken Sie auf Nach Größe sortieren (Aufsteigend) im Bereich
Sortieren und Filtern. Hinweis: Es müssen alle Daten in Abhängigkeit einer Spalte
sortiert werden!
Excel – Statistische Funktionen, 05.08.10 Seite 25
Eindimensionale Häufigkeitsverteilung ...
betrachtet nur ein Merkmal. Die absolute Häufigkeit liefert die Anzahl einer bestimmten
Ausprägung eines Merkmals. Die Gesamtsumme aller Häufigkeiten entspricht der Anzahl der Teilnehmer. Ausnahme: Mehrfachnennungen sind möglich.
Die relative Häufigkeit liefert den Anteil einer bestimmten Ausprägung in Abhängigkeit der Gesamtzahl der Werte eines Merkmals. Es wird der prozentuale Anteil aller Ausprägungen eines Merkmals geliefert. Die Gesamtsumme aller relativen Häufigkeiten ergibt 100%.
Excel – Statistische Funktionen, 05.08.10 Seite 26
Nominale Werte „zählen“
Setzen Sie den Mauszeiger oberhalb oder unterhalb des zu zählenden Zellbereichs in eine leere Zelle.
Geben Sie die Funktion = ZÄHLEWENN([Zellbereich];["Kriterium"]) ein. Die Funktion zählt numerische oder nichtnumerische Werte. Beispiel: = ZÄHLEWENN(B7:B36;“x“) zählt die Häufigkeit von x in dem
Zellbereich B7:B36. =ZÄHLEWENN(B3:B20;“>=01.01.2010“) -
ZÄHLEWENN(B3:B20;“>31.03.2010“) zählt alle Zeilen zwischen dem 01.01.2010 und dem 31.03.2010.
Beenden Sie die Eingabe der Formel mit der <RETURN>-Taste.
Excel – Statistische Funktionen, 05.08.10 Seite 27
Keine Angaben ermitteln
Setzen Sie den Mauszeiger oberhalb oder unterhalb des zu zählenden Zellbereichs in eine leere Zelle.
Geben Sie die Funktion = ANZAHLLEEREZELLEN([Zellbereich]) ein. Die Funktion zählt alle Zellen, die einen Wert NULL haben. Es werden alle Zellen gezählt, die leer sind.
Beenden Sie die Eingabe der Formel mit der <RETURN>-Taste.
Excel – Statistische Funktionen, 05.08.10 Seite 28
Absolute Häufigkeit für numerische Werte
Markieren Sie das erste freie Feld rechts von der ersten Ausprägung.
Geben Sie die Funktion = HÄUFIGKEIT([zu analysierende Daten], [Merkmalswerte]) ein. Schließen Sie die Formel mit <RETURN> ab.
Die Häufigkeit für die erste Ausprägung wird angezeigt.
Excel – Statistische Funktionen, 05.08.10 Seite 29
Absolute Häufigkeit für alle Ausprägungen
Die Häufigkeit für die erste Ausprägung wird mit Hilfe der Funktion = HÄUFIGKEIT([zu analysierende Daten], [Merkmalswerte]) ermittelt.
Der Mauszeiger liegt über das kleine Quadrat in der rechten, unteren Ecke der aktiven Zelle.
Ziehen Sie den Rahmen so groß auf, dass alle Ausprägungen erfasst werden.
Anschließend wird der Mauszeiger mit Hilfe eines linken Mausklicks in die Bearbeitungszeile an das Ende der Funktion gesetzt.
Die Funktion wird mit <STRG>+<SHIFT>+<RETURN> bestätigt. Anschließend wird zu allen markierten Ausprägungen die Häufigkeit angezeigt.
Excel – Statistische Funktionen, 05.08.10 Seite 30
Funktionsbibliothek nutzen
Der Mauszeiger befindet sich in einer freien Spalte. In dieser Spalte werden so viele Zellen markiert wie Häufigkeiten für Ausprägungen berechnet werden sollen.
Aktivieren Sie die Registerkarte Formeln. Wählen Sie den Befehl Mehr Funktionen – Statistisch – Häufigkeit im Bereich Funktionsbibliothek aus.
Wählen Sie die zu analysierenden Daten sowie die möglichen Ausprägungen aus. Schließen Sie das Fenster mit <STRG>+<SHIFT>+<RETURN>.
Excel – Statistische Funktionen, 05.08.10 Seite 31
Array-Formel
wird von geschweiften Klammern umschlossen. verwendet Argumente, die dieselbe Anzahl von Zeilen und
Spalten aufweisen. berechnet zuerst das erste Element der Argumente,
anschließend das zweite Element usw. liefert ein Ergebnis in einer Zelle oder unterschiedliche
Ergebnisse in mehreren Zellen. wird mit <STRG>+<SHIFT>+<RETURN> abgeschlossen.
Excel – Statistische Funktionen, 05.08.10 Seite 32
Relative Häufigkeit berechnen
Ermitteln Sie die Anzahl der Ausprägungen mit Hilfe der Funktion ANZAHL() für numerische Werte.
Geben Sie in die nächste freie Zelle rechts von der Berechnung der absoluten Häufigkeit die Formel = ([Zelle “Absolute Häufigkeit“] / [Anzahl Ausprägung) * 100 ein. Der Divisor wird absolut (fest) eingetragen.
Der Mauszeiger liegt über das kleine Quadrat in der rechten, unteren Ecke der aktiven Zelle. Ziehen Sie den Rahmen so groß auf, dass alle gewünschten, berechneten absoluten Häufigkeiten erfasst werden.
Excel – Statistische Funktionen, 05.08.10 Seite 33
Weitere Möglichkeit
Geben Sie in die nächste freie Zelle die Formel = ([Zelle “Absolute Häufigkeit“] / [Anzahl Ausprägung]) ein. Ersetzen Sie die Namen in den eckigen Klammern durch die passenden Zellbereiche.
Der Mauszeiger liegt über das kleine Quadrat in der rechten, unteren Ecke der aktiven Zelle. Ziehen Sie den Rahmen so groß auf, dass alle gewünschten, berechneten absoluten Häufigkeiten erfasst werden.
Markieren Sie alle Zellen, die eine relative Häufigkeit enthalten. Aktivieren Sie die Registerkarte Start und wählen das Zahlenformat Prozent im Bereich Zahl aus. Die Häufigkeit wird in Prozentwerten plus das Prozent-Zeichen angezeigt.
Excel – Statistische Funktionen, 05.08.10 Seite 34
Beispiel
Excel – Statistische Funktionen, 05.08.10 Seite 35
Klassifizierung von stetigen Variablen
Bildung von Häufigkeitsklassen. Der Werteraum wird in Intervalle unterteilt. Die Klassenbreite (Intervalle) sollte nicht zu klein und nicht zu
groß gewählt werden. Üblicherweise werden zwischen den kleinsten und den größten Wert ca. 8 bis 12 Klassen eingerichtet. Es können unterschiedliche Klassenbreiten angegeben werden.
Folgendes Schema wird häufig für die Klassifizierung genutzt: über [Wert] bis [Wert].
Excel – Statistische Funktionen, 05.08.10 Seite 36
Absolute Häufigkeit ermitteln
Erstellen Sie ein Klassifikationsschema. Die Häufigkeit für die erste Klassenobergrenze wird mit Hilfe
der Funktion = HÄUFIGKEIT([zu analysierende Daten], [Obergrenze]) ermittelt.
Der Mauszeiger liegt über das kleine Quadrat in der rechten, unteren Ecke der aktiven Zelle. Ziehen Sie den Rahmen so groß auf, dass alle Klassen erfasst werden.
Anschließend wird der Mauszeiger mit Hilfe eines linken Mausklicks in die Bearbeitungszeile an das Ende der Funktion gesetzt.
Die Funktion wird mit <STRG>+<SHIFT>+<RETURN> bestätigt. Anschließend wird zu allen markierten Klassen die Häufigkeit angezeigt.
Excel – Statistische Funktionen, 05.08.10 Seite 37
Beispiel
Excel – Statistische Funktionen, 05.08.10 Seite 38
Kumulierte Häufigkeit ...
addiert die berechneten absoluten oder relativen Häufigkeitswerte auf.
ist nur für ordinale und numerische Werte möglich. berechnet wie viele Fälle kleiner oder gleich einer bestimmten
Ausprägung sind. beantwortet Fragen in der Form
Anzahl der Studenten, die bis zu 3 Stunden arbeiten. Anzahl der Bewertungen nicht schlechter als befriedigend.
Excel – Statistische Funktionen, 05.08.10 Seite 39
Berechnung
Sortieren Sie die gewünschten Ausprägungen aufsteigend (0..9, A..Z). Andere Möglichkeit: Nutzen Sie Klassifikationsschema.
Als erster Wert wird die kleinste oder absolute Häufigkeit genutzt.
Dieser kleinste Wert wird mit der nachfolgenden Häufigkeit addiert.
Dieser Wert wird auch wieder mit der nachfolgenden Häufigkeit addiert.
Die Addition wird solange wiederholt, bis alle Häufigkeiten aufsummiert sind.
Excel – Statistische Funktionen, 05.08.10 Seite 40
Der letzte kumulierte Häufigkeitswert ...
beträgt 100%, wenn relative Häufigkeitswerte zur Berechnung genutzt werden.
zeigt die Anzahl der Ausprägungen an, wenn absolute Häufigkeitswerte zur Berechnung genutzt werden.
Excel – Statistische Funktionen, 05.08.10 Seite 41
Beispiel
Excel – Statistische Funktionen, 05.08.10 Seite 42
Statische Maßzahlen ...
beschreiben die Lage und Streuung der Ausprägung. geben Auskunft über die Verteilung der Ausprägungen. fassen alle Ausprägungen einer Stichprobe in einem Wert
zusammen. bieten verdichtetet Informationen zu einer Stichprobe. Einige
Informationen gehen aber auch verloren.
Excel – Statistische Funktionen, 05.08.10 Seite 43
Lagemaße
berechnen den Mittelwert einer Stichprobe. beschreiben die Lage der Ausprägungen auf einer Skala. geben über den Schwerpunkt der Ausprägungen Auskunft.
Excel – Statistische Funktionen, 05.08.10 Seite 44
Arithmetisches Mittel
berechnet den Durchschnitt aller Ausprägungen. ist die Summe aller Ausprägungen dividiert durch die Anzahl
der Daten. kann nur bei quantitativen Merkmalen berechnet werden. Die Summe aller Abweichungen vom arithmetischen Mittel
ergibt Null.
Excel – Statistische Funktionen, 05.08.10 Seite 45
… berechnen
Mit Hilfe der Funktion Summe() werden alle Ausprägungen addiert.
Mit Hilfe der Funktion Anzahl() wird die Anzahl der Daten ermittelt.
Anschließend wird folgende Berechnung durchgeführt:Summealler Ausprägungen
Anzahl derWerte
Excel – Statistische Funktionen, 05.08.10 Seite 46
… in Abhängigkeit eines Kriteriums berechnen
Schreiben Sie das Suchkriterium in eine leere Zelle. Schreiben Sie in eine weitere Zelle folgende Funktion:
MITTELWERTWENN([Kritierienbereich], [Kriterium]; [Datenbereich]) Kriterienbereich definiert den Zellenbereich, in dem das
Kriterium gesucht wird. Kriterium beschreibt den Suchttext. Zum Beispiel "<>40-50".
Standardmäßig wird auf Gleichheit getestet. In dem angegebenen Beispiel wird auf Ungleichheit getestet.
Datenbereich legt die Zellen fest, für die der Mittelwert berechnet werden soll.
Excel – Statistische Funktionen, 05.08.10 Seite 47
Kriterien
Als Kriterium kann ein Wert (402), ein Zellbezug (B3) oder eine Zeichenfolge "Annaturm" genutzt werden. Jede Zeichenfolge wird durch die Anführungszeichen begrenzt.
Als Kriterium kann ein Ausdruck genutzt werden. Ausdrücke werden durch Anführungszeichen begrenzt. Beispiele: "<30". Alle Daten, die kleiner als 30 sind. ">30". Alle Daten, die größer als 30 sind. "=30". Alle Daten, die gleich 30 sind. "<>3 bis 4". Alle Daten, die nicht den Text 3 bis 4 enthalten. "<=30". Alle Daten, die kleiner gleich 30 sind. ">=30". Alle Daten, die größer gleich 30 sind.
Excel – Statistische Funktionen, 05.08.10 Seite 48
Gewogenes arithmetisches Mittel berechnen
Berechnung des Durchschnitts aller Ausprägungen in Abhängigkeit der Häufigkeit . Schreiben Sie in eine leere Zelle die Funktion
= SUMMENPRODUKT([Absolute Häufigkeit]; [Ausprägung]).Die Daten werden zeilenweise multipliziert. Alle Ergebnisse der Multiplikation werden summiert.
Das Ergebnis der Funktion SUMMENPRODUKT() wird durch die Anzahl der absoluten Häufigkeiten dividiert.
Excel – Statistische Funktionen, 05.08.10 Seite 49
Geometrisches Mittel ...
wird bei prozentualen Anteilen oder relativen Ausprägungen genutzt.
berechnet zum Beispiel den Mittelwert der Zuwachsraten der Bevölkerung.
ist kleiner oder gleich dem arithmetischen Mittel.
Excel – Statistische Funktionen, 05.08.10 Seite 50
Geometrische Mittelwert berechnen
Die Registerkarte Formeln ist aktiv. Wählen Sie Mehr Formeln – Statistisch – Geomittel im Bereich
Funktionsbibliothek aus. Markieren Sie den zu untersuchenden Datenbereich. Schließen
Sie das Dialogfenster mit OK. Anschließend wird der geometrische Mittelwert in der
gewählten Zelle angezeigt.
Excel – Statistische Funktionen, 05.08.10 Seite 51
Median ...
definiert einen Zentralwert. wird für ordinale Merkmale genutzt. ist der mittlere Wert einer ungeraden Anzahl von
Ausprägungen. Ist ein Synonym für das arithmetische Mittel der zwei
Ausprägungen in der Mitte einer Liste mit einer geraden Anzahl von Ausprägungen.
Excel – Statistische Funktionen, 05.08.10 Seite 52
Median berechnen
Voraussetzung: Die Rohdaten sind vorhanden. Die Daten sind nicht klassifiziert.
Die Registerkarte Formeln ist aktiv. Wählen Sie Mehr Formeln – Statistisch – Median im Bereich
Funktionsbibliothek aus. Markieren Sie den zu untersuchenden Datenbereich. Schließen
Sie das Dialogfenster mit OK. Anschließend wird der Zentralwert der geordneten Liste
angezeigt.
Excel – Statistische Funktionen, 05.08.10 Seite 53
Modus ...
ermittelt den am häufigsten vorkommenden Wert aller Daten. wird für nominale Merkmale genutzt. zeigt den ersten Wert mit der größten Häufigkeit an. Falls
Werte gleich häufig vorkommen, wird nur der erste gefundene Wert angezeigt.
Beispiele: Welcher Beruf wurde am häufigsten genannt? Aus welchen Postleitzahl-Gebiet kommen die meisten
Kunden? kann nur für numerische Werte genutzt werden. berücksichtigt extreme Ausprägungen nicht.
Excel – Statistische Funktionen, 05.08.10 Seite 54
Modus berechnen
Voraussetzung: Die Rohdaten sind vorhanden. Die Daten sind nicht klassifiziert.
Die Registerkarte Formeln ist aktiv. Wählen Sie Mehr Formeln – Statistisch – Modalwert im Bereich
Funktionsbibliothek aus. Markieren Sie den zu untersuchenden Datenbereich. Schließen
Sie das Dialogfenster mit OK. Anschließend wird die am häufigsten vorkommende
Ausprägung angezeigt.
Excel – Statistische Funktionen, 05.08.10 Seite 55
Streuungsmaße
berechnen die Streuung der Ausprägungen um den Mittelwert herum.
geben Auskunft über die Abweichung der Ausprägungen vom Mittelwert.
Wie verteilen sich die Ausprägungen?
Excel – Statistische Funktionen, 05.08.10 Seite 56
Mittlere lineare Abweichung
gibt die Abweichungen einer Ausprägung vom Mittelwert im Schnitt an.
nutzt die Absolutabweichungen.
Excel – Statistische Funktionen, 05.08.10 Seite 57
Berechnung von nicht-klassifizierten Variablen
Die Registerkarte Formeln ist aktiv. Wählen Sie Mehr Formeln – Statistisch – Mittelabw im Bereich
Funktionsbibliothek aus. Die Formel berechnet automatisch die Absolutwerte der Abweichung und summiert diese auf. Diese Summe wird anschließend durch die Anzahl der Ausprägungen geteilt.
Markieren Sie den zu untersuchenden Datenbereich. Schließen Sie das Dialogfenster mit OK.
Excel – Statistische Funktionen, 05.08.10 Seite 58
Berechnung von klassifizierten Variablen
Berechnen Sie die Klassenmitte. Berechnen Sie das arithmetische Mittel und die Abweichung
davon. Die Abweichung wird mit Hilfe der Funktion ABS() in einen Absolutwert umgewandelt.
Der Absolutwert wird mit der Häufigkeit multipliziert. Die neu berechneten Abweichungen werden summiert.
Die Summe der Abweichungen in Abhängigkeit der Häufigkeit wird durch die Anzahl der Ausprägungen dividiert.
Excel – Statistische Funktionen, 05.08.10 Seite 59
Varianz ...
berechnet die Abweichung vom Mittelwert. quadriert die Abweichungen. Die Quadrate werden addiert. Die
Summe der Quadrate wird durch die Größe der Stichprobe geteilt.
von Null. Alle Ausprägungen entsprechen dem Mittelwert. nutzt in Excel die Funktion VARIANZEN() für die Grundgesamtheit
und VARIANZ() für eine Stichprobe.
Excel – Statistische Funktionen, 05.08.10 Seite 60
Standardabweichung ...
berechnet die Streuung der Daten um den Mittelwert herum. wird aus der Quadratwurzel der Varianz gebildet. hat die gleiche Dimension wie die zusammengefaßten
Ausprägungen. nutzt in Excel die Funktion STABWN() für die Grundgesamtheit
und STABW() für eine Stichprobe.
Excel – Statistische Funktionen, 05.08.10 Seite 61
Minimale und maximale Werte
MIN([Datenbereich]) liefert die kleinste Anzahl von Ausprägungen aller Daten zurück.
MAX([Datenbereich]) liefert die größte Anzahl von Ausprägungen aller Daten zurück.
Mit Hilfe der Formel {= MAX/MIN(([zu durchsuchender Bereich] = [Suchtext]) * [Datenbereich])} kann die kleinste oder größte Anzahl von Ausprägungen für eine bestimmte Gruppe ermittelt werden.
Excel – Statistische Funktionen, 05.08.10 Seite 62
Beispiel
Geben Sie die Formel = MAX((A2:A6 =$G$2) * B2:B6) in eine freie Zelle. Die Formel wird mit Hilfe von <STRG>+<UMSCHALT>+<RETURN> abgeschlossen. MAX() wird in diesem Beispiel als Matrixfunktion genutzt. Die Zelle G2 wird absolut angegeben und enthält den
Suchtext. Der Inhalt der Zellen „A2:A6“ wird mit dem Suchtext
verglichen. Falls der Inhalt mit dem Suchtext übereinstimmt, wird intern wahr gesetzt, andernfalls falsch.
Falls der Inhalt einer der Zelle „A2:A6“ wahr ist, wird die größte dazugehörige Ausprägung aus den Zellbereich B2:B6 zurückgeliefert.
Excel – Statistische Funktionen, 05.08.10 Seite 63
Datenbankfunktionen ...
beginnen immer mit „DB“. fassen Daten in Abhängigkeit von Kriterien zusammen. berechnen Werte für eine Spalte. Beispiele:
DBMIN([Datenbereich]; [Spalte];[Suchkriterium]) DBMAX([Datenbereich]; [Spalte];[Suchkriterium])
Excel – Statistische Funktionen, 05.08.10 Seite 64
Datenbereich ...
muss eindeutige Spaltenüberschriften haben. schließt die zu untersuchenden Daten sowie die
Spaltenüberschriften ein. besteht aus Zeilen und Spalten.
Zeilen werden als Datensatz interpretiert. Pro Zeile wird ein bestimmtes Objekt eindeutig beschrieben.
Spalten werden als Datenfelder interpretiert. Die Datenfelder enthalten die Ausprägungen bestimmter Merkmale. Die Spaltenüberschrift gibt einen Hinweis auf das zu beschreibende Merkmal.
Excel – Statistische Funktionen, 05.08.10 Seite 65
Spalten-Angaben ...
durch die Spaltenüberschrift. Die Spaltenüberschrift wird durch Anführungszeichen begrenzt.
durch Angabe eines Index. 3 bezeichnet die dritte Spalte.
Excel – Statistische Funktionen, 05.08.10 Seite 66
Suchkriterien...
werden oberhalb der Datentabelle angezeigt. werden in Tabellenform abgelegt. Die Tabelle hat die gleiche
Anzahl von Spalten wie die Datentabelle. Die Spaltenüberschriften werden aus der Datentabelle übernommen.
Suchkriterien, die in einer Zeile vorkommen, werden mit UND verknüpft. Alle Kriterien in einer Zeile müssen erfüllt sein.
Suchkriterien, die in verschiedenen Zeilen vorkommen, werden mit ODER verknüpft. Es muss mindestens eines der Kriterien zutreffen.
Excel – Statistische Funktionen, 05.08.10 Seite 67
Vergleichsmöglichkeiten
Ist gleich (=) Ungleich (<>) Kleiner (>) Größer (<) Kleiner gleich (>=) Größer gleich (<=) Es ist möglich, Wörter oder Zeichen in einem Text zu suchen.
Das Sternchen ist ein Platzhalter für beliebigen Text und kann auch weggelassen werden.
Excel – Statistische Funktionen, 05.08.10 Seite 68
Spannweite ...
ist die Differenz zwischen dem kleinsten und größten Wert. gibt die Breite des Streubereichs an.
= MAX([Datenbereich]) – MIN([Datenbereich]).
Excel – Statistische Funktionen, 05.08.10 Seite 69
Quartile
teilen geordnete Datenwerte in vier gleich große Gruppen. berechnet die 25% kleinsten Ausprägungen
(Quartil([Datenreihe]; 1)). berechnet die 25% größten Ausprägungen
(Quartil([Datenreihe]; 3)). Der Quartilabstand ist der Abstand zwischen den 25%-
und 75%-Quantil.
Excel – Statistische Funktionen, 05.08.10 Seite 70
Variationskoeffizient ...
beschreibt die relative Standardabweichung. gibt Auskunft über die Stärke der Streuung. kann nur für stetige und diskrete Merkmale eingesetzt werden. wird folgendermaßen berechnet:
Standardabweichung / Mittelwert. bis zu 10% weist auf eine geringe Streuung hin. Ein Koeffizient
über 25% weist auf eine starke Streuung hin.
Excel – Statistische Funktionen, 05.08.10 Seite 71
Regressionsanalyse ...
analysiert Beziehungen zwischen Variablen. stellt Zusammenhänge zwischen Variablen dar. beschreibt die Art eines statischen Zusammenhangs zweier
Variablen.
Excel – Statistische Funktionen, 05.08.10 Seite 72
Beispiel
Steigt oder fällt die Temperatur in bestimmten Monaten? Ist das Körpergewicht abhängig von der Körpergröße? Haben Schüler in kleineren Klassen bessere Schulnoten?
Excel – Statistische Funktionen, 05.08.10 Seite 73
Regressionsgerade
Der Abstand zwischen der Geraden und den beobachteten Ausprägungen sollte möglichst klein gewählt werden.
Berechnung mit Hilfe der Methode des kleinsten Quadrats. Wenn die Ausprägungen im Diagramm ...
zum Beispiel als Parabel oder als aufwärts gekrümmte Kurve dargestellt werden, sollte eine nichtlineare Regressionsgerade gewählt werden.
linear angeordnet sind, sollte eine lineare Regressionsgerade gewählt werden.
Excel – Statistische Funktionen, 05.08.10 Seite 74
Lineare Regressionsgerade
Formel: yti = a + b * x
i
a beschreibt den Schnittpunkt mit der Y_Achse. Die Funktion Achsenabschnitt() berechnet diesen Schnittpunkt.
b gibt die Steigung der Datenreihe wieder. Die Die Funktion Steigung() rechnet den Tangens des Steigungswinkels aus.
xi sind Werte auf der x-Achse.
yti sind Werte auf der y-Achse.
Excel – Statistische Funktionen, 05.08.10 Seite 75
… in Excel berechnen
Mit Hilfe der Formel Achsenabschnitt (Y_Werte; X_Werte) wird der Ordinatenabschnitt (der Schnittpunkt mit der Y-Achse) berechnet.
Steigung(Y_Werte; X_Werte) berechnet die Steigung der Y-Einheiten, wenn die X-Einheit um eins erhöht wird.
Einzelne Punkte auf der Regressionsgerade werden mit Hilfe der Formel Achsenabschnitt() + Steigung() * [Ausprägung] ermittelt.
Excel – Statistische Funktionen, 05.08.10 Seite 76
Beispiel
Excel – Statistische Funktionen, 05.08.10 Seite 77
Korrelationsanalyse
Grad der linearen Abhängigkeit zwischen Variablen. Stärke des Zusammenhangs zwischen zwei Variablen. Beziehung zwischen zwei Variablen in Abhängigkeit der
Skalierung. Beispiele:
Abhängigkeit zwischen der Wahl einer Partei und den Alter der Wähler.
Abhängigkeit des Preises eines Produktes in Bezug auf den Absatz.
Excel – Statistische Funktionen, 05.08.10 Seite 78
Kovarianz
wird mit der Funktion: KOVAR([Zellbereich]; [Zellbereich]) berechnet. ist positiv:
Kombination von großen y-Werte mit großen x-Werten. Kombination von großen x-Werte mit großen y-Werten.
ist negativ: Kombination von großen y-Werten mit kleinen x-Werten.
hat keinen Zusammenhang: Kombination von großen y-Werte mit großen und kleinen x-
Werten. ist abhängig von der Varianz.
Excel – Statistische Funktionen, 05.08.10 Seite 79
Korrelationskoeffizient ...
hat immer einen Wert zwischen -1 und 1. hat einen Maximalwert von 1, wenn alle Punkte auf der
Regressionsgeraden liegen. Wenn die x-Werte steigen, steigen auch die y-Werte.
hat eine Maximalwert von -1. Wenn die x-Werte steigen, fallen die y-Werte.
liefert immer den gleichen Wert, egal in welcher Reihenfolge die x- und y-Werte in die Berechnung einfließen.
Excel – Statistische Funktionen, 05.08.10 Seite 80
… von Bravais / Pearson ...
für metrische Daten. ist skalenunabhängig. wird mit folgender Formel berechnet:
wird mit Hilfe der Funktion Pearson() berechnet.
Kovarianz X, Y
Varianz X∗VarianzY
Kovarianz X, Y
Varianz X∗VarianzY
Excel – Statistische Funktionen, 05.08.10 Seite 81
Rangkorrelation ...
für Ordinaldaten. nutzt den Rangkorrelationskoeffizient von Spearman. kann manuell oder mit Hilfe von Formeln berechnet werden.
Excel – Statistische Funktionen, 05.08.10 Seite 82
Rangkorrelation mit Hilfe der Funktionen berechnen
Zuerst wird der Rand der Ausprägung mit Hilfe der Funktion Rang() berechnet.
Anschließend wird der Korrelationskoeffizient mit Hilfe der Funktion Korrel() berechnet. Der Funktion werden jeweils die Ränge der zwei Merkmale als Argument übergeben. Der Koeffizient wird mit Hilfe der Formel von Bravais / Pearson berechnet.
Excel – Statistische Funktionen, 05.08.10 Seite 83
Bestimmung des Rangs mit Hilfe der Formel
Der Funktion Rang() werden folgende Argumente übergeben: Der Name der Zelle,für die der Rang berechnet werden soll. Der Zellbereich, in dessen Abhängigkeit der Rang
berechnet werden soll. Ausprägungen mit gleichen Werten haben den gleichen Rang.
Excel – Statistische Funktionen, 05.08.10 Seite 84
Arbeitsweise
Schüler Note Nummer RangA 1 9 9B 3 4 4C 3 5 4D 4 2 2E 5 1 1F 4 3 3G 2 7 7H 1 10 9I 3 6 4J 2 8 7
Excel – Statistische Funktionen, 05.08.10 Seite 85
Rangkorrelation manuell berechnen
Zuerst wird der Rand der Ausprägung manuell berechnet. Die Ausprägungen werden von 1 bis n durchnummeriert. Für Ausprägungen mit dem gleichen Werten wird der Mittelwert gebildet und dieser als Rang genutzt.
Anschließend wird der Rang des einen Merkmals von dem anderen Merkmal abgezogen. Formel: D
i = R
xi -R
yi. Das
Ergebnis der Subtraktion wird quadriert. Anschließend wird der Korrelationskoeffizient mit Hilfe der
Formel berechnet. r SP=1−6∗Di
2
n3−n
Excel – Statistische Funktionen, 05.08.10 Seite 86
Rang manuell ermittelnSchüler Note Nummer RangA 1 9 9,5B 3 4 5C 3 5 5D 4 2 2,5E 5 1 1F 4 3 2,5G 2 7 7,5H 1 10 9,5I 3 6 5J 2 8 7,5