next up previous index
Nächste Seite: Gruppierte Daten Aufwärts: Datenaufbereitung Vorherige Seite: Rohdaten (Urliste)   Index


Sortierte Daten (Primärliste)

Für die statistische Analyse einer »Variablen« $ X$ kann es hilfreich sein, die »Untersuchungseinheiten« der Größe nach anhand ihrer Variablenwerte zu sortieren. Das setzt mindestens ordinales »Meßniveau« voraus. Die sortierten Werte einer Variablen $ X$ bezeichnet man als Primärliste oder einfach als sortierte Daten (engl.: sorted data). Bei aufsteigender Sortierreihenfolge landet der kleinste vorkommende Wert auf dem niedrigsten und der größte vorkommende Wert auf dem höchsten Rangplatz, alle anderen Werte nehmen entsprechend ihrer Größe einen Rangplatz oder kurz: einen Rang dazwischen ein.

Wenn mehrere Untersuchungseinheiten bei der Variablen $ X$ den gleichen Wert haben, ist jede Rangordnung dieser Werte richtig. Anders ausgedrückt: Die beteiligten Untersuchungseinheiten teilen sich ein- und denselben Rangplatz. Man spricht auch von sogenannten Bindungen in den Daten (engl.: ties).

Beispiele: Die Personen A, B, C, D und E seien 20, 20, 25, 20 sowie 18 Jahre alt. Die Primärliste lautet: 18, 20, 20, 20, 25. Die Person E steht auf dem untersten und die Person C auf dem obersten Rang. Die dazwischen liegenden Rangplätze können aber auf unterschiedliche Weise angeordnet werden: A, B, D oder B, D, A oder D, B, A usw.

Notation: In den »Rohdaten (Urliste)« bezeichnet $ x_{i}$ den Wert der Variablen $ X$ bei einer bestimmten Untersuchungseinheit $ i$. $ i$ ist in diesem Fall nur eine Identifikationsnummer für die entsprechende Untersuchungseinheit und nimmt Werte von $ 1$ bis $ n$ (»Stichprobenumfang«) an. Den Rangplatz einer Untersuchungseinheit in den sortierten Daten (Primärliste) bezeichnet man dagegen mit $ r$, und um die Indizes der sortierten Primärliste $ x_{(1)}, x_{(2)}, x_{(3)}, \ldots, x_{(n)}$ besser von den Indizes der unsortierten Urliste $ x_{1}, x_{2}, x_{3}, \ldots, x_{n}$ unterscheiden zu können, werden erstere in Klammern gesetzt. $ x_{(r)}$ bezeichnet also die Untersuchungseinheit auf dem $ r$-ten Rangplatz. Bei aufsteigender Sortierreihenfolge ist $ x_{(1)}$ der kleinste (minimale) und $ x_{(n)}$ der größte (maximale) vorkommende Wert der Variablen $ X$.


next up previous index
Nächste Seite: Gruppierte Daten Aufwärts: Datenaufbereitung Vorherige Seite: Rohdaten (Urliste)   Index
HJA 2001-10-01