In diesem Beitrag wird das statistische Q-tool der Korrelation bzw. Regression erklärt. Die beiden Begriffe Korrelation und Regression werden voneinander abgegrenzt und es werden Einsatz, Chancen und Risiken dieses tools erläutert. Korrelation und Regression sind statistische Werkzeuge aus der beschreibenden Statistik. Sie werden eingesetzt um statistische Zusammenhänge zwischen zwei Variablen zu untersuchen. Da im Qualitätsmanagement i.d.R. die Messung und Prüfung von Qualitätsmerkmalen ein zentraler Bestandteil ist, werden in diesem Beispiel der Zusammenhang zwischen Merkmalen und weiteren Einflussgrößen mittels Korrelation und Regression untersucht.

Um eine Korrelationsanalyse oder eine Regressionsanalyse durchzuführen, sind valide Daten nötig. Zu Beginn steht die Messung von Merkmalen, Zeiten, oder welche Größen auch immer miteinander in Beziehung gesetzt werden sollen.

Beispiel Reifenverschleiß

Wir untersuchen den Zusammenhang zwischen der Abnutzung unserer Autoreifen und den gefahrenen Kilometern. Dazu führen wir in Abständen von 5000km eine Messung der Profiltiefe des Reifens durch. Dazu verwenden wir ein genaueres Messgerät als den klassischen Plastik Messschieber, den wir als Werbegeschenk beim letzten Radtausch bekommen haben. Durch die genau Messung können wir den Messfehler in diesem Beispiel vernachlässigen. Wir fahren los und jede Messung wird in einer Tabelle notiert. Da wir dieses Experiment nur im Sommer durchführen (wir fahren dazu fast 1x um die Welt) bleibt unser Reifensatz während des ganzen Experiments identisch. Nach langen 40.000km erhalten wir folgende Tabelle:

 

gefahrene km Profiltiefe
0 8mm
5.000 7,4
10.000 6,9
15.000 6,2
20.000 5,4
25.000 4,8
30.000 4,3
35.000 3,7
40.000 3,2
  Korrelation am Beispiel von Reifenverschleiss

 

Korrelation

Der gesunder Menschenverstand sagt uns schon bevor wir das Experiment gestartet haben, dass es ein negativer Zusammenhang zwischen den gefahrenen Kilometern und der Profiltiefe existiert. Das Profil wird weniger, das wissen wir aus Erfahrung. Doch stellen wir uns vor, wir kennen diese Tatsache zum Zeitpunkt des Experiments nicht, wie es meistens in der Praxis der Fall ist. Nach dem Experiment liegen uns zunächst nur die Daten vor. Wir treffen die erste Schlussfolgerung: Die Daten weisen eine negative Korrelation auf. Das bedeutet, es gibt einen statistischen Zusammenhang zwischen den beiden Zahlenreihen. Im Qualitätsmanagement bezeichnen wir die Fahrstrecke als Prozessgröße und die Tiefe des Profils als Merkmal. Durch mathematische Formeln lässt sich das Maß der Korrelation in einer Zahl, dem Korellationskoeffizienten r berechnen. Es gelten folgende Regeln für r:

r=0 : Keine Korrelation

r<0: Negative Korrelation

r>0: positive Korrelation

In unserem Beispiel beträgt r=-0,99, d.h. die Daten korrelieren stark negativ.

Je größer der Betrag von r wird, desto stärker ist die Korrelation. Ohne entsprechendes Fachwissen können wir jedoch nicht sagen, ob die Profiltiefe von der Fahrstrecke abhängig ist, oder umgekehrt. Letzteres ist natürlich völlig unsinnig. Diese Aussage können wir jedoch nur treffen, wenn wir die Logik verstanden haben.

Regression

Wir wissen also, je mehr Strecke wir fahren, desto geringer wird das Reifenprofil. Mit Hilfe der Daten können wir ein mathematisches Modell entwickeln, dass diesen Zusammenhang beschreibt. In diesem Beispiel ist die lineare Regression ein ideales Modell. Durch die Methode der kleinsten quadratischen Abweichungen berechnen wir das Regressionsmodell: Die Regressionsgrade. Die Gleichung kann in Excel einfach als Trendlinie dem Diagramm hinzugefügt werden.

Gleichung der Regressionsgraden:

y=-0,001x +8,0044

Wir haben einen funktionalen Zusammenhang zwischen den beiden Größen Profiltiefe und Fahrstrecke ermittelt. Die Profiltiefe ist eine Funktion der Fahrstrecke.

Was bringt uns das in der Praxis? Wir können in Zukunft bei diesen Reifen, diesem Auto und diesem Fahrer die Frage beantworten, wie viel Profil wir nach einer beliebigen Strecke haben, oder auch wie viel Profil wir für eine Fahrt von 1.000 km verbrauchen, auch wenn uns dafür kein Messwert vorliegt. Wir können dadurch die Profiltiefe zu jedem beliebigen Kilometer errechnen. Allerdings endet unser Modell bei 40.000km. Und eine Grundregel der Modellbildung, ist nicht über den untersuchten Bereich hinaus Größen zu berechnen (nicht extrapolieren).

Der Vollständigkeit wegen soll hier erwähnt werden, dass jedes Regressionsmodell nicht exakt die Realität wiedergibt, also immer einen bestimmten Fehler aufweist. Grund ist einfach die Tatsache, dass in der Praxis die Parameter des Tests variieren, also z.B. ein anderer Fahrer des Fahrzeugs. Im schlimmsten Fall fährt dieses Fahrzeug ein Rennfahrer, der es schafft innerhalb von 1000km die Reifen abzufahren.

Die Grenzen eines Modells sind daher immer bei der Anwendung zu berücksichtigen.

 

 

 

 

 

QM-Blog

Kontakt aufnehmen

Wir benutzen Cookies

Wir nutzen Cookies auf unserer Website. Einige von ihnen sind essenziell für den Betrieb der Seite, während andere uns helfen, diese Website und die Nutzererfahrung zu verbessern (Tracking Cookies). Sie können selbst entscheiden, ob Sie die Cookies zulassen möchten. Bitte beachten Sie, dass bei einer Ablehnung womöglich nicht mehr alle Funktionalitäten der Seite zur Verfügung stehen.