So berechnen Sie den Korrelationskoeffizienten in Excel (2 einfache Möglichkeiten)

Excel ist ein leistungsstarkes Tool, das bei der Arbeit mit Statistiken einige erstaunliche Funktionen und Funktionalitäten bietet.

Das Finden einer Korrelation zwischen zwei Datenreihen ist eine der häufigsten statistischen Berechnungen bei der Arbeit mit großen Datensätzen.

Ich habe vor einigen Jahren als Finanzanalyst gearbeitet, und obwohl wir uns nicht intensiv mit statistischen Daten beschäftigten, mussten wir immer noch ziemlich oft nach Korrelationen suchen.

In diesem Tutorial zeige ich Ihnen zwei wirklich einfache Möglichkeiten, um Korrelationskoeffizienten in Excel berechnen. Dafür gibt es bereits eine eingebaute Funktion, und Sie können auch das Data Analysis Toolpak verwenden.

Also lasst uns anfangen!

Was ist der Korrelationskoeffizient?

Da dies keine Statistikklasse ist, lassen Sie mich kurz erklären, was der Korrelationskoeffizient ist, und dann gehen wir zum Abschnitt über, in dem wir den Korrelationskoeffizienten in Excel berechnen.

Ein Korrelationskoeffizient ist ein Wert, der angibt, wie eng zwei Datenreihen miteinander verbunden sind.

Ein häufig verwendetes Beispiel ist das Gewicht und die Größe von 10 Personen in einer Gruppe. Wenn wir den Korrelationskoeffizienten für die Größen- und Gewichtsdaten dieser Personen berechnen, erhalten wir einen Wert zwischen -1 und 1.

Ein Wert kleiner als Null zeigt eine negative Korrelation an, d. h. wenn die Körpergröße zunimmt, nimmt das Gewicht ab, oder wenn das Gewicht zunimmt, nimmt die Körpergröße ab.

Und ein Wert über Null weist auf eine positive Korrelation hin, das heißt, wenn die Körpergröße zunimmt, nimmt das Gewicht zu, und wenn die Körpergröße abnimmt, nimmt das Gewicht ab.

Je näher der Wert an 1 liegt, desto stärker ist die positive Korrelation. Ein Wert von 0,8 würde also anzeigen, dass die Größen- und Gewichtsdaten stark korreliert sind.

Hinweis: Es gibt verschiedene Arten von Korrelationskoeffizienten und Statistiken, aber in diesem Tutorial werden wir uns den gebräuchlichsten ansehen, den Pearson-Korrelationskoeffizienten

Sehen wir uns nun an, wie dieser Korrelationskoeffizient in Excel berechnet wird.

Berechnung des Korrelationskoeffizienten in Excel

Wie bereits erwähnt, gibt es mehrere Möglichkeiten, den Korrelationskoeffizienten in Excel zu berechnen.

Verwenden der CORREL-Formel

CORREL ist eine Statistikfunktion, die in Excel 2007 eingeführt wurde.

Angenommen, Sie haben einen Datensatz wie unten gezeigt, in dem Sie den Korrelationskoeffizienten zwischen der Größe und dem Gewicht von 10 Personen berechnen möchten.

Unten ist die Formel, die dies tun würde:

=KORREL(B2:B12,C2:C12)

Die obige CORREL-Funktion verwendet zwei Argumente - die Reihe mit den Höhendatenpunkten und die Reihe mit den Gewichtsdatenpunkten.

Und das ist es!

Sobald Sie die Eingabetaste drücken, führt Excel alle Berechnungen im Backend durch und gibt Ihnen eine einzige Pearson-Korrelationskoeffizientenzahl.

In unserem Beispiel liegt dieser Wert etwas über 0,5, was darauf hindeutet, dass es eine ziemlich starke positive Korrelation gibt.

Diese Methode wird am besten verwendet, wenn Sie zwei Reihen haben und Sie nur den Korrelationskoeffizienten benötigen.

Wenn Sie jedoch mehrere Reihen haben und den Korrelationskoeffizienten aller dieser Reihen herausfinden möchten, können Sie auch das Datenanalyse-Toolpaket in Excel verwenden (wird als nächstes behandelt).

Verwenden des Datenanalyse-Toolpaks

Excel verfügt über ein Data Analysis Toolpak, mit dem schnell verschiedene Statistikwerte berechnet werden können (einschließlich des Korrelationskoeffizienten).

Aber das Data Analysis Toolpak ist in Excel standardmäßig deaktiviert. Der erste Schritt wäre also, das Datenanalysetool wieder zu aktivieren und dann damit den Pearson-Korrelationskoeffizienten in Excel zu berechnen.

Aktivieren des Datenanalyse-Toolpaks

Nachfolgend finden Sie die Schritte zum Aktivieren des Data Analysis Toolpak in Excel:

  1. Klicken Sie auf die Registerkarte Datei
  2. Klicken Sie auf Optionen
  3. Klicken Sie im sich öffnenden Dialogfeld Excel-Optionen auf die Option Add-Ins im Seitenleistenbereich
  4. Wählen Sie in der Dropdown-Liste Verwalten die Option Excel-Add-Ins aus
  5. Klicken Sie auf Los. Dies öffnet das Add-In-Dialogfeld
  6. Aktivieren Sie die Option Analysis Toolpak
  7. Klicken Sie auf Ok

Die obigen Schritte würden eine neue Gruppe auf der Registerkarte Daten im Excel-Menüband namens Analyse hinzufügen. Innerhalb dieser Gruppe hätten Sie die Option Datenanalyse

Berechnung des Korrelationskoeffizienten mit dem Data Analysis Toolpak

Nachdem Sie nun das Analysewerkzeug wieder im Menüband verfügbar haben, sehen wir uns an, wie Sie den Korrelationskoeffizienten damit berechnen.

Angenommen, Sie haben einen Datensatz wie unten gezeigt und möchten die Korrelation zwischen den drei Reihen (Größe und Gewicht, Größe und Einkommen sowie Gewicht und Einkommen) herausfinden.

Im Folgenden sind die Schritte dazu aufgeführt:

  1. Klicken Sie auf die Registerkarte Daten
  2. Klicken Sie in der Gruppe Analyse auf die Option Datenanalyse
  3. Klicken Sie im sich öffnenden Dialogfeld „Datenanalyse“ auf „Korrelation“.
  4. OK klicken. Dadurch wird das Dialogfeld Korrelation geöffnet
  5. Wählen Sie für den Eingabebereich die drei Serien aus - einschließlich der Überschriften
  6. Stellen Sie bei „Gruppiert nach“ sicher, dass „Spalten“ ausgewählt ist
  7. Wählen Sie die Option – „Beschriftung in erster Reihe“. Dadurch wird sichergestellt, dass die resultierenden Daten die gleichen Header haben und die Ergebnisse viel einfacher zu verstehen sind
  8. Wählen Sie in den Ausgabeoptionen aus, wo die resultierende Tabelle angezeigt werden soll. Ich werde mit Zelle G1 auf demselben Arbeitsblatt gehen. Sie können Ihre Ergebnisse auch in einem neuen Arbeitsblatt oder einer neuen Arbeitsmappe abrufen
  9. OK klicken

Sobald Sie dies tun, berechnet Excel den Korrelationskoeffizienten für alle Reihen und gibt Ihnen eine Tabelle wie unten gezeigt:

Beachten Sie, dass die resultierende Tabelle statisch ist und nicht aktualisiert wird, falls sich einer der Datenpunkte in Ihrer Tabelle ändert. Bei einer Änderung müssen Sie die obigen Schritte erneut wiederholen, um eine neue Tabelle mit Korrelationskoeffizienten zu erstellen.

Dies sind also zwei schnelle und einfache Methoden, um den Korrelationskoeffizienten in Excel zu berechnen.

Ich hoffe, Sie fanden dieses Tutorial nützlich!

wave wave wave wave wave