Wenn Sie Google Sheets verwenden, um mit zwei Datensätzen zu arbeiten, möchten Sie vielleicht die beiden vergleichen, indem Sie bestimmen, inwieweit der eine den anderen beeinflusst.
Korrelationen können Aufschluss darüber geben, ob es eine prädiktive Beziehung zwischen x- und y-Ebenen gibt, aber sie weisen nicht unbedingt auf Kausalität hin. So können Sie Google Sheets verwenden, um Korrelationen in Ihren Daten zu erkennen.
Was ist Korrelation und wofür können Sie sie verwenden?
Wenn zwei Variablen korreliert sind, kann man bestimmen, wie sich eine Variable auf die andere auswirkt. Aber es ist wichtig, sich daran zu erinnern, dass Korrelation in diesem Fall kein Vertrauen impliziert; es zeigt nur, wie eng und schnell zwei Variablen verglichen oder in Beziehung gesetzt werden.
Statistische Metriken helfen beim Verständnis der zugrunde liegenden Trends in der Datenanalyse. Die Korrelation gehört zu den am häufigsten verwendeten statistischen Metriken und bestimmt, wie eng verwandt oder abhängig zwei Variablen sind.
Den Korrelationskoeffizienten in Google Sheets verstehen
In Google Sheets wird ein Korrelationskoeffizient mit der Funktion CORREL berechnet. Der Korrelationskoeffizient dient als Maß dafür, wie eng die Datensätze miteinander verbunden sind. Es kann verwendet werden, um den Pearson-Produkt-Moment-Korrelationskoeffizienten (r) zu erhalten, wenn Sie zwei variable Datensätze haben. Wenn Sie mehr über diesen Koeffizienten erfahren möchten, können Sie mehr in diesem Leitfaden nachlesen Statistik bei Leard.
Man könnte auf eine von drei Korrelationsmetriken stoßen. Jede Messung definiert die Beziehungen zwischen Variablen anders. Sein Wert liegt zwischen -1 und +1:
- -1 bezeichnet eine perfekte negative Korrelation: Wenn eine Korrelation einen Korrelationskoeffizienten von gleich oder unter -0,9 aufweist, wird sie als stark negativ bezeichnet. Es ist ein Hinweis darauf, dass die Daten korrelieren. Die Variable x nimmt jedoch weiter zu, während die Variable y weiter abnimmt.
- 0 bedeutet keine Verbindung: Variablen gelten als nicht korrelierend, wenn der Korrelationskoeffizient größer als 0,01, aber kleiner als 0,1 ist, da keine erkennbare Beziehung zwischen den einzelnen Variablen besteht. Sie sind voneinander unabhängig.
- +1 steht für eine perfekte positive Korrelation: Wenn der Koeffizient einer Korrelation zwischen 0,9 und 1 liegt, gilt er als sehr positiv. Es zeigt an, dass es eine Zunahme der beiden Variablensätze gegeben hat.
Der höchste Wert eines Koeffizienten kann ein Korrelationskoeffizient von 1 gewesen sein. Wenn der Korrelationswert 1 ist, bedeutet dies, dass die Daten, wenn Sie sie grafisch darstellen würden, vollständig ausgerichtet wären, um eine gerade Linie zu erstellen.
Wenn Sie immer noch ein wenig verloren sind, machen Sie sich keine Sorgen. Wir erklären die Syntax der CORREL-Funktion und tauchen dann in einige Beispiele aus der Praxis ein, damit Sie sie besser verstehen. Linien der besten Anpassung verstehen und wie man Trendlinien in Google Sheets erstellt wird Ihnen dabei helfen.
CORREL-Funktionssyntax in Google Sheets
=KORREL(Daten_y, Daten_x)
Lassen Sie uns dies in seine Teile zerlegen und besser verstehen, was jeder Satz bedeutet:
- = KORREL: Dies ist die Google Sheet-Funktion, die r bestimmt (den Pearson-Produkt-Moment-Korrelationskoeffizienten des Datensatzes).
- Daten_y: Dies bezieht sich auf die Gruppe von Zellen, die die abhängigen Daten oder den Wertebereich für diese Zellen enthalten.
- Daten x: Dies ist entweder ein Verweis auf das Array von Zellen mit den unabhängigen Daten oder der Wertebereich für diese Zellen.
Wenn Sie die Datenpunkte grafisch darstellen würden, wäre data_y die Y-Achse und data_x die X-Achse. Sie werden feststellen, dass es zwei verschiedene Möglichkeiten gibt, den Datenbereich einzugeben. Entweder ein Referenzzellenbereich oder eine direkte Dateneingabe in der Funktion sind Optionen.
In den meisten Fällen ist die Verwendung des Referenzzellenbereichs vorzuziehen. Das liegt daran, dass die Tabelle höchstwahrscheinlich bereits Ihre Daten enthält. Die Verwendung eines Referenzzellenbereichs kann übermäßige Eingaben vermeiden, die zu Benutzerfehlern führen können.
CORREL-Funktionsbeispiele in Google Sheets
Sehen wir uns einige Beispiele an, um zu verstehen, wie die CORREL-Funktion in Google Sheets verwendet wird.
Beispiel 1: Eine starke positive Korrelation
Nehmen wir für dieses erste Beispiel an, wir arbeiten in der Immobilienbranche. In der nachstehenden Tabelle haben wir Aufteilungen von Hektar Land, die Sie verkaufen, und die Anzahl der verkauften Einheiten der Daten dieser verschiedenen Länder in Ihrem Google Sheet.
- Wenn Sie in einem Blatt folgen, beginnen Sie damit, die Daten der Variablen in Ihre Tabelle einzugeben, wie unten gezeigt:
- Zelle anklicken C2
- Typ =KORREL(
- Sie fahren dann mit der Eingabe von data_y fort, was in unserem Fall der referenzierte Zellbereich ist A2:A6, Geben Sie dann ein Komma ein.
- Fahren Sie mit der Eingabe von data_x fort, die in unserem Fall als referenziert wird B2:B6.
- Beenden Sie mit einer schließenden Klammer, wie unten gezeigt:
- Zuletzt drücken Eingeben um den Korrelationskoeffizienten der beiden Daten in der Zelle zurückzugeben C2.
Unter Verwendung des oben gezeigten Beispiels haben Sie einen Korrelationskoeffizienten von 0,90 erhalten, was eine starke positive Korrelation ist, da sein Wert zwischen 0,9 und 1 liegt. Daher zeigt dies an, dass sich x in einer im Wesentlichen vergleichbaren Weise ändert, wenn sich y ändert.
Nachfolgend finden Sie eine Darstellung unserer Beispielbeispieldaten in einem XY-Streuungsdiagramm. Wie Sie sehen können, liegt die Linie der besten Anpassung nahe an den Datenpunkten im Diagramm, was die Idee unterstützt, dass die Zahlen stark korrelieren.
Sie können mehr darüber erfahren Erstellen von XY-Streudiagrammen in Google Sheets in unserem anderen Artikel.
Beispiel 2: Eine schwache negative Korrelation
Dieses Mal verwenden wir in unserer Tabelle ein allgemeineres Beispiel für „Variablen x und y“. Wir haben absichtlich Zahlen eingefügt, um eine negative Korrelation zu demonstrieren, die die CORREL-Funktion unten demonstriert:
Es gibt keine starke Beziehung zwischen den Variablen y und x, daher erhalten wir als Ergebnis einen weniger signifikanten Korrelationskoeffizienten als im vorherigen Beispiel. Das von uns erzielte Ergebnis ist -0,47. Dies bedeutet jedoch nicht, dass überhaupt kein Zusammenhang besteht. Schauen wir uns noch einmal eine Linie der besten Anpassung an, um sie zu verstehen.
Wie Sie dem Streudiagramm entnehmen können, sind die Datenpunkte weiter von der Linie der besten Anpassung entfernt. Es gibt also weniger Korrelation als im ersten Beispiel, aber nicht keine. Sie werden auch feststellen, dass die Linie der besten Anpassung abnimmt. Dies zeigt eine negative Korrelation, ein Wert nimmt ab, während der andere zunimmt.
Beispiel 3: Keine Verbindung
Hier haben wir eine Reihe von völlig zufälligen Zahlen. Lassen Sie uns noch einmal kurz auf die Verwendung der CORREL-Funktion eingehen:
- Geben Sie Zelle ein C2 die CORREL-Formel
- Unsere Argumente sind A2:A10 Und B2:B10
- Drücke Enter
Der auf C2 zurückgegebene Wert ist 0,02. Wenn ein Korrelationskoeffizient zwischen 0,01 und 0,1 fällt, wird festgestellt, dass die betreffenden Variablen nicht korrelieren, da kein erkennbarer Zusammenhang zwischen ihnen besteht. Die Beziehungen zwischen Variablen sind völlig unabhängig.
Unten ist die Darstellung derselben in einem Streudiagramm. Die Linie der besten Anpassung ist fast flach, was auf eine geringe Korrelation zwischen den beiden Datensätzen hinweist.
Korrelieren Sie ganz einfach Ihre Daten in Google Sheets
Korrelation könnte ein herausforderndes Thema sein, wenn Sie in der High School nicht viel damit gearbeitet haben. In diesem Leitfaden wurden alle Grundlagen behandelt, aber Sie müssen die CORREL-Funktion in Google Sheets weiterhin verwenden, um sie in Erinnerung zu behalten.
Dies ist eine leistungsstarke Funktion, da sie hilft, das Erstellen von Streudiagrammen zu vermeiden und Trends in Ihren Daten schnell zu finden. Scheuen Sie sich dennoch nicht, Diagramme hinzuzufügen, um anderen Benutzern zu helfen, die Daten in Ihren Tabellenkalkulationen besser zu verstehen.