Zum Inhalt springen
Gaston

Wie berechne ich Korrelationen eigentlich richtig?

Empfohlene Beiträge

Gaston

Da ich für viele Fonds nur Daten über die letzten drei bis fünf Jahre ziehen kann, habe ich für Korrelationsberechnungen bisher die tägliche Wertänderung ((Tageskurs Vortageskurs) / Vortageskurs) genommen.

 

Es scheint aber eher üblich zu sein, Monatswerte zu verwenden. Supertobs arbeitet in seinem wunderbaren Faden Korrelationen, Renditen und Risikodaten" mit Monatsendwerten und in vielen Finanzpublikationen werden Änderungen von Korrelationseigenschaften mit einer rollierenden 5-Jahres-Korrelation dokumentiert. Die basiert dann auch immer auf Monatsdaten.

 

Jedenfalls bin ich ins grübeln gekommen, ob mir die Auswertung der Tagesrenditen nicht etwas zu schöne Korrelationseigenschaften liefert. Konkret habe ich gerade die Korrelation zwischen Patri (FR0010135103) und Arero (LU0360863863) berechnet. Dazu habe ich die Kursdaten seit Auflage des Arero (21.10.2008) aufbereitet und synchronisiert ..

 

post-18973-0-36332400-1326844549_thumb.png

 

..und dann für Korrel() nach Excel kopiert:

 

post-18973-0-04050300-1326844603_thumb.png

 

Korrelationskoeffizient: 0,13

 

Als nächstes habe ich mir die rollierende Jahreskorrelation anzeigen lassen. Das Chart zeigt die Korrelationskoeffizienten seit dem 21.10.2009 für das jeweils zurückliegende Jahr:

 

post-18973-0-53216500-1326844736_thumb.png

 

Der Koeffizient bewegt sich in einer Spanne zwischen 0,05 und 0,18.

Ich hatte zwar beim Betrachten des normalen Performance Charts schon das Gefühl, dass die beiden Fonds nicht allzu stark korreliert sind. Aber dass sie so gute Korrelationseigenschaften aufweisen sollen, kommt mir doch etwas spanisch vor. Entweder die Kombi ist ein echter Treffer oder die Berechnung auf Basis von Tageswerten führt in die Irre. Hier das Performance Chart seit Auflage des Arero:

 

post-18973-0-28592900-1326844792_thumb.png

 

Als Nächstes habe ich die Gegenprobe gemacht und die Kursdaten auf Monatsbasis aufbereitet. Performance = (Vormonat Monat) / Monat auf Basis der Kurswerte am jeweils letzten Börsentages eine Monats. Dazu liefert Korrel() dann einen Korrelationskoeffizienten von 0,11.

 

Das Ergebnis scheint erst einmal dafür zu sprechen, dass die Berechnung auf Tagesbasis OK war. Aber die rollierende Jahreskorrelation bewegt sich in einer viel größeren Spannbreite:

 

post-18973-0-69795400-1326844877_thumb.png

 

Der Koeffizient für die Jahreskorrelation schwankt auf Monatsbasis zwischen 0,75 und -0,43.

Auf Basis von Tagesdaten hatte er sich hingegen in einem Korridor zwischen 0,05 und 0,18 bewegt.

 

Liegt das daran, dass auf Monatsbasis nur 12 Datenpunkte für die Jahreskorrelation zur Verfügung stehen?

Spricht das dafür, Jahreskorrelationen auf Basis von Tageswerten zu berechnen?

Oder zeigt das einfach, dass die Korrelationseigenschaften in Wirklichkeit gar nicht so gut sind?

 

Ich bin da relativ ratlos und würde mich freuen, wenn die Experten hier im Forum etwas dazu sagen könnten.

Diesen Beitrag teilen


Link zum Beitrag
Schinzilord

Natürlich ist die Abweichung (also der Fehlerbalken) viel viel größer, wenn man so wenige Punkte zur Verfügung hat. Ich berechne grundsätzlich die Korrelationen (rollierend) auf Tagesbasis, alles andere ist nicht aussagekräftig bzw. mit einem zu großen Fehler behaftet.

Das siehst du ja an z.B. t-tests oder F-tests, wo die Anzahl der Werte indirekt proportional zum Fehler ist.

Je mehr, desto besser.

Da haben meines Erachtens sehr viele Publikationen statistische Lücken, sieht man dann auch, wenn z.B. nur 1/5 der Daten wirklich statistisch signifikant sind. (Aussagen werden trotzdem getroffen. Oftmals ist halt die Datenlage so schlecht, insbesondere bei Hedgefonds).

Diesen Beitrag teilen


Link zum Beitrag
Gaston

Natürlich ist die Abweichung (also der Fehlerbalken) viel viel größer, wenn man so wenige Punkte zur Verfügung hat. Ich berechne grundsätzlich die Korrelationen (rollierend) auf Tagesbasis, alles andere ist nicht aussagekräftig bzw. mit einem zu großen Fehler behaftet.

Das siehst du ja an z.B. t-tests oder F-tests, wo die Anzahl der Werte indirekt proportional zum Fehler ist.

Je mehr, desto besser.

Genau da setzen meine Zweifel an. Um mit statistischen Auswertungen eine sinnvolle Aussage zu treffen, muss ich ja nicht nur möglichst viele Messwerte erheben, sondern auch die richtigen Messpunkte festlegen.

Z.B. Könnte ich für eine Korrelationsanalyse von zwei Assets auch die Daten aus dem Börsentickker einlesen und dann die stündliche, minütliche oder sekündliche Wertänderung als Datenbasis nehmen. Dann hätte noch viel mehr Daten, aber würde das zu einer besseren Aussage über die Korrelationseigenschaften in Hinblick auf meine Vermögensallokation führen?

Um zu verdeutlichen, woraus ich hinaus will, habe ich mal fiktive Kursdaten für zwei Assets generiert:

post-18973-0-68874600-1326894760_thumb.png

Eine Korrelationsberechnung auf Basis der täglichen Wertänderung liefert für diese 130 Wertepaare einen Koeffizienten von -1 (genauer: -0,9985). Also praktisch vollständig negativ korreliert. Ob ich mit dieser Aussage in Hinblick auf eine Anlageentscheidung gut beraten wäre? ;)

Nun im Vergleich die Monatswerte:

 

post-18973-0-91461600-1326894830_thumb.png

Die Korrelationsberechnung auf Basis der monatlichen Wertänderung liefert einen Koeffizienten von 0,32 (genauer: 0,3224). Natürlich ist diese Auswertung mit nur sechs Wertepaaren statistisch gesehen viel fehlerbehafteter. Je länger ich diese Datenreihen fortsetzen würde, desto mehr würde sich der Korrelationskoeffizient in Richtung 1 bewegen.

Trotzdem sieht man, dass die Monatswerte hier eindeutig der sinnvollere Messpunkt sind (dazu habe ich die Daten ja auch konstruiert). Ich hoffe, dass jetzt deutlicher geworden ist, worüber ich ins grübeln gekommen bin.

Diesen Beitrag teilen


Link zum Beitrag
Schinzilord

Aber es passt doch, die Korrelation ist ja tatsächlich -1 :)

 

Die Korrelation beschreibt ja nur die tägliche Variation der Rendite. Und ich finde dies ein hervorragendes Papier, wenn eines in meinem Depot runter geht, das andere raufgeht. Bei der täglichen Variation und neg. Korrelation sage ich ja nix über den Erwartungswert aus, der bei beiden ja positiv sein kann.

Bei den Monatswerte berechnest du ja schon eher die Korrelation des monatlichen Erwartungswertes (sozusagen die täglichen Variationen kumuliert auf einen Monat). Da beide ja einen positiven Erwartungswert haben, muss natürlich die Korrelation auf Monatsbasis positiver sein.

 

Ich sehe in deinen Beispielen keinen Widerspruch zur Aussage "neg. Korrelation ist falsch berechnet für die beiden Wertpapiere auf täglicher Basis".

Die neg. Ausschläge glätten doch deinen Kursverlauf ins perfekt lineare -> perfekte neg. Korrelation.

Sozusagen für die tägliche Variation gilt die Aussage.

 

Ich nehme deswegen die tägliche Variation her, weil ich ja auch täglich ins Depot schaue und mich dort über gegenläufige Schwankungen freue.

Wenn jemand nur monatlich reinschaut, tut es natürlich auch die monatliche Variation :)

Diesen Beitrag teilen


Link zum Beitrag
Gaston

Klar würde es bei diesen Papieren Spaß machen, täglich ins Depot zu schauen. Wenn das eine 5 Euro runter geht, geht das andere 10 Euro rauf und nach einem halben Jahr stehen beide 32,5% im Plus. :)

 

Aber ich würde doch im Leben nicht auf die Idee kommen, die beiden Papiere aufgrund ihrer Korrelationseigenschaften ins Portfolio zu nehmen. Was ist denn, wenn jemand den Algorithmus ändert und statt zwei Schritt vor, ein Schritt zurück, geht es plötzlich ein Schritt vor, zwei Schritte zurück? Dann marschieren die Beiden perfekt negativ korreliert in den Keller. Korrelationskoeffizient = -1, Diversifikationseffekt = 0.

 

Ich ziehe aus dem Beispiel den Schluss, dass Korrelationsberechnungen auf Basis der täglichen Variation zwar die statistisch signifikanteren Ergebnisse liefern, aber doch eher mit Vorsicht zu genießen sind, wenn der Anlagehorizont über den Tag hinaus geht.

 

Das Beispiel wird natürlich in der Praxis so nicht vorkommen. Aber vielleicht gibt es neben der teilweise schwierigen Datenlage noch einen anderen Grund dafür, dass es eher üblich ist, die Korrelation der monatlichen Variation zu berechnen. Nämlich, dass sich der Diversifikationseffekt mit diesen Messpunkten besser abschätzen lässt.

Diesen Beitrag teilen


Link zum Beitrag
Malvolio
· bearbeitet von Malvolio

Aber es passt doch, die Korrelation ist ja tatsächlich -1 :)

 

Die Korrelation beschreibt ja nur die tägliche Variation der Rendite. Und ich finde dies ein hervorragendes Papier, wenn eines in meinem Depot runter geht, das andere raufgeht. Bei der täglichen Variation und neg. Korrelation sage ich ja nix über den Erwartungswert aus, der bei beiden ja positiv sein kann.

 

Beeinträchtigt eine negative Korrelation nicht doch den Erwartunswert? Bei -1 müssten sich doch die entgegengesetzten Schwankungen letztendlich ausgleichen. Wäre nicht ein Koeffizient von 0 ideal? Klar, wenn man bei beiden Papieren von einem Wachstumspfad ausgeht .... aber kann das bei -1 überhaupt sein? Wenn du mit Tagesintervallen rechnest, dann musst du doch auch Tagesrenditen betrachten. Ansonsten vergleicht man doch Äpfel mit Birnen, oder?

Diesen Beitrag teilen


Link zum Beitrag
vanity
· bearbeitet von vanity

Beeinträchtigt eine negative Korrelation nicht doch den Erwartungswert? Bei -1 müssten sich doch die entgegengesetzten Schwankungen letztendlich ausgleichen.

Müssen sie nicht. Die Korrelation trifft zwar eine Aussage über die Gleich- oder Gegenläufigkeit von Schwankungen, nicht aber über deren Höhe. Man kann mühelos zwei Kursverläufe konstruieren, deren Performanceverläufe perfekt negativ korreliert sind, aber dennoch beide sowohl einzeln als auch als Portfolio betrachtet einen positiven Erwartungswert aufweisen.

 

K1(t) = 1000 + 0,1*t + DAX(t)/100000

K2(t) = 1000 + 0,1*t - DAX(t)/100000

 

K1, K2 = Kurs abhängig von Zeit, t = Zeit, z. B. in Tagen

 

Da hier die Schwankungen bei beiden Verläufen nur aus den minimalen DAX-Anteilen resultieren, beträgt die Korrelation unabhängig vom DAX-Verlauf immer -1, während der Einfluss auf die Performance gegen null geht (mit Dank an etherial, von dem das Beispiel so oder ähnlich stammt)

 

Wäre nicht ein Koeffizient von 0 ideal? Klar, wenn man bei beiden Papieren von einem Wachstumspfad ausgeht .... aber kann das bei -1 überhaupt sein?

Auch hier lässt sich ein Gegenbeispiel basierend auf obigem kontruieren:

 

K1(t) = 1000 + 0,1*t + DAX(t)/100000 + zufälliger, sehr kleiner Wert

K2(t) = 1000 - 0,1*t + DAX(t)/100000 + zufälliger, sehr kleiner Wert

 

Korrelation = 0 (Nachtrag: Unsinn, die Korrelation ist hier natürlich = 1. Statt "+DAX/100000" müsste hier etwas wie "+Zufallszahl, normiert auf kleinen Wert" stehen), Erwartungsrendite nahe null! (irgendwann wird K2 negativ, dann passt es nicht mehr)

 

Korrelation allein ist gar nichts, sondern muss immer in Verbindung mit den erwarteten Renditen und der Volatilität gesehen werden. Siehe hierzu auch etherials Ausführungen im Thread Mythos Korrelation.

 

Nachtrag: Fehler im zweiten Beispiel korrigiert.

 

 

Wenn du mit Tagesintervallen rechnest, dann musst du doch auch Tagesrenditen betrachten. Ansonsten vergleicht man doch Äpfel mit Birnen, oder?

Macht Gaston meines Erachtens doch.

Diesen Beitrag teilen


Link zum Beitrag
Malvolio

Vielen Dank, Vanity. :thumbsup: Ich muss mich mal wieder etwas intensiver mit solchen Themen beschäftigen. Das Studium ist einfach schon zu lange her.

Diesen Beitrag teilen


Link zum Beitrag
Gaston

Beeinträchtigt eine negative Korrelation nicht doch den Erwartungswert? Bei -1 müssten sich doch die entgegengesetzten Schwankungen letztendlich ausgleichen.

Müssen sie nicht. Die Korrelation trifft zwar eine Aussage über die Gleich- oder Gegenläufigkeit von Schwankungen, nicht aber über deren Höhe. Man kann mühelos zwei Kursverläufe konstruieren, deren Performanceverläufe perfekt negativ korreliert sind, aber dennoch beide sowohl einzeln als auch als Portfolio betrachtet einen positiven Erwartungswert aufweisen.

Das Beispiel war nach folgendem Muster aufgebaut. Zwei Wertpapiere mit einem Kurswert von je1000$ nehmen folgende Entwicklung:

Erster Tag: PapierA +10$; PapierB -5$

Zweiter Tag: PapierA -5$; PapierB +10$

Dritter Tag: PapierA +10$; PapierB -5$

Vierter Tag: PapierA -5$; PapierB +10$

Etc.

 

Die beiden Papiere erreichen also jeden zweiten Tag den gleichen Kurswert, der auch immer ein neuer Höchststand ist. Die tägliche Wertänderung ist dabei aber immer gegenläufig. Entsprechend sind die täglichen Renditen negativ und die monatlichen Renditen positiv korreliert.

 

Das Beispiel sollte aber nur verdeutlichen, dass Korrelationsberechnungen zu unterschiedlichen Ergebnissen führen können, je nach dem, ob man die täglichen oder die monatlichen Wertänderungen betrachtet. Ich wollte nämlich gerne Wissen, ob es OK ist, Korrelationen auf Basis der täglichen Wertänderungen zu berechnen, wenn die Historie nicht genug Daten für die Betrachtung der monatlichen Wertänderungen hergibt.

 

Schinzilord hat sich da klar positioniert und gesagt, dass er Korrelationen (rollierend) grundsätzlich auf Tagesbasis berechnet. Ich nehme an, dass das auch Konsens hier im Forum ist. In der Praxis mit Echtdaten sind die Unterschiede auch nicht so gravierend wie bei dem konstruierten Beispiel. Lediglich bei der rollierenden Jahreskorrelation bin ich auf unerfreuliche Diskrepanzen gestoßen wie hier am Beispiel von Arero und Carmignac Patrimoine (Tagesbasis rot, Monatsbasis blau):

 

post-18973-0-42077900-1327315441_thumb.png

 

Korrelation allein ist gar nichts, sondern muss immer in Verbindung mit den erwarteten Renditen und der Volatilität gesehen werden. Siehe hierzu auch etherials Ausführungen im Thread Mythos Korrelation.

Danke für den schönen Link! Aber auch um die Korrelation im Zusammenhang mit Vola und erwarteter Rendite zu sehen, muss ich wissen, wie man sie berechnet. Auch in Etherials schönem Excel Tool muss ich einen Wert für Korrelation eintragen. :)

 

Der Hinweis, das Problem doch nicht so isoliert zu betrachten, ist aber sehr hilfreich. Für die Vola stellt sich ja die gleiche Frage: Nehme ich die Standardabweichung der Monatsrenditen und annualisiere durch Multiplikation mit Wurzel(12) oder nehme ich die Standardabweichung der Tagesrenditen und multipliziere mit Wurzel(250). Und für die Erwartete Rendite muss ich auch den Mittelwert (arithmetisch, geometrisch, logarithmisiert?) aus den Renditen der gewählten Zeiteinheit bilden und annualisieren.

 

Vermutlich sollte man für Korrelation, Vola und erwartete Rendite jeweils die gleiche Zeiteinheit zu wählen, wenn man den Zusammenhang betrachten will. Für welche man sich dann entscheidet, wird wahrscheinlich von der Datenlage und dem Zweck der Betrachtung abhängen. Monatsrenditen eignen sich z. B. recht gut, um rollierende Jahreszeiträume darstellen. Hier mal die Korrelation und die Rendite-Risiko-Verhältnisse von Arero und Carmignac Patrimoine für einen rollierenden Zweijahreszeitraum:

 

post-18973-0-97057800-1327315636_thumb.png

 

Man sieht ganz schön, wie die Korrelation der beiden Fonds mit fallenden Rendite-Risiko-Verhältnissen abnimmt. Der Anstieg der Korrelation in den ersten Monaten geht mit einer deutlichen Verbesserung des Rendite-Risiko-Verhältnis beim Arero einher. Also eigentlich ideal! Das Dumme ist nur, dass die blaue Korrelationskurve auf Basis von Tageswerten ganz anders aussehen würde. :(

 

Zumindest bezüglich der Volatilität habe ich ein paar Hinweise zur Wahl der Zeitintervalle gefunden. Bei Monatsrenditen benötigt man mindestens 36 Monate für eine aussagekräftige Auswertung. Der Chart oben wäre also nur für einen rollierenden Dreijahreszeitraum sinnvoll. Bei Tagesrenditen sollte man zwischen 90 und 180 Tage hernehmen. Mehr als 180 Datenpunkte können schon wieder problematisch werden, wenn man die Änderung der Vola mitbetrachten möchte. Vielleicht versuche ich es mal mit Wochenrenditen :)

Diesen Beitrag teilen


Link zum Beitrag
Onkel Doktor

Genau da setzen meine Zweifel an. Um mit statistischen Auswertungen eine sinnvolle Aussage zu treffen, muss ich ja nicht nur möglichst viele Messwerte erheben, sondern auch die richtigen Messpunkte festlegen.

Ist zwar schon etwas älter, aber ich habs gerade zufällig gelesen:

Wenn du "möglichst viele" Messpunkte mitnimmst, dann hast du automatisch die richtigen dabei! Das ist eine ganz normale Aussage, die man so allgemein bei der Abtastung von Signalen in ganz vielen Disziplinen findet.

 

Wenn du mit den Abtastwerten (also hier die Tageswerte, Monatswerte usw.) eines Signales (hier der Kursverlauf) eine sinnvolle Aussage treffen willst, muss deine Abtastfrequenz immer größer sein, als die größte Frequenz des Signals. Wenn du eine MP3 mit ner Abtastfrequenz von 1/s erzeugst, dann kannst du ja das Lied auch nicht mehr erkennen.

 

Sprich: Wenn die Monatswerte stark schwanken, muss man halt die Tageswerte nehmen. Wenn deine Tageswerte wie Hacke zappeln, dann macht es eigentlich keinen großen Sinn, diese Werte zu benutzen. Hat man keine besseren, dann ist das schlecht. Die Werte, die du benutzt, sollten, wenn man sie verbindet, eine möglichst schöne glatte Funktion bilden. Denn mit den Werten macht man ja noch was total ungünstiges: Für die Berechnung der Volatilität braucht man den Gewinn und nicht die Werte selbst und dafür muss man die Kurven der Kursverläufe (numerisch) ableiten. Das ist numerisch gesehen immer total schlecht (im Vergleich zum Integrieren zum Beispiel), weil man sich noch mehr Schwankungen reinholt.

 

Je weiter man die Abtastung verfeinert, desto näher kommt man an die echte Volatilität. Für sehr grobe Abtastungen kann der berechnete Wert auch völlig danebenliegen.

Diesen Beitrag teilen


Link zum Beitrag
Chemstudent

Bei der Korrelatiosnermittlung von Fonds sollte man auch beachten, dass die Fonds unterschiedliche Zeiten der NAV-Ermittlung haben. Hier hilft es, mal um ein oder zwei Tage die Kursreihen gegeneinander zu verschieben (sowohl in die eine, als auch in die andere Richtung). Dennoch bleibt natürlich ein entsprechender Fehler, sofern die NAVs nicht exakt zeitgleich sind.

Diesen Beitrag teilen


Link zum Beitrag
Onkel Doktor
· bearbeitet von Onkel Doktor

Ich hab nochmal am Wochenende über meine Aussage von oben nachgedacht... vielleicht ist das so nicht besonders gut hier anzuwenden. Ich bin mir aber nicht sicher.

Die Kurswerte sind ja extrem verrauscht... vielleicht sollte man zur Berechnung der Volatilität besser die feinsten Werte nehmen die man hat (ich denke mal üblicherweise Tageswerte) und die dann mit irgendeinem Filter glätten. Aus den geglätteten Werten kann man dann prima alles weitere berechnen. Ich denke mal, das wird die beste Methode sein - hat das schonmal wer gemacht?

Edit: Mit den rollierenden Korrelationen ist das ja eigentlich nur einfach nen Rechteckfilter... das klingt nach "einfach irgendwie gelöst" - da könnte man eventuell auch was sinnvolleres wählen.

Diesen Beitrag teilen


Link zum Beitrag

Erstelle ein Benutzerkonto oder melde dich an, um zu kommentieren

Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können

Benutzerkonto erstellen

Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!

Neues Benutzerkonto erstellen

Anmelden

Du hast bereits ein Benutzerkonto? Melde dich hier an.

Jetzt anmelden

×
×
  • Neu erstellen...