Zum Inhalt springen
Melde dich an, um diesem Inhalt zu folgen  
pvdb

DAX Prognose mit der multivariaten Statistik

Empfohlene Beiträge

pvdb

Hi,

 

endlich habe ich mein eigenes "Tagebuch", wo ich nun einige Fortschritte meiner Uni Abschlussarbeit für mich selbst, aber auch für andere (weil das andere vielleicht interessiert) vorstellen.

 

In meiner Arbeit geht es darum den DAX vorauszusagen, eine Aufgabe mit der sich schon viele befasst haben. Neuronale Netze kommen später auch ins Spiel, aber soweit bin ich noch nicht.

 

Ich habe ca. 20 Faktoren (Ölpreis, Zins, Indizes, Währungen, ...), die in meine Berechnungen mit einfließen. Aus diesen Faktoren habe ich mir eine Gleichung berechnet, die den DAX nachbildet. Anschließend habe ich ein Diagramm generiert und dort den echten und den berechneten DAX Wert eingezeichnet. Vom ersten Ergebnis bin ich natürlich überrascht und möchte dies hier auch zeigen:

 

post-1910-1164783927_thumb.gif

 

Dies ist bisher nur eine Funktion, die den DAX nachbildetet, aber nicht voraussagt.

 

In meinen nächsten Schritten, will ich diese Funktion erstmal maximieren. Im weiteren Schritt geht es dann an die Prognose.

 

So Schauts bisher aus :)

 

Phil

Diesen Beitrag teilen


Link zum Beitrag
Gast240123

Hallo pvdb!!!

 

Sehr interessante Thematik. Ich hätte dazu ein paar Fragen.

 

Arbeitest du mit SPSS? Wenn ja, mit welchem SPSS-Modul lassen sich denn Simulationsläufe generieren?

Basiert die Schätzfunktion auf einer multivariaten Regressionsfunktion oder nutzt du anderweitige Verfahren. Welche Gütetests kommen denn bei der Simulation zum Tragen?

 

Gruß

 

Schlafmuetze (, die weiterhin so manches mal Kausalität mit Korrelation verwechselt.)

Diesen Beitrag teilen


Link zum Beitrag
pvdb

Arbeitest du mit SPSS? Wenn ja, mit welchem SPSS-Modul lassen sich denn Simulationsläufe generieren?

Basiert die Schätzfunktion auf einer multivariaten Regressionsfunktion oder nutzt du anderweitige Verfahren. Welche Gütetests kommen denn bei der Simulation zum Tragen?

 

ich arbeite nicht mit spss, sondern habe meine eigene anwendung programmiert. wie du richtig erkannt hast handelt es sich um die multiple regression. bisher wird nur die gleichung von allen parametern erzeugt. der nächste schritt mit der best möglichen gleichung ist noch in arbeit. vielleicht besteht diese ja auch weniger parametern.

 

Welche Gütetests kommen denn bei der Simulation zum Tragen?

 

was meinst du damit? ist das was von spss?

 

 

Mit der prognose habe ich auch schon erste versuche gemacht :) werde demnächst mal eine prognose für eine woche im voraus reinstellen, wenn ich da weiter bin.

 

phil

Diesen Beitrag teilen


Link zum Beitrag
Wishmueller

Hmm! Hüstel, hüstel! Hab´ich was falsch gemacht :unsure:

 

Nein, hast Du nicht. Der Ansatz erscheint mir (ohne dass ich ihn wirklich nachvollziehen kann) deutlich interessanter als .... ach, ich sag' lieber nix :-" B)

 

Mit der prognose habe ich auch schon erste versuche gemacht :) werde demnächst mal eine prognose für eine woche im voraus reinstellen, wenn ich da weiter bin.

 

Kannst Du natürlich machen, aber was spricht dagegen, zumindest die ersten Versuche mal im "stillen Kämmerlein" zu machen? Wenn die ersten Tests "brauchbare Ergebnisse" liefern, kannst Du da ja immer noch öffentlich machen. Wobei die Frage noch wäre: wofür? Hab' hier mehrfach im Forum gelesen, dass man "erfolgreiche Systeme" tunlichst für sich behält. Vielleicht hab' ich da aber auch was falsch verstanden....

Diesen Beitrag teilen


Link zum Beitrag
Gast240123

Gütemaße dienen sozusagen als Qualitätssicherungsinstrumente für bestimmte statistische Verfahren.

 

Für die Regressionsanalyse wären dies für die Prüfung der Regressionsfunktion

 

- das Bestimmtheitsmaß

- F-Statistik

- Standardfehler

 

Maße zur Prüfung der Regressionskoeffizienten wären

 

- der t-Wert

- Beta-Wert

 

Darüber hinaus sind die Residuen auf Autokorrelation, Multikollinearität und Heteroskedastizität zu prüfen.

Diesen Beitrag teilen


Link zum Beitrag
howie153
Vielleicht hab' ich da aber auch was falsch verstanden...

Hast du!

So ein System, an welchem ich den Daxverlauf der kommenden Woche schon mal (nur so zum Vergleich!!!) habe, würde mich schon interessieren. Das Rezept dafür reicht mir vorerst auch! B)

Wozu Trendfolgemodelle, wenn es jetzt bald Trend-ich zeig ihn dir vorher schon mal an-modelle gibt? :unsure:

Diesen Beitrag teilen


Link zum Beitrag
Gast240123

@pvdb

 

Hast du die Matrizen auch mit Hilfe von Excel errechnet? Das ist doch total schwierig oder?

Mein Respekt hast du. :thumbsup: Weiter so...

Diesen Beitrag teilen


Link zum Beitrag
pvdb
· bearbeitet von pvdb
Kannst Du natürlich machen, aber was spricht dagegen, zumindest die ersten Versuche mal im "stillen Kämmerlein" zu machen? Wenn die ersten Tests "brauchbare Ergebnisse" liefern, kannst Du da ja immer noch öffentlich machen. Wobei die Frage noch wäre: wofür? Hab' hier mehrfach im Forum gelesen, dass man "erfolgreiche Systeme" tunlichst für sich behält. Vielleicht hab' ich da aber auch was falsch verstanden....

 

wir im forum gibt es ja schon einige beiträge von schweder bezüglich neuronaler netze und ich will einfach mal hier präsentieren wie es mit einer anderen möglichkeit ausschaut. wobei es bei mir auch einen vergleich mit neuronalen netzen gibt, um zu sehen wo die ergebnisse besser sind. (wobei diese netze mit den relevantesten daten gefüttern werden sollen, um beste bedingungen zu erreichen)

 

es handelt sich auch nur um eine abschlussarbeit und da stelle ich gerne mal ergebnisse vor. ich lese bei anderen versuchen ja auch immer gerne mit. ergebnisse müssen schon ne woche vorher hier rein, denn später könnte ich ja einfach behaupten ich hätte richtig geschätzt. und selbst wenn die prognose nicht korrekt ist, es nicht so wild, da ich ja in der forschung bin.

 

ergebnisse und fortschritte liefern ja noch kein erfolgreiches system, von daher habe ich noch nichts zu verbergen.

 

meine gleichung im diagramm oben sieht zwar interessant aus, aber die standardabweichung liegt immer noch bei zwischen 50-100, je nachdem was für daten ich einspiele. wie es nach der optimierung ausschaut werde ich natürlich berichten. bei meinen ersten prognose versuchen war die standardabweichung auch immer etwas höher als bei der normalen gleichung.

 

 

Hast du die Matrizen auch mit Hilfe von Excel errechnet? Das ist doch total schwierig oder?

 

es ist keine fremdanwendung im spiel. alles mit dem c++ builder selbst gebaut. matrizen kann man in einem einfachen array unterzubringen, von daher war dies nicht so kompliziert. okay, für das berechnen der inverse, da habe ich eine fremdklasse eingebunden :)

 

Gütemaße dienen sozusagen als Qualitätssicherungsinstrumente für bestimmte statistische Verfahren.

 

Einige werden berechnet, aber nicht alle.

 

phil

Diesen Beitrag teilen


Link zum Beitrag
Wishmueller
es handelt sich auch nur um eine abschlussarbeit und da stelle ich gerne mal ergebnisse vor. ich lese bei anderen versuchen ja auch immer gerne mit. ergebnisse müssen schon ne woche vorher hier rein, denn später könnte ich ja einfach behaupten ich hätte richtig geschätzt. und selbst wenn die prognose nicht korrekt ist, es nicht so wild, da ich ja in der forschung bin.

 

ergebnisse und fortschritte liefern ja noch kein erfolgreiches system, von daher habe ich noch nichts zu verbergen.

 

Okay, hab' ich verstanden. Werde den Thread hier auf alle Fälle mit Spannung mitverfolgen, da ich alleine die Idee & den Ansatz sehr interessant finde :)

Diesen Beitrag teilen


Link zum Beitrag
Gast240123

Hallo pvdb!

 

Happyyuppie scheint ganz ähnlich vorzugehen. Vielleicht ist die Seite ja interessant für dich.

Ich persönlich halte davon nichts.

 

Die Schlafmuetze

 

http://www.happyyuppie.com/info/de/FAQ.html

 

Fragen zur den Prognosen

 

--------------------------------------------------------------------------------

 

Werden die Prognosen auf Basis der technischen Analyse erstellt?

Nein, die Prognosen werden auf Basis der statistischen Zeitreihenanalyse erstellt. Die statistische Zeitreihenanalyse untersucht mittels mathematisch-statistischer Methoden die historischen Wertpapier-Kurse, um exakte Prognosen zu bestimmen. Die technische Analyse untersucht in grafischer Form den historischen Wertpapier-Kursverlauf, um aus diesem zukünftige Ereignisse abzuleiten.

 

Was bedeutet statistische Zeitreihenanalyse?

Statistische Zeitreihenanalyse bezeichnet die Untersuchung von zeitlich aufeinander-folgenden Beobachtungen des jeweils gleichen Sachverhaltes (z.B. Tagesschlusskurse einer Aktie). Es werden Gesetzmäßigkeiten in der Zeitreihe erkannt und diese mittels mathematischen Modellen ausgedrückt. Eine Zeitreihe kann idealtypisch in drei Komponenten zerlegt werden:

 

Trendkomponente (entsprechend der langfristigen Entwicklung)

Zyklische Komponente (entsprechend regelmäßigen Schwankunken z.B. Saison)

Irreguläre stochastische Restkomponente

 

...

Diesen Beitrag teilen


Link zum Beitrag
pvdb

Es Tut mir leid, dass ich einige Beiträge hier gelöscht habe. So viel Offtopic wollte ich hier nicht drinnen haben :)

 

Bevor überhaupt prognostiziert wird, soll natürlich untersucht werden, ob man überhaupt prognostizieren kann. Ich denke dass ist ein wesentlicher Punkt ist, der nur von wenigen betrachtet wird. Geht es überhaupt?

 

Eine Gleichung aufzustellen, die den DAX widerspiegelt ist wirklich kein Problem, ist ja pure Mathematik. Wie ich hier im Forum gelesen habe, ist es auch kein Problem für die Vergangenheit ein Modell aufzustellen, bei dem man reich geworden wäre. Ich denke das ist so ziemlich gleiche. Deswegen sollte meine Gleichung auch keine Aussagekraft über Erfolg oder Misserfolg haben.

 

Punkte die ich z.B. untersuchen will sind Vergleiche zwischen einzelnen Zeiträumen, indem ich z.B. einige Jahre mit anderen Jahren vergleiche und teste wie weit die Gleichungen (inbs. die Gewichtungen der Parameter) die am Ende rauskommen verschieden sind. Es kann genau so gut sein, dass wenn ich eine Woche von den Inputdatensätzen weglasse, die Gleichung ganz anders ausschaut als mit dieser Woche. Zusätzlich kann es Unterschiede geben wenn ich tägliche/wöchentliche/monatliche Datensätze nehme. Im Beispiel der Prognose sind die Datensätze wieder anders aufgebaut.

 

Wenn bei den verschiedenen Modellen die Gewichtungen der Parameter stets anders sind, wird es wohl ehr darauf hinausgegen das eine sehr gute Prognose höchstwarscheinlich (will ja nicht gehaupten das es nicht geht) unmöglich ist. Aber vielleicht gibst ja auch Variablen die konstant ihre Bedeutung für den DAX haben, was wieder sehr interessant wäre.

 

Eine Grundlegende Untersuchung sehe ich vor der Prognose und einer Behauptung, dass ich progostizieren kann, als wesentlich wichtiger. Damit werde ich mich auch in der kommenden Woche beschäftigen.

Diesen Beitrag teilen


Link zum Beitrag
Kaa

Wenn du es schaffst eine derart emotionalgesteuerte markoökologische Größe wie den Dax sicher in einem bestimmten Intervall auf lange Zeit vorauszusagen ist dir der Nobelpreis gewiss, dass hat noch kein schlauer Kopf dieser Welt geschafft. Mein Statistikprof meint, dass ist wohl eine der schwersten statistischen Aufgaben, die man sich stellen kann und je öfter ich seine Vorlesung gehe, desto mehr stimme ich ihm zu.

 

Nichtsdestotrotz, viel Erfolg!

Diesen Beitrag teilen


Link zum Beitrag
pvdb

Hallo kaa,

 

Danke für deinen Beitrag. Da hat dein Prof auf jeden Fall recht. Bei meinen aktuellsten versuchen habe ich unter anderen auch analysiert und somit auch für mich und meinen Prof. bewiesen das mit steigener Zukunft die Ungenauigkeit der Prognosen wächst. Habe verschiedene Testläufe mit verschiedenen Parameter mit meiner Anwendung gemacht. Bei den Prognosen wurde die Progose in die Zukunft immer ungebauer. Bei der reinen Abbildung (keine Prognose) wurde die Abbilgung in der Zukunft immer genauer.

 

Wer weiß vielleicht entsteht ja eines Tages nach der Abschlussarbeit ein Tool für Daytrader. Der wichtigste Quellcode ist ja bereits geschrieben :).

 

Auf jeden Fall folgen noch weitere Versuche (mit anderen Bedinungen) und vielleicht lassen sich die Ergebnisse der Prognose ja noch etwas verbessern. Am Ende gibt ja noch die neuronalen netzen, aber ob diese die Ergebnisse steigern, steht noch in den Sternen.

 

Bisher vermute ich aber auch, dass ich mich am Ende an die kurzfristigen Prognosen klammern werde. Das gleiche ist wie beim Wetter. Das Wetter von heute kann ich gut erklären (abbilden), aber bei dem Wetter in einer Woche (Prognose) siehts wieder ganz anders aus. Wobei mein Modell auf pure Mathematik stößt. Keine Ahnung wie das beim Wetter ist.

 

Das exakte Ergebnisse nicht möglich sind ist mir selbst klar, aber mir gehts auch mehr darum herauszufinden unter welchen Bedingungen die Voraussagen maximal sind (maximal != genau).

 

Phil

Diesen Beitrag teilen


Link zum Beitrag
Nussdorf

Also, wenn dus schaffst aus Blei Gold zu machen, schreib mir ne PM

Diesen Beitrag teilen


Link zum Beitrag
Kaa
· bearbeitet von Kaa

Hallo pvdb,

 

kurze Zeiträume lassen sich in der Tat vorhersagen, diese Technik wird intraday sogar bereits von größeren Investoren praktisch verwendet. Das ganze basiert auf Zeitreihenanalyse mit linearer Regression. Das r² ist auch relativ hoch, sodass sich die ganze Sache lohnt.

 

Leider kann man die Modelle nur auf kurzen Zeiträumen anwenden, da wie du sicher weißt die lineare Regression bei x Werten die sich zu weit vom Datenmaterial entfehrnen versagt.

 

Deshalb versucht man Faktoren zu finden, von denen die Börse - neben Emotionen - abhängig ist wie Saisonfaktor, Zinsen, Ölpreis, Dollarkurs etc. Eine ähnliche rangehensweise wie du verfolgt Uwe Lang, ein Buchautor (u.a. "die besten Aktienstrategien"). Er hat die seiner Meinung nach Dax-beeinflussenden Größen der letzten 35 Jahre aufgezeichnet und versucht Rückschlüsse daraus zu ziehen. Vielleicht hilft dir das bei deiner Untersuchung. Zumindest seine Tabellen ersparen viel Arbeit, da die Werte bereits in Exceltabellen gelistet sind (u.a. die Freitagswerte des DAX, des Nasdaq, Dow Utility, 10jhr US T-Bonds, dt. Umlaufrendite, Euro in $ und Brent Öl in $ der letzten 35 Jahre).

 

Seite ist www.boersensignale.de

 

Gruß,

Kaa

 

PS: Die Meerschweinchenlivecam geht nicht :(

Diesen Beitrag teilen


Link zum Beitrag
pvdb

Hi Kaa,

 

danke für den Hinweis. Das Buch von Uwe Lang habe ich schon längere Zeit in meinem Regal stehen. In meiner Anwendung habe ich derzeit ca. 17 Variablen, mit denen ich meine Versuche durchführe. Da sind, Öl, Währungen, Zinsen, Indizes und so alles mit drinnen. Um die Daten brauche ich mir eine sorgen zu machen. Ich habe von jeder Variablen alle Tagesdaten der letzten Jahre und bekomme jeden Tag automatisch die neuen Daten hinzu. Musste ich mir aber erst selbst alles zusammenflicken. Ich mache ja nicht nur Versuche mit wöchentlichen Daten, sondern auch täglichen und monatlichen. Da würden mir die Uwe Lang Tabellen nicht besonders helfen.

 

Das diese Technik Intraday genutzt wird, musste ich noch nicht. Hast du dazu irgendwelche Quellen oder Informationen wo ich hier nachlesen kann?

 

Hatte ja schon im letzten Posting geschrieben, dass ich auch gerne selbst ausprobieren würde, aber erst nachdem die Arbeit abgegeben ist. Intraday Realtimedaten zu den einzelnen Variablen sind ja einfach zu besorgen und dann lässt man das ganze durchlaufen und kann in der Soft (Entwicklungszeit schätze ich auf 2 Wochen) in einer Dropdownbox wählen ob er alle 5, 15 oder 30s vorrausagen soll. Auf simulations Basis kann man dann die Soft laufen lassen und schauen was am Tagesende so rauskommt. Ja, Nussdorf, wenn ich Gold herstellen kann, kannste eine Lizenz erwerben *fg*.

 

PS: Die Meerschweinchenlivecam geht nicht

 

Im "Winter" ist es tagsüber ja schon Dunkel, deswegen sieht man dann nicht so viel. Ich habe nur die Cam , Domain und Server gesponsert und eingerichtet und Beleuchtung ist nicht meine Aufgabe :) Sind auch gar nicht meine Schweine.

Diesen Beitrag teilen


Link zum Beitrag
pvdb

Die Arbeit ist natürlich nicht in Vergessenheit geraten. Nach einer kleinen Weihnachts- und Neujahrpause, bin ich nun wieder intensiv dabei.

 

Leider erstmal nur wieder Schreibarbeiten, da diese auch geleistet werden müssen :(

 

Die Regressionsanalyse ist soweit abgeschlossen und die Software für die neuronale Netze ist soweit auch fertig. Fehlt nur noch ein kleines Tool was die Lerndaten für das KNN bereitstellt.

 

Ich denke das ich in den nächsten 7-14 Tagen dann die Endvergleich zwischen der Regressionsanalyse, KNN und einem Mix der beiden durchführen werde.

 

Ergebnisse werde ich gerne vorstellen. Langsam will man ja auch mal fertig werden.

 

Phil

Diesen Beitrag teilen


Link zum Beitrag
pvdb

Wenn alles planungsmäßig abläuft, werde ich am Sonntag eine Prognose für den DAX am Montag einstellen. Die Anwendungen sind bereits alle fertig entwickelt und mit dem abschließenden Vergleich mit es ab morgen losgehen.

 

Phil

Diesen Beitrag teilen


Link zum Beitrag
Teletrabbi

Dann bin ich aber gespannt :)

Bei manchen Dingen scheint es ja immer wieder hervorsehbar. Fiktives Beispiel: Montag kommen die und die Daten, der Dax müsste vom heutigen Niveau etwas korrigieren. Also werden die Daten entweder schlechter als erwartet oder die Marktteilnehmer nutzen die guten Daten fürGewinnmitnahmen. Das Ergebnis ist dasselbe, der Dax sinkt wie erwartet.

Diesen Beitrag teilen


Link zum Beitrag
Faceman

....wiedermal ein Argument dafür, dass die Nachricht völlig wurscht ist....

Diesen Beitrag teilen


Link zum Beitrag
pvdb

So, alles lief doch schneller als erwartet :)

 

Ich vergleiche nun ja meine drei Verfahren und werde diesen Versuch vermutlich noch 1-2 weitere male durchführen.

 

Die Prognosen zu Montag lauten:

 

Regressionsanalyse prognostiziert 6909,23 Punkte

KNN (alle Variablen) prognostiziert 6856,15 Punkte

KNN (ausgewählte Variablen) prognostiziert 6819,72 Punkte

 

Ob es eine Methode gibt, die in mehreren Versuchen dem Ergebnis nahe ist, sollte sich die Tage rausstellen. Wenn nicht ist es auch kein Weltuntergang, es ist halt nur ein Experiment. Nach der Uni Arbeit werde ich aber noch verschiedene Realtime Prognosen auf Währungen versuchen :)

 

Ich bin auch kein Gott und kann nicht vorhersehen. Dies ist keine Kaufempfehlung, sondern eine reine Vermutung meiner Arbeit wie der Dax sich entwickeln könnte.

 

Phil

Diesen Beitrag teilen


Link zum Beitrag
Gast240123

Was wird denn konkret prognostiziert?

Eröffnungskurs, Schlusskurs, Höchstkurs, niedrigster Kurs, Mittelkurs?

Die Spannweite ist mit fast 100 Punkten relativ groß, damit hätte ich jetzt nicht gerechnet?

In welchem Vertrauensbereich bewegen wir uns denn?

Diesen Beitrag teilen


Link zum Beitrag
pvdb

Hi,

 

es soll schon der dax schlusskurs vorhergesagt werden. da doch noch einige abstände zwischen den prognosen sind, will ich die woche auf jeden fall noch weitere versuche machen und dann schauen das irgendwie auszuwerten.

 

also vertrauen darf man den daten zumindest nicht, da es ja ein versuch ist und natürlich auch mit allem falsch liegen kann.

 

nur sind es ja auch unterschiedliche prognosen wo es auch logisch ist, das die alle was anderes sagen. ca. 80 punkte differenz ist mir persönlich lieber als 200 oder mehr :)

 

während den versuchen wurde mir teils nen dax von 300 punkten vorausgesagt und da hatte ich richtig muffensausen, aber nachdem ich die daten normalisiert hatte, sahen die ergebnisse auch entsprechend besser aus.

Diesen Beitrag teilen


Link zum Beitrag
pvdb

Der Mittelwert der drei Prognosen wäre passend gewesen. Bis Freitag werde ich die Versuche noch durchführen dann mal schauen. Für diejenigen, die es interessiert werde ich hier anschließend nen kurze Zusammenfassung bekanntgeben.

 

Phil

Diesen Beitrag teilen


Link zum Beitrag
pvdb

So,

 

ich habe meine Versuche die ganze Woche über durchgeführt und möchte gerne in einer kleinen Tabelle die Ergebnisse vorstellen:

 

post-1910-1171188202_thumb.gif

 

Die Regressionsanalyse hat mit 4 besten Treffern und der geringsten durchschnittlichen Abweichung deutlich gegenüber den künstlich neuronalen Netzen in meiner Untersuchung gewonnen.

 

Dies soll natürlich nicht heißen das die KNN schlecht sind. Sicherlich hätte man an einigen stellen noch mehr Zeit investieren können, um noch bessere Ergebnisse zu bekommen. Allerdings ist die Zeit im Bachelor Report auch etwas beschränkt, so dass ich nicht alles untersuchen konnte. Mehr dazu steht z.B. in meinem Ausblick.

 

Zum Glück ist die Arbeit inzwischen zu ca. 98% fertig. Korrekturlesen kommt noch hinzu. Zukünftig werde ich auf jedenfall noch private Experimente mit der Regressionsanalyse durchführen. Hierbei werde ich vermutlich nur Devisen nehmen. Dies würde natürlich einen extra Thread beanspruchen.

Diesen Beitrag teilen


Link zum Beitrag

Erstelle ein Benutzerkonto oder melde dich an, um zu kommentieren

Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können

Benutzerkonto erstellen

Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!

Neues Benutzerkonto erstellen

Anmelden

Du hast bereits ein Benutzerkonto? Melde dich hier an.

Jetzt anmelden
Melde dich an, um diesem Inhalt zu folgen  

×
×
  • Neu erstellen...