Unterhaltung: Bester Spieler

Stoni, 20. Dezember 2010, um 11:03

Wie definiert sich denn in der Fuchsschau der "Beste SPIELER"?

Cliff, 20. Dezember 2010, um 11:22

Das wird die Kategorie für unsere neue Spielerbewertung nach TrueSkill:

http://www.moserware.com/2010/03/computing-your-skill.html

Stoni, 20. Dezember 2010, um 11:47

Danke, weiss jemand zusammenfassend, was da reinspielt?

ralph5, 28. Dezember 2010, um 10:07

war auf der internet-seite....schön, wenn man perfekt englisch kann....ich nicht

Ex-Füchse #3620, 28. Dezember 2010, um 10:17

grins lasst es Euch doch mal von Google ins deutsche übersetzen.

Suse, 29. Dezember 2010, um 09:23

Genau... da konnte ich es auch gut nachlesen und da steht auf "gut deutsch" auch, dass es besonders bei Schach angewendet wird...

Cliff, 29. Dezember 2010, um 09:54

schaut doch hier mal nach:

http://www.fuchstreff.de/forum/diskussionen/301-sterne/

Da haben foxxy und Agnes versucht es zu erklären.

solembum, 29. Dezember 2010, um 10:39

Mich würde es dann doch mal etwas genauer interessieren wie ihr das berechnet.
Ihr habt doch sicher einen Berechnungsformel wie sich ein Spiel auf den Skill auswirkt. Das ist doch sehr konkret, während die einzelnen Artikel über trueskill doch sehr allgemein gehalten sind.
Beim Schach kann man zum Beispiel genau nachlesen wie sich die Elozahl berechnet.

Wenn ich es richtig verstanden habe, so kennt Trueskill nur Sieg, Niederlage und Unentschieden. Diese grobe Einteilung scheint mir für Doppelkopf nicht wirklich geeignet, da die Punkteausbeute pro Spiel doch beim Doppelkopf ein wesentlicher Faktor für die Spielstärke ist.

Wie interpretiert sich der Skill? Also gibt es eine Aussagekraft in Richtung Durchschnittlich erwartete Punktezahl pro Spiel oder ähnliches?

Eine Antwort würde mich sehr freuen!

Gruß Jürgen

Stoni, 29. Dezember 2010, um 11:39

Das ist natürlich ein sehr relevanter Aspekt. Nur Sieg/Niederlage zu werten, kann nicht zu einem richtigen Ergebnis führen. Entscheidend für die Spielklasse ist die Punkte zu optimieren durch An- und Absagen u.v.m., nicht die Anzahl der Siege.

Das wäre ungefähr so, wie wenn der Deutsche Fussballmeister über das Eckenverhältnis bestimmt würde. Bei 5000 Spieler und mehr korrelieren auch Sieg/Niederlage ziemlich hoch mit den erreichten Punkten, so daß die Berechnung zwar nicht völlig falsch aber sehr unzureichend wäre. An der Einbeziehung Punkte bzw Dollar / Spiel relativiert durch Mitspielerstärken unter Einbeziehung der Spielzahl führt meines Erachtens kein Weg vorbei.

Die zusätzliche Abbildung von Blattstärken sagt zudem noch mehr aus.

mk, 29. Dezember 2010, um 12:05

Die Berechnung bezieht auch den Spielwert sowie An- und Absagen mit ein. Die Einbeziehung der Blattstärke macht in meinen Augen keinen Sinn, da die Blätter sich ja mit steigender Spielzahl aneinander annähern.

In die Berechnung gehen diverse Parameter ein, wie z.B. der Glücksfaktor des Spiels (was im Doko durch das Blatt gegeben ist, im Schach aber nicht vorhanden ist). Die Aktivität des Spielers wird gesteigert, wenn er An- oder Absagen tätigt.

Wenn Ihr einen konkreten Verdacht habt, wo wir evtl. noch etwas in den Parametern optimieren können, gebt uns bitte Bescheid. Dabei helfen uns allerdings weniger Aussagen wie “wie kann es sein, dass xy drei Sterne hat, aber im 3. Stich im Spiel 23445874 Karte Z gespielt hat”, sondern eher Hinweise aufgrund der Spielstatistik. Also z.B. ein Spieler mit 4-5 Sternen, der eurer Meinung nach deutlich zu wenig An- Absagen tätigt, oder zu wenige (oder zu viele) Alleinspiele spielt.

Wir hatten nicht erwartet, dass die Spielstärke von Anfang an perfekt berechnet werden würde und bessern noch nach, sobald uns etwas auffällt.

solembum, 29. Dezember 2010, um 14:39

Hallo mk,

warum die Berechnung den Spielwert und die An/Absagen mit einbezieht ist mir unklar.
Was ist der Glücksfaktor des Spiels? (Varianz eines Einzelspiels?)

Wollt ihr die Formel als Firmengeheimnis nicht preisgeben? Ansonsten würde ich mir das wirklich gerne mal konkret anschauen, dann könnte ich auch sicher mehr dazu sagen.

So intuitiv scheint mir die Sternewertung zwischen 0 und 3 Sternen nicht aussagekräftig.

Gruß Jürgen

solembum, 01. Januar 2011, um 10:39

Hallo mk,

du schreibst in einem anderen Thread, dass du nach möglichst wenig Spielen zu einer Aussagekräftigen Bewertung kommen willst.
Das ist aber beim Doppelkopf nicht möglich, wenn man keine Blattbewertung mit einbezieht.
Erst nach ca 500 Spielen überwiegt das Spielvermögen die Glückskomponente. Ich denke dieser Umstand ist bei der Anfangsbewertung nicht richtig berücksichtigt, sodass die Sterne unterhalb von 4 nur wenig aussagekraft haben.

Die Bewertung der Blattstärke, mit der man schnellere gute Bewertungen bekommen könnte ist ein kompliziertes Thema und läuft letztenendes auf eine sehr gute Programmierung von Computerspielern hinaus. Ich würde diesen Weg nicht gehen.

Wir (vor allem Fanthomas aber zum Teil auch ich) haben das Thema schon ziemlich gut erforscht. Wir kennen die Doppelkopf charakterisierenden Parameter.

Gruß Jürgen

Fanthomas, 04. Januar 2011, um 09:49

Die Standardabweichung der Spielergebnisse beträgt beim Doppelkopf ca. 5 Punkte. Die Standardabweichung der Spielstärken beträgt aber nur ca. 0,2 bis 0,25 Punkte pro Spiel. Daher ist es nicht möglich, aus den Ergebnissen von nur wenigen Spielen genauere Rückschlüsse auf die Spielstärke eines Spielers zu ziehen.

TrueSkill ist für Spiele konzipiert worden, in denen das Können des Spielers der entscheidende Faktor für den Ausgang jedes einzelnen Spiels darstellt. Beim Doppelkopf ist es dagegen genau umgekehrt. Hier dominiert der Glücksfaktor für einzelne Spiele und die Spielstärke erlangt deshalb erst bei sehr vielen Spielen einen merklichen Einfluss auf das Ergebnis.

Für die Bewertung von Doppelkopf und ähnlichen vom Glück dominierten Spielen ist TrueSkill absolut ungeeignet und auch nicht geschaffen worden.

Grüße,
Fanthomas

Ex-Füchse #5463, 04. Januar 2011, um 10:03

Fantomas hat es wie fast immer auf den Punkt gebracht

mk, 04. Januar 2011, um 11:54

Hallo Fantomas,

Was Du hier schreibst, stimmt schlicht und einfach nicht. TrueSkill kennt sehr wohl einen Glücksfaktor des Spiels. Wenn Du Dich damit beschäftigt hättest, wüsstest Du, dass man in TrueSkill über den Parameter Beta angibt, inwiefern das Ergebnis vom Glück bzw. Können des Spielers abhängt.

Also bitte halte Dich doch in Zukunft etwas mehr zurück mit solchen Falschaussagen, und tu nicht immer so, als hättest allein Du die Weisheit mit Löffeln gefressen. Vielen Dank.

In unsere Spielstärkeberechung fliessen viele Parameter ein, und das ganze ist eben nicht linear, was das finden der optimalen Parameter nicht ganz trivial macht. Wir haben aber von Anfang an gesagt, dass wir noch weiter daran arbeiten werden.

Hallo Curley,

eben nicht.

Grüße,

Martin

OpaAdonisES, 04. Januar 2011, um 17:51

Dann bringt mal etwas mehr Transparenz in dieses True Skill und schwafelt nicht immer um den heißen Brei rum....ist ja schrecklich hier....

Seltsam, 04. Januar 2011, um 18:21
zuletzt bearbeitet am 04. Januar 2011, um 18:22

Sehe ich auch so. Da ist eine Liste, die den besten Spieler ausruft und kein User kann bisher nachvollziehen, wie das Ergebnis berechnet wurde. Das ist nicht die Tranzparenz, die als ernstzunehmende Basis für einen künftigen Wettbewerb funktionieren kann; die solche Listen glaubwürdig macht.

Fanthomas, 11. Januar 2011, um 11:50

Inzwischen ist zwar schon eine Woche vergangen, aber nun möchte ich doch noch einmal dazu etwas schreiben. Meine Antwort hat so lange auf sich warten lassen, weil ich einerseits zunächst unentschlossen war, überhaupt zu reagieren und andrerseits die Ausarbeitung eines längeren Beitrags auch gewisse Zeit in Anspruch nimmt.

------------------------------
Zitat mk:

„Hallo Fantomas,
Was Du hier schreibst, stimmt schlicht und einfach nicht. TrueSkill kennt sehr wohl einen Glücksfaktor des Spiels. Wenn Du Dich damit beschäftigt hättest, wüsstest Du, dass man in TrueSkill über den Parameter Beta angibt, inwiefern das Ergebnis vom Glück bzw. Können des Spielers abhängt.
Also bitte halte Dich doch in Zukunft etwas mehr zurück mit solchen Falschaussagen, und tu nicht immer so, als hättest allein Du die Weisheit mit Löffeln gefressen. Vielen Dank.
In unsere Spielstärkeberechung fliessen viele Parameter ein, und das ganze ist eben nicht linear, was das finden der optimalen Parameter nicht ganz trivial macht. Wir haben aber von Anfang an gesagt, dass wir noch weiter daran arbeiten werden.“

Quelle:
http://www.fuchstreff.de/forum/diskussionen/2...
------------------------------

Einige Spieler – in diesem Thread vor allem Stoni und Solembum – hatten berechtigte Fragen und auch Zweifel geäußert, ob TrueSkill wirklich geeignet ist, die Spielstärken von Doppelkopfspielern realistisch zu ermitteln. Bisher hatte ich von mk nur sehr allgemein formulierte Erklärungen zur Umsetzung von TrueSkill auf dieser Plattform vernommen. Da nun mk auf meinen vorhergehenden Beitrag hin mit einem persönlichen Angriff reagiert hat, anstatt mal die von Solembum aufgeworfenen Fragen ausführlicher und konkreter zu beantworten, möchte ich mich nun mit einigen Aussagen von mk auseinandersetzen. Da ich ja „die Weisheit mit Löffeln gefressen“ habe, fällt mir das auch gar nicht schwer. Das weitere Lesen meines Beitrags erfolgt auf eigene Gefahr, wegen der „Falschaussagen“.

------------------------------
Zitat mk:

„Wenn Du Dich damit beschäftigt hättest, wüsstest Du, dass man in TrueSkill über den Parameter Beta angibt, inwiefern das Ergebnis vom Glück bzw. Können des Spielers abhängt.“

Quelle:
http://www.fuchstreff.de/forum/diskussionen/2...
------------------------------

So eine Aussage ruft bei mir höchstens ein müdes Lächeln hervor. Trotz aller Professionalität, mit der diese Plattform hier aufgebaut wird, fehlt mir bisher eine wirklich gründliche Beschäftigung der Betreiber mit dem Spiel Doppelkopf. Dies wäre aber nötig, um den eigenen hohen Ansprüchen an die Plattform gerecht zu werden. Es reicht eben nicht aus, einfach nur hervorragend programmieren zu können. Zusätzlich ist ein detailliertes Studium der zu programmierenden Sache nötig oder die Zusammenarbeit mit Leuten, die diese Kenntnisse besitzen oder besser noch beides. Denn wenn Mk sich etwas intensiver speziell mit Doppelkopf als Spiel beschäftigt hätte, dann wären ihm vielleicht schon aufgrund der Definition des Beta Zweifel gekommen, ob die TrueSkill-Methode für Doppelkopf überhaupt geeignet ist.

Der Parameter Beta legt die Differenz in Skill-Punkten fest, welche einem Spielstärkenunterschied zwischen zwei Spielern entspricht, bei dem der stärkere gegen den schwächeren Spieler eine Gewinnwahrscheinlichkeit von 80% besitzt. Das ist so ähnlich wie auch beim ELO-System im Schach, wo eine Differenz von 200 ELO-Punkten für den stärkeren Spieler mit einer Gewinnwahrscheinlichkeit von 75% verbunden ist. Nun existieren aber beim Schach vom Weltmeister bis zum Anfänger sehr viele Abstufungen in solchen Intervallen zu je 200 ELO-Punkten. Anfänger haben ELO-Zahlen unter 1000 und die Weltspitze liegt um die 2800, woraus eine Spannweite von insgesamt mindestens 9 Intervallen zu je 200 ELO-Punkten für das gesamte Spektrum der Spielstärken resultiert. Beim Doppelkopf dagegen kann selbst der beste Spieler gegen einen Anfänger niemals eine Gewinnwahrscheinlichkeit von 80% erreichen. Das ist so offensichtlich unmöglich, dass das jeder Vereinsspieler bestätigen kann, auch ohne sich mit statistischen Auswertungen beschäftigt zu haben.

Nehmen wir mal an, es gäbe wirklich einen derartig großen Spielstärkeunterschied beim Doppelkopf. Welche Ergebnisse würde dann der stärkere gegen den schwächeren Spieler langfristig erzielen? Wie ich schon früher erwähnt habe, beträgt die Standardabweichung der Spielergebnisse beim Doppelkopf ca. 5 Punkte und das relativ unabhängig von der Spielstärke. Der durchschnittliche absolute Betrag der Spielergebnisse beträgt 4,3 Punkte. Das ist nicht einfach so daher geplappert oder eine Erfindung von mir, sondern ein Fakt, der auf der statistischen Auswertung von 1,8 Millionen Ligaspielen basiert, die auf der Plattform Online-Doppelkopf.com absolviert wurden. Wenn mk das nicht glauben will, dann kann er das ja gerne in eigenen Auswertungen überprüfen, denn inzwischen stehen hier ja auch schon rund 1 Million Spiele zur Verfügung.

Ein fiktives Beispiel: Die zwei stärksten (Gewinnwahrscheinlichkeit 80%) und die zwei schwächsten (Gewinnwahrscheinlichkeit 20%) Spieler sitzen an einem Tisch und spielen eine unendliche Anzahl von Spielen. In Normalspielen und Hochzeiten gibt es dann drei Konstellationen: Stark1/Stark2 gegen Schwach1/Schwach2, Stark1/Schwach1 gegen Stark2/Schwach2 und Stark1/Schwach2 gegen Stark2/Schwach1, die jeweils mit einer Wahrscheinlichkeit von 1/3 auftreten. Die Soli lass ich der Einfachheit halber jetzt mal außen vor. Interessant ist nur die erste Konstellation. Der Erwartungswert wird für die starke Partei in dieser Konstellation bei 0,8*4,3 – 0,2*4,3 = 2,58 Punkten pro Spiel liegen. In den anderen beiden Konstellationen liegt der Erwartungswert bei 0, da beide Parteien mit je einem starken und schwachen Spieler gleichstark sind. Somit beträgt der Erwartungswert insgesamt für die starken Spieler 2,58/3 = +0,86 und für die schwachen Spieler demgemäß –0,86 Punkte pro Spiel. Diese Werte liegen allerdings schon jenseits aller Ergebnisse, die real langfristig noch auftreten können. So gab es bei den Schnitten über mindestens 10000 Spiele auf Online-Doppelkopf.com nur maximale Werte um die +0,5 und auch beim Fuchstreff kommt der aktuelle Rekord +0,65 von HDF (Stand 11.01.2011 um 11.30 Uhr; 17983 Spiele; 5840,50 $ Gewinn * 2 = 11681 Punkte) nicht an die erwähnten 0,86 heran und das trotz fehlender Ligatrennung.

Im Bereich jenseits der 10000 Spiele ist der Punkteschnitt für die Spielstärke schon eine sehr genaue Näherung, vorausgesetzt, der Spieler sucht sich nicht bewusst immer nur Tische mit besonders starken oder schwachen Spielern aus. Konkret folgt daraus nun, dass in einigermaßen gut durchmischten Wettbewerben oder Ligen die besten Spieler langfristig einen Schnitt von +0,6 und die schlechtesten von –0,6 erreichen werden. Definiert man nun die Spielstärke als den Punkteschnitt, den ein Spieler gegenüber durchschnittlichen Spielern in einer gegen unendlich strebenden Anzahl von Spielen erwirtschaften kann, so haben die derartig gemessenen Spielstärken einen Wert zwischen +0,6 und –0,6. Wird weiterhin vorausgesetzt, dass die Spielstärken annähernd der Normalverteilung unterliegen und im Prinzip vollständig zwischen +/– 3 Standardabweichungen angesiedelt sind (wovon auch bei TrueSkill ausgegangen wird), ergibt sich daraus die von mir im oberen Beitrag schon erwähnte Standardabweichung von 0,2.

Bezüglich des Beta bedeutet das alles nun, dass die dort für die Definition herangezogene Spielstärkendifferenz im Doppelkopf real nicht existiert. Das Beta müsste demnach wesentlich größer als die Differenz der Skill-Punkte zwischen dem schwächsten und stärksten Spieler sein. Inwiefern so etwas Sinn macht, sei dahingestellt. Ich bin da sehr skeptisch. Ich frage mich auch, wieso im Fuchstreff der stärkste Spieler Spartakus einen Skill-Erwartungswert von nur 34,57 hat (Stand 11.01.2011 um 11.30 Uhr), was gerade mal um 9,57 über dem Durchschnitt 25 liegt. Da TrueSkill aber davon ausgeht, dass die Spielstärken mit einer Standardabweichung von 8,333 um den Mittelwert 25 streuen, ist es schon verwunderlich, wenn der beste Spieler nur um 1,148 Standardabweichungen über dem Durchschnitt liegt. Das erscheint mir bei mittlerweile rund 9000 Spielern unlogisch. Weiterhin ist mir aufgefallen, dass die Standardabweichung der Spielstärke eines konkreten Spielers niemals kleiner als 1,09 wird. Ich vermute da einen Zusammenhang mit der Wahl des Parameters Tau, der ein weiteres Absinken dieses Wertes, wie es normalerweise zu erwarten wäre, verhindert. Auch die weiter unten zitierten Aussagen von mk scheinen wohl etwas damit zu tun zu haben, wenn ich es richtig interpretiert habe.

------------------------------
Zitat mk:

„In unsere Spielstärkeberechung fliessen viele Parameter ein, und das ganze ist eben nicht linear, was das finden der optimalen Parameter nicht ganz trivial macht. Wir haben aber von Anfang an gesagt, dass wir noch weiter daran arbeiten werden.“

Quelle:
http://www.fuchstreff.de/forum/diskussionen/2...
------------------------------

Und in anderem Thread:

------------------------------
Zitat mk:

„Die Berechnung bezieht auch den Spielwert sowie An- und Absagen mit ein. Die Einbeziehung der Blattstärke macht in meinen Augen keinen Sinn, da die Blätter sich ja mit steigender Spielzahl aneinander annähern.
In die Berechnung gehen diverse Parameter ein, wie z.B. der Glücksfaktor des Spiels (was im Doko durch das Blatt gegeben ist, im Schach aber nicht vorhanden ist). Die Aktivität des Spielers wird gesteigert, wenn er An- oder Absagen tätigt.“

Quelle:
http://www.fuchstreff.de/forum/diskussionen/2...
----------

An- und Absagen eines Spielers in irgendeiner Weise noch extra zu bewerten, halte ich für groben Unfug. Es sei denn, hier soll ein eigenes Doppelkopf erfunden werden, anstatt sich so nah wie unter Internetbedingungen möglich an den offiziellen Regeln des DDV-Spiels zu orientieren. Inwiefern ein Spieler erfolgreich an- und absagt, ist schon vollständig durch seine entsprechenden Ergebnisse in Spielpunkten berücksichtigt. Außerdem muss jeder Spielpunkt gleichwertig sein. Es kann doch nicht plötzlich sein, dass ein durch eine Absage gewonnener Punkt durch Zusatzwertungen einen anderen Wert erhält als ein durch einen gefangen Fuchs oder durch das Erreichen einer höheren Gewinnstufe erhaltener Punkt. Ein Punkt ist ein Punkt und alles andere verstößt gegen die Regeln. Daher dürfen für die korrekte Ermittlung von Spielstärken nur die Spielpunkte herangezogen werden und nicht die Art und Weise, wie diese erlangt werden! Gleiches gilt natürlich auch dafür, ob ein Spieler mehr oder weniger Soli spielt. Alle derartigen erfundenen Zusatzwertungen machen die Dinge nur unnötig kompliziert und stellen vor allem eine Diskriminierung bestimmter Spielstile dar. Durch solche zusätzlichen Korrekturen kann es passieren, dass ein Spieler bestraft wird, weil er konservativ an- und absagt oder weniger Soli riskiert, obwohl er damit gleich gute Punktergebnisse wie risikofreudigere Spieler einfährt. Wenn ein Spieler aus schlechten Spielvermögen heraus zu viele oder zu wenige Ansagen, Absagen oder Soli riskiert, dann schlägt sich das sowieso schon in seinen Punkten nieder und es braucht dafür keine weiteren regelwidrigen Eingriffe.

------------------------------
Zitat mk:

„Wenn Ihr einen konkreten Verdacht habt, wo wir evtl. noch etwas in den Parametern optimieren können, gebt uns bitte Bescheid. Dabei helfen uns allerdings weniger Aussagen wie "wie kann es sein, dass xy drei Sterne hat, aber im 3. Stich im Spiel 23445874 Karte Z gespielt hat", sondern eher Hinweise aufgrund der Spielstatistik. Also z.B. ein Spieler mit 4-5 Sternen, der eurer Meinung nach deutlich zu wenig An- Absagen tätigt, oder zu wenige (oder zu viele) Alleinspiele spielt.
Wir hatten nicht erwartet, dass die Spielstärke von Anfang an perfekt berechnet werden würde und bessern noch nach, sobald uns etwas auffällt.“

Quelle:
http://www.fuchstreff.de/forum/diskussionen/2...
------------------------------

Hinweise von den Usern aufgrund der Spielstatistiken zu erbitten, ist sicherlich sinnvoll. Bloß müssten dann nicht auch die entsprechenden Tabellen verfügbar sein, um solche Recherchen überhaupt einigermaßen erfolgreich anstellen zu können? Die Fuchsschau in ihrer jetzigen Form stellt nur einen sehr groben, wenn auch gelungenen Überblick dar. Detailliertere und vor allem vollständige Tabellen müssten von der Fuchsschau aus verlinkt werden. So wäre beispielsweise für die Rubrik „Bester Spieler“ meines Erachtens eine Tabelle nötig, in der alle Ergebnisse aller Spieler offen dargelegt werden und neben den TrueSkill-Werten auch die Anzahl der Spiele, die wahre Anzahl der gewonnen Spielpunkte (ohne Resets!!!) und der wahre Spielpunkteschnitt (ohne Resets!!!) aufgelistet werden. Hilfreich wäre außerdem der durchschnittliche Skill-Erwartungswert (der erste Wert in der Klammer) der jeweiligen Partner beziehungsweise Gegner eines Spielers, gemittelt über alle absolvierten Spiele. Nur so könnte man als interessierter User effektiv eventuelle Auffälligkeiten herausfinden.

Grüße,
Fanthomas

P. S. Wieder bin ich bei meinen Recherchen auf offensichtlich fehlerhafte Kontostände, die nicht durch 50 Cent teilbar sind, gestoßen. Diesmal handelt es sich um Moony mit 726,60 $ und Sashimi mit 726,70 $ (Stand 11.01.2010 um 11:30 Uhr).

foxxy, 11. Januar 2011, um 13:49
zuletzt bearbeitet am 11. Januar 2011, um 14:05

Das klingt alles zunächst mal plausibel und ich bin gespannt, wie die Diskussion (ohne mich) weiter und ausgeht.

Aber einige Denkanstöße möchte ich hier dennoch loswerden:

1. In dem fiktiven Beispiel geht Fanthomas davon aus, dass 2 mal 2 identisch starke Partner am Tisch sitzen. Ich glaube aber, dass meistens Spieler mit 4 leicht unterschiedlichen Spielstärke zusammenspielen. Dann ergibt sich nämlich für die Stark1/Schwach1 Paarung ein leicht positiver Erwartungswert und für die Stark1/Schwach2 Paarung ein leicht negativer Wert. Insgesamt ergibt das in dem Fall eine eindeutige Rangfolge von 1 bis 4 (erstmal unabhängig von der Gewinnhöhe) und eben nicht zwei erste und zwei dritte Plätze. Dass die zwei Paarungen sich gegenseitig aufheben, halte ich für einen Sonderfall, aber wenn Fanthomas sagt, bei ihm ist das so, dann ist das eben so.

2. Der Rekord liegt doch bei 0,86 von M08ark und nicht bei 0,65 von HDF, oder habe ich da was falsch verstanden? Warum diese immerhin bald 2000 Spiele zu wenig sind, um beachtet zu werden, ist mir nicht klar. Zumindest die Top 10 von Bester Spieler und Ergebnis unterscheiden sich ja zum Teil deutlich. Es gibt also zumindest von der Absicht her eine deutlich unterschiedliche Einschätzung von Spielerqualität und Spielergebnis. Was davon eher richtig und falsch ist, kann ich aber nicht sagen, da die alle von meiner Position her "unvostellbar gut" spielen.

3. Über den beta Parameter (der mir nur als Varianz einer Spielstärke begegnet ist) als Glücksfaktor habe ich auch gestutzt, aber schon deshalb, weil ich zuerst nicht damit klar kam, dass Glück um die Spielstärke herum variieren soll. Auch in den anderen Punkten kam ich zunächst zu den gleichen Fragen und bin gespannt auf die Neuberechnung und Antworten.

4. Muss ich jetzt Stonis Top20 Liste doch wieder in die Tonne kloppen, weil mir die die Gewinnwahrscheinlichkeit doch nicht so sehr erhöht? Im Schnitt mach ich ja so oder so etwa 4,3 Punkte pro Spiel. ggg

Viel Spass noch
foxxy

Spartakus, 12. Januar 2011, um 07:53

Interessante Betrachtungen. Wirklich nicht mein Spezialgebiet. mk studiert hoffentlich schon :-)

Die Ausarbeitungen von Fanthomas bei solchen Thematiken haben stets Hand und Fuß, auch wenn er in diesem Forum aus welchen Gründen auch immer bei Betreibern und vielen Usern nicht so gut ankommt.

Eine Sache, Thomas, fällt mir auf, weshalb ich vorsichtig nachfrage.

Du errechnest einen dauerhaften Durchschnittswert von 4,3 Punkten pro Spiel. Das als solches nehme ich aufgrund der Vielzahl der dieser Erhebung zugrunde liegenden Spiele als gegeben hin.

Mal unabhängig davon, ob Stark1/Schwach1 und Stark1/Schwach2 zu gleicher Gewinnerwartung führt oder wie von foxxy zurecht angemerkt wohl zumindest leicht abweichend: Ich denke nicht, dass bei der Konstellation Stark1/Stark2 für irgendwelche Parameter der Wert von 4,3 angesetzt werden kann. Das ergibt sich allein daraus, dass starke Spieler über ein genaueres und auch höheres Ansageverhalten verfügen, die durchschnittlichen Spielwerte dadurch höher liegen werden als in den anderen Konstellationen.

Gruß
Spartakus

zur Übersichtzum Anfang der Seite