Doppelkopf-Liga: Monatswertung und Vielspielfaktor

Fanthomas, 26. August 2011, um 18:46
zuletzt bearbeitet am 26. August 2011, um 18:52


Hallo Leute,

in der letzten Woche habe ich mich noch einmal ausführlich mit der Monatswertung, insbesondere dem Vielspielfaktor auseinandergesetzt.
Die Liga ist noch sehr jung und klein. Deshalb gibt es zu wenig Datenmaterial, um statistisch signifikante Abweichungen nachzuweisen. Aber beim Betrachten der Tabellen habe ich zuletzt eine leichte Tendenz zu einem höheren Anteil von Vielspielern in den extrem hohen und auch niedrigen Bereichen der Wertung gegenüber dem mittleren Bereich gesehen. Dies natürlich nur unter Berücksichtigung der Spieler ab 200 Spielen. Spieler ohne alle Pflichtspiele müssen herausgerechnet werden, da deren Wertung nicht dem Vielspielfaktor und somit einer anderen Berechnungsmethode (Pflichtabzug, Vielspielfaktor ist immer 1, Punkte werden immer durch 200 dividiert) unterliegen und deren Einbeziehung daher die statistischen Untersuchungen verfälschen würden. Dieses leichte Ungleichgewicht zwischen Viel-, Normal- und Wenigspielern war für mich Anlass genug, mehr über die Ursachen herausfinden zu wollen. Ein Problem dabei waren aber zu wenige Daten. Und dieses Problem hätte sicherlich auch noch nach einigen Monaten bestanden. Ich wollte aber jetzt eine Erklärung und daher hatte ich beschlossen, eine hinreichend große Ligatabelle anhand der schon länger bekannten statistischen Kenngrößen zu simulieren, um mit dieser Tabelle dann die entsprechenden Tests durchführen zu können. Mehr zu dieser Simulation gibt es weiter unten im letzten Abschnitt 6.

Aufgrund meiner Überlegungen habe ich dem Fuchstreff-Team heute eine neue Formel zur Berechnung des VSF vorgeschlagen. Martin (mk) hat mir zugestimmt und erklärt, dass er diese Formel ab 1.09.2011 in der Liga anwenden wird. Die Wertungen der vergangenen Monate einschließlich August bleiben davon natürlich unberührt. Für diese Monate gilt weiterhin die alte Methode. Rückwirkende Änderungen gibt es nicht.

Die neue Formel lautet:
VSF_neu = Sqrt(4 * Spielanzahl / (Spielanzahl + 600))

Somit gilt:
VSF_neu = Sqrt(VSF_alt)

Für alle, die es nicht wissen: „Sqrt“ bedeutet Quadratwurzel.

Die Details meiner Untersuchungen einschließlich der Grundlagen der alten und neuen Wertung habe ich in den folgenden fünf Beiträgen sehr ausführlich dargelegt. Wer sich also für die Hintergründe interessiert, kann dort viele Informationen finden.
Mathe-Muffel und Statistik-Allergiker lesen diese Beiträge bitte aber nur auf eigene Gefahr. :-))
Denn ich übernehme keine Haftung für eventuelle gesundheitliche Beeinträchtigungen. :-))

Viele Grüße,
Fanthomas

Fanthomas, 26. August 2011, um 18:46
zuletzt bearbeitet am 26. August 2011, um 18:48


1. BESONDERE PROBLEME DER MONATSWERTUNG GEGENÜBER DER WERTUNG DER DDV-RANGLISTE

Eine Monatswertung für eine Liga mit Vielspielern und Wenigspielern zu entwickeln ist nicht einfach. Im DDV gibt es ja die Rangliste, wo auch Ergebnisse von Spielern unterschiedlicher Spielanzahl verglichen werden müssen. Ohne jetzt im Detail auf die DDV-Ranglisten-Wertung eingehen zu wollen, sind die Anforderungen an eine Liga-Monatswertung viel höher:
1. Der Glücksfaktor bei 200 Spielen (Monatswertung) ist noch sehr hoch, während bei 864 Spielen (36 Listen DDV-Rangliste) schon die Spielstärke der maßgebliche Einfluss ist.
2. Die Unterschiede in der Spielanzahl sind online extrem hoch, da Vielspielen ohne großen Aufwand möglich ist, während eine Fahrt zum DDV-Ranglistenturnier erheblichen zeitlichen und auch finanziellen Aufwand im Vergleich zum Online-Spielen mit sich bringt.
3. Eine möglichst leistungsgerechte Bewertung ist wegen Aufstieg und Abstieg (und auch der Ligapunkte) für den gesamten Wertungsbereich der Monatswertung wichtig, während bei der DDV-Rangliste dies nur für den oberen Teil der Tabelle von Bedeutung ist.



2. DIE DREI GOLDENEN REGELN FÜR EINE OPTIMALE MONATSWERTUNG

Meines Erachtens sollte eine sehr gute Monatswertung folgende drei goldene Regeln befolgen:

Regel 1: Jeder Monat fängt bei Null an. In die Berechnung der Wertung fließen demnach keinerlei Ergebnisse vergangener Monate in irgendeiner Weise mit ein.

Regel 2: Positive und negative Ergebnisse werden gleichermaßen behandelt. Ein positives Ergebnis basiert genauso wahrscheinlich auf Kartenglück oder Können wie ein negatives Ergebnis auf Kartenpech oder Nicht-Können.

Regel 3: Wenigspieler mit kaum mehr als 200 Pflichtspielen, moderate Vielspieler und exzessive Vielspieler (mit 1000 und mehr Spielen) müssen die gleichen Chancen und Risiken haben.

Inwiefern werden diese Regeln nun bei bisherigen Monatswertungen eingehalten?

Online-Doppelkopf.com:
Regel 1: Wird eingehalten.
Regel 2: Verstoß, da negative Schnitte einseitig keinem Vielspielfaktor unterliegen.
Regel 3: Ist nur für positive Schnitte relativ gut gelöst. Verstoß bei negativen Schnitten, wo ohne Faktor Vielspieler unverhältnismäßig stark bevorzugt werden.

Fuchstreff-Liga:
Regel 1: Wird eingehalten.
Regel 2: Wird eingehalten.
Regel 3: Verdacht auf unverhältnismäßige Bevorzugung guter Vielspieler und Benachteiligung schlechter Vielspieler durch zu stark ansteigenden Vielspielfaktor. Somit nur teilweise berücksichtigt.

Fanthomas, 26. August 2011, um 18:46
zuletzt bearbeitet am 26. August 2011, um 18:48


3. PRINZIPIEN DER AKTUELLEN FUCHSTREFF-WERTUNG

Die aktuelle Berechnung des Vielspielfaktors basiert auf der Ermittlung des Erwartungswertes der Spielstärke. Mit Spielstärke kann natürlich immer nur die relative Spielstärke innerhalb einer Umgebung gemeint sein. So kann ein recht ordentlicher DDV-Spieler in der Fuchstreff-Liga eine Spielstärke von +0,4 haben, während er in der OD-Königsliga wegen des höheren allgemeinen Spielniveaus dort nur –0,1 hat. Weiterhin hängt auch die Standardweichung von der Umgebung ab. So könnte diese innerhalb der OD-Königsliga zum Beispiel nur 0,1 betragen, während im Fuchsbau aufgrund der extremen Kontraste zwischen Spitzenspielern und Anfängern 0,3 denkbar wäre.

Für eine Serie von Spielen gilt nun:

Erwartungswert Spielstärke = Leistungsquotient * Schnitt
Leistungsquotient = Spielanzahl / (Spielanzahl + K)

Die Konstante K hängt von der Streuung der Spielstärken ab. Ein guter Näherungswert ist K = 600, welcher auch beim Fuchstreff gilt und einer Standardabweichung der Spielstärken von 0,2014 entspricht. Zwischen Standardabweichung und K gilt folgende Beziehung:
K = V_spkt / V_st – (4 + SQ)
V_spkt = Varianz der Spielpunkte (Varianz ist das Quadrat der Standardabweichung) = 4,95 * 4,95 = 24,5025
V_st = Varianz der relativen Spielstärken = 0,2014 * 0,2014 = 0,0406
SQ = Soloquote (Anteil der Solospiele an allen Spielen) = 0,0880
Diese Werte wurden aus der statistischen Analyse von 1841712 OD-Ligaspielen von Olmafras Datenbank gewonnen.

Nun war es wünschenswert, 200 Spiele als die Basis zu nehmen, wo Schnitt und Wertung übereinstimmen. Da der Leistungsquotient für 200 Spiele genau 1/4 beträgt, braucht man nur alle Werte mit 4 zu multiplizieren. Der Vielspielfaktor ist sozusagen der auf 200 Spiele bezogene Leistungsquotient:
Vielspielfaktor = 4 * Spielanzahl / (Spielanzahl + K)

Ob nun ein Vielspielfaktor oder der Leistungsquotient verwendet wird, ist egal und hat nur kosmetische Gründe. Wichtig ist nur zu verstehen, dass die Grundlage des Vielspielfaktors oder Leistungsquotienten immer die Berechnung des Erwartungswertes der relativen Spielstärke ist.

Fanthomas, 26. August 2011, um 18:46
zuletzt bearbeitet am 26. August 2011, um 18:49


4. PARADOXON VIELSPIELFAKTOR GEGEN REALSCHNITT – PROBLEME DER AKTUELLEN WERTUNG

Uneingeschränkt gültig ist die aktuelle Fuchstreff-Methode für einmalige Wertungen, also zum Beispiel für eine Ewige Rangliste. Eine Monatswertung wird aber periodisch ermittelt und fängt jedes Mal wieder mit Null an und genau darin liegt das Problem. Egal, ob es einen schwach oder stark ansteigenden Vielspielfaktor gibt, folgendes Paradoxon tritt immer wieder auf:

Es seien A und B zwei sehr gute Spieler, die in den letzten Jahren mehrere 10000 Spiele mit einem Gesamtschnitt von jeweils +0,5 absolviert haben. Ihre Spielstärke wird also ungefähr +0,5 betragen. A ist ein Wenigspieler, der auf der Plattform möglichst nur 200 Spiele im Monat macht, während B ein Vielspieler mit 1000 und mehr monatlichen Spielen ist. Unter Berücksichtigung ihrer bisherigen Leistungen werden beide einen Erwartungswert für den reinen Schnitt von ungefähr +0,5 haben. Allerdings hat Spieler B aufgrund des Vielspielfaktors einen erheblich höheren Erwartungswert für die Wertung und daher bessere Chancen auf eine hohe Platzierung als Spieler A. Dieser Effekt tritt immer auf, wenn es einen Vielspielfaktor gibt, selbst wenn dieser geringer als jetzt beim Fuchstreff oder sogar bei OD ausfällt. Dieser Effekt verschwindet nur, wenn es überhaupt keinen Vielspielfaktor gibt.
Nehmen wir nun mal an, der Vielspielfaktor wäre abgeschafft und die Wertung entspräche dem reinen Schnitt. Scheinbar ist nun für A und B alles in Ordnung, da beide als gleich starke Spieler einen identischen Erwartungswert haben. Nun kommt aber der Glücksfaktor zum Tragen. Dessen Standardabweichung beträgt bei 200 Spielen rund 0,35 und bei 1000 Spielen nur 0,16. Spieler A hat nun beispielsweise einen guten 200er-Lauf mit einem Glücksanteil von +0,7 (2 Standardabweichungen) mit einem Ergebnis von 0,5 + 0,7 = 1,2. Für Spieler A ist alles in Ordnung, aber Spieler B müsste bei gleichem Kartenglück nach 200 Spielen mit +1,2 aufhören, da er sein Risiko sonst einseitig erhöhen würde. Denn bei 1000 Spielen wären 2 Standardabweichungen über seinem Erwartungswert 0,5 + 2 * 0,16 = 0,82. Ein Ergebnis von 1,2 ist nach 1000 Spielen nicht mehr möglich. Dies ist nun die bekannte Benachteiligung von Vielspielern bei positiven Schnitten, wenn kein oder ein zu geringer Vielspielfaktor eingesetzt wird.
Das Problem wäre nur lösbar, wenn das Programm zwar einen Vielspielfaktor verwendet, gleichzeitig aber irgendwie die Spielstärke berücksichtigt. Dies ist aber unvereinbar mit dem ersten goldenen Prinzip, dass zum Monatsbeginn alle Spieler mit Null anfangen. Woher soll also das Programm wissen, dass ein Spieler gut ist, wenn keine früheren Daten verwendet werden dürfen? Das ist natürlich nicht möglich.
Weiterhin tritt folgendes Problem auf. Es seien C und D zwei weitere Spieler, die ebenfalls in einer auf reinem Schnitt (ohne Vielspielfaktor) basierenden Wertung +0,5 erspielt haben. Spieler C allerdings nur in 200 Spielen und Spieler D wiederum in 1000 Spielen. Falls nun beide Spieler gleichstark wären, wie es bei A und B der Fall ist, dann wäre eine gleiche Wertung gerecht. Sofern das Programm unter Verstoß gegen Regel Nummer 1 überhaupt Anhaltspunkte über die Stärke sammeln darf. Was aber nun, wenn es der erste Monat dieser beiden Spieler ist und daher die Spielstärke unbekannt ist? Da das Programm dann selbst bei Zugriff auf ältere Daten nicht wissen kann, wie stark die Spieler wirklich sind, muss es zunächst anhand der Wahrscheinlichkeitsrechnung ermitteln, wie hoch die Erwartungswerte für Glück und Können sind. Somit liegt auf der Hand, dass Spieler D sehr wahrscheinlich besser als C gespielt hat, da bei 1000 Spielen der Glücksfaktor sehr viel geringer als bei nur 200 Spielen ist. Dies steht allerdings in eklatantem Widerspruch zur Situation bei Spieler A und B. Man kann es drehen und wenden wie man will und kommt trotzdem auf keinen grünen Zweig. Ist dieses Paradoxon überhaupt auflösbar?

Die Widersprüche haben damit zu tun, dass die für die Berechnung des Erwartungswerts der relativen Spielstärke entwickelten Formeln eigentlich nur für eine einmalige Anwendung optimal sind und nicht für eine periodische Anwendung gedacht sind. Auch wenn die aktuelle Fuchstreff-Wertung besser als alle bisherigen Monatswertungen ist, da sie als bisher einzige Wertung zwei der goldenen Regeln befolgt und der dritten Regel immerhin schon in Ansätzen genügt, so kristallisiert sich doch heraus, dass der Erwartungswert der Relativen Spielstärke nicht die optimale Grundlage für eine monatlich wiederkehrende Wertung darstellt. Die Berechnungsformeln für diesen Erwartungswert sehe ich nach wie vor als korrekt an, aber der optimale Anwendungsbereich sind Ewige Wertungen, welche nur einmalig erhoben werden. Für die Monatswertung kann noch etwas Besseres gefunden werden.

Fanthomas, 26. August 2011, um 18:46
zuletzt bearbeitet am 26. August 2011, um 18:50


5. NEUE BERECHNUNG DES VIELSPIELFAKTORS

Nachdem der Erwartungswert der relativen Spielstärke nicht die optimale Basis für eine Monatswertung darstellt, stellt sich die Frage, welches Prinzip einer verbesserten Wertung zu Grunde liegen sollte. Die Lösung liegt in der dritten goldenen Regel. Eine Wertung, die allen drei goldenen Regeln entspricht, wäre meines Erachtens wirklich optimal und gerecht gegenüber allen möglichen Spielgruppen (starke, mittelmäßige und schwache Spieler in Kombination mit Wenig-, Normal- und Vielspielern).

Ich konnte dieses Problem nun lösen und möchte hier begründen, wie ich zu dieser Lösung gekommen bin.
Zunächst habe ich mich gefragt, wie denn die Ergebnisse der Spieler in einer Ligatabelle verteilt sein müssten, wenn deren Wertung auch die dritte Regel optimal umsetzt. Bei so einer Wertung müssten die Ergebnisse unabhängig von der Spielanzahl gleich stark streuen. Um dies zu erreichen, müsste die Standardabweichung (SD) der Wertungen in Abhängigkeit von der Anzahl der Spiele soweit erhöht werden, dass sie immer identisch mit der SD bei 200 Pflichtspielen ist. Ich habe das nun folgendermaßen hergeleitet:

Variablen:
Anz = Anzahl der Spiele einer Serie
K = Konstante, die beschreibt, bei welcher Spielanzahl Kartenglück und Spielstärke den gleichen Erwartungswert haben = 600
V_pschn = Varianz des Punkteschnitts einer Serie der Länge „Anz“
V_pflicht = Varianz des Punkteschnitts einer Serie von 200 Pflichtspielen
V_st = Varianz der relativen Spielstärke innerhalb eines Ligasystems = 0,0406 (entspricht K = 600 und SD = 0,2014)
V_spkt = Varianz der Spielpunkte von Einzelergebnissen = 24,5025 (entspricht SD = 4,95)
SQ = Soloquote = 0,0880

Allgemein gilt:
V_pschn = ((Anz – (4+SQ)) * V_st + V_spkt) / Anz

Für 200 Pflichtspiele gilt:
V_pflicht = ((200 – (4+SQ)) * V_st + V_spkt) / 200

Die Standardabweichung (SD) ist immer die Quadratwurzel (Sqrt) der Varianz. Um nun die Wertungsschnitte unabgängig von der Spielanzahl konstant streuen zu lassen, muss deren SD so erhöht werden, dass sie der SD bei 200 Spielen entspricht. Dass wird durch folgende Berechnung des neuen Vielspielfaktors (VSF) erreicht:
VSF_neu = SD_pflicht / SD_anz = Sqrt(V_pflicht / V_anz)

Da für die Konstante K gilt:
K = V_spkt / V_st – (4 + SQ)
erhält man durch Einsetzen der Formeln für V_pschn und V_pflicht und nebst Einsetzen von K:
VSF_neu = Sqrt(((200+K) / 200) * Anz / (Anz+K))

Und bei K = 600 dann:
VSF_neu = Sqrt(4 * Anz / (Anz+600))

Da bisher VSF_alt = 4 * Anz / (Anz+600) gilt, gibt es die Beziehung:
VSF_neu = Sqrt(VSF_alt)

Diese Lösung ist noch in einer anderen Hinsicht elegant. Sie ist nämlich genau das geometrische Mittel einer auf dem Erwartungswert der Spielstärke (bisheriger VSF_alt) und einer auf dem reinen Schnitt basierenden Wertung (VSF = konstant 1, also kein VSF). Somit ist dies sozusagen der ideale Kompromiss für die beiden oben im Paradoxon beschrieben gegensätzlichen Positionen.

Fanthomas, 26. August 2011, um 18:46
zuletzt bearbeitet am 26. August 2011, um 18:51


6. SIMULATION EINER LIGATABELLE MIT EINER MILLION TEILNEHMERN

Um die Wirkung des Vielspielfaktors an Daten zu untersuchen, habe ich eine Simulation durchgeführt. Erzeugt wurde eine Ligatabelle mit 1000000 Teilnehmern anhand der statistisch bekannten Kenngrößen. Diese riesige Anzahl an Teilnehmern war nötig, um auch an den Rändern der Tabelle noch ausreichend Daten für eine genaue Analyse zu erhalten. Für die weitergehenden Betrachtungen wurden alle Spieler mit weniger als 200 Pflichtspielen herausgefiltert, da diese einem anderen Wertungsprinzip unterliegen und somit die Ergebnisse verfälscht hätten.
Ich habe nun die Auswirkungen der OD-Wertung, der aktuellen Fuchstreff-Wertung und der geplanten neuen Wertung auf die Tabelle untersucht und die Ergebnisse in einigen Diagrammen dargestellt.

Link zu Diagramm 1:
http://img228.imageshack.us/img228/4596/diagramm1.png

Linkes Diagramm (Spielanzahl):
Eine große Überraschung war die OD-Kurve. In der oberen Tabellenhälfte (relative Platzierung von 0 bis 50) sind Chancen und Risiken für Viel- und Wenigspieler fast perfekt ausgeglichen. In der Tabellenspitze (oberste 5 Prozent) existiert sogar eine Bevorzugung der Vielspieler, da der Wert für die Spielanzahl ansteigt! Also genau das Gegenteil von dem, was man auf den ersten Blick der realen OD-Tabellen erwartet hätte. Es gibt bei OD keine 200er-Blockade. Die scheinbare Blockade hat nicht ihre Ursachen im Wertungssystem, sondern in der Spielpraxis. Gerade gute Vielspieler pflegen stets mehrere Nicks und hören nach 200 Spielen bei guten Ergebnissen auf, obwohl sie das gar nicht müssten. Die untere Tabellenhälfte ist bei OD natürlich total verzerrt, weil es bei negativen Schnitten keinen Vielspielfaktor gibt.
Die aktuelle Fuchstreff-Kurve ist dagegen schön symmetrisch. Allerdings mit einer stark ansteigender Spielanzahl in den Extrembereichen der Tabelle. Das deutet auf den zu hohen VSF hin. Die rote Kurve für die neue Wertung ist dagegen fast perfekt gerade.

Rechtes Diagramm (Wertung):
Man sieht, dass in der oberen Tabellenhälfte OD und die neue Wertung praktisch identisch sind. Die Abweichung in der unteren Hälfte rührt wieder vom fehlenden VSF bei OD im negativen Bereich her. Die aktuelle Fuchstreff-Wertung produziert durch den zu hohen VSF extremere Wertungen als die neue Wertung oder die OD-Wertung.


Im nächsten Diagramm soll gezeigt werden, inwiefern sich ein falsches K auf die Wertung auswirkt. Untersucht wird hier nur noch die neue Wertung. Wir haben ja das Problem, dass K unmittelbar von der SD der Spielstärken abhängt. Diese wiederum hängt von der Umgebung ab und ist deshalb nicht immer sehr genau bekannt. So wird im Fuchsbau oder in einer Einheitsliga diese SD sehr hoch sein (vielleicht ca. 0,25 bis max. 0,3), aber in einer Top-Liga eines Ligasystems von 5 Ligaklassen eher ziemlich gering (vielleicht min. 0,1 bis ca. 0,15). Muss nun deshalb das K immer wieder angepasst werden, nachdem regelmäßig statistische Analysen der Spielstärken durchgeführt werden?

Link zu Diagramm 2:
http://img88.imageshack.us/img88/736/diagramm2.png

Die Wertung wurde generell mit K = 600 gerechnet. Die Grundlagen sind aber drei verschiedene Datensätze:
Blass-Rot: SD der Spielstärken = 0,1427, was K = 1200 entspricht. Das von der Wertung angewendete K (= 600) ist also um den Faktor 2 zu klein.
Normal-Rot: SD der Spielstärken = 0,2014, was K = 600 entspricht. Das von der Wertung angewendete K ist korrekt.
Schwarz: SD der Spielstärken = 0,2839, was K = 300 entspricht. Das von der Wertung angewendete K (= 600) ist also um den Faktor 2 zu groß.

Linkes Diagramm (Spielanzahl):
Trotz der erheblichen Abweichung des K um jeweils den Faktor 2 nach oben und unten ist die Wertung fast im gesamten Tabellenbereich erstaunlich korrekt. Die Abweichungen zu den idealen Ergebnissen sind vernachlässigbar gering. Selbst in den obersten und untersten 5 Prozent der Tabelle beträgt die Abweichung der Spielanzahl vom idealen Mittelwert weniger als 10 Prozent.

Rechtes Diagramm (Wertung):
Die Abweichung zwischen idealem und zu kleinem K ist auch hier über die gesamte Tabelle recht gering. Etwas empfindlicher reagiert die Wertung auf ein zu großes K. Da aber mit zunehmender Ligenanzahl die SD der Spielstärken innerhalb der Ligaklassen sinken wird und somit das ideale K ansteigt, wird wohl eher die erste Situation auftreten, wo das angewendete K zu klein ist.

Die Tatsache, dass erst sehr große Abweichungen in SD der Spielstärke und K einen signifikanten Einfluss haben, ist eine große Erleichterung für die Entwicklung des optimalen Wertungssystems. Es ist daher überflüssig, K immer wieder neu zu ermitteln in Abhängigkeit davon, wie viele Ligaklassen gerade existieren. In Zukunft wird eine sehr genaue Bestimmung der SD der Spielstärken und des K auch von Interesse sein. Aber natürlich bedeutet so etwas einen gewissen Arbeitsaufwand für das Fuchstreff-Team. Um so erfreulicher ist es daher, dass die Verwendung des bekannten Näherungswerts K = 600 für lange Zeit vollkommen ausreichend ist und auf umfangreiche statistische Untersuchungen der Fuchstreff-Daten zunächst verzichtet werden kann.


Im letzten Diagramm habe ich nun noch die drei verschiedenen Versionen des Vielspielfaktors dargestellt, wobei zu beachten ist, dass bei OD der VSF natürlich nur im positiven Bereich angewendet wird.

Link zu Diagramm 3:
http://img696.imageshack.us/img696/9931/diagramm3.png

Man sieht deutlich den stark ansteigenden Vielspielfaktor bei der aktuellen Fuchstreff-Wertung. Bei OD ist der VSF bis ca. 650 Spiele zu niedrig. Eine kleine 200er-Blockade gibt es dort also doch noch. Ab mehr als 650 Spielen steigt der VSF bei OD allerdings stärker an als bei der neuen Wertung. Der Grenzwert ist für OD und die neue Wertung identisch und beträgt 2. Allerdings wird bei OD dieser Wert bei 1200 Spielen schon viel zu früh erreicht, während es bei der neuen Wertung korrekt erst im Unendlichen geschieht.

CaptainHook, 26. August 2011, um 19:28

Zitat: Regel 2: Positive und negative Ergebnisse werden gleichermaßen behandelt. Ein positives Ergebnis basiert genauso wahrscheinlich auf Kartenglück oder Können wie ein negatives Ergebnis auf Kartenpech oder Nicht-Können.

Der Unterschied ist, dass bei negativen Schnitten - egal ob verdient oder unverdient - gleichermassen abgewertet wird, waehrend bei postiven Schnitten - unverdient oder verdient - immer aufgewertet wird. Diese "Gleichmacherei" ist mMn nicht fair. Die Motivation dazu haengt v.a. damit zusammen die Konkurrenz im oberen Bereich zu stimulieren. Das finde ich auch gut. Aber, warum jemanden, der Pech hat noch dazu benachteiligen nur weil viele "verdientermassen" einen negativen Schnitt haben. Das ist fuer mich eine Ungleichbehandlung von unverdientermassen "guten" und "negativen" Schnitten.

Das liesse sich umgehen, indem man den VSF unterhalb von 0 aussetzt. Oder halt alle Schnitte in positive Werte ueberfuehrt und dann den VSF gleichermassen fuer alle anwendet. Ich sehe hier zusehr den Hang alles ueber einen Kamm zu scheren. Ebenso, eine Tendenz die Ligaauswertung in Richtung Stimulierung der Konkurrenz und Fairness im Kampf, um Plaetze 1-10, aber weniger Fairness (oder Milde walten lassen) im Kampf um die unteren Plaetze.

Ex-Füchse #15119, 26. August 2011, um 20:12

Mal am Rande, sollte eine Ligatabelle eigentlich nicht so aussehen:

1.
2.
2.
4.

und nicht:

1.
2.
2.
3.

Momentan sind 12 Spieler in den Top 10, dass passt doch nicht!

HDF, 26. August 2011, um 20:41

hawking, da hast du recht

fanthomas, da ich eh nicht liga spiele ist es mir zuviel, alle ausführungen zu lesen, nur in einem muss ich dir widersprechen, unter 1. schreibst du im letzten absatz, dass dies nur den oberen teil der ddv-ranglisten betrifft, dem ist aber nicht so, denn die spieler auf platz 33-96 (durch bestimmte qualifikation bei der deutschen meisterschaft sogar noch weiter) erspielen sich einen teilnahmeplatz für die regionalmeisterschaften

dokoqwertz, 26. August 2011, um 20:49
zuletzt bearbeitet am 26. August 2011, um 20:54

Zitat Fanthomas:
--------------------------
http://img228.imageshack.us/img228/4596/diagramm1.png

Man sieht, dass in der oberen Tabellenhälfte OD und die neue Wertung praktisch identisch sind. Die Abweichung in der unteren Hälfte rührt wieder vom fehlenden VSF bei OD im negativen Bereich her.
--------------------------

Das heisst also im Klartext, dass die Wertung von OD mit der kommenden Wertung praktisch eins zu eins übernommen wird? Abgesehen vom fehlenden VSF im negativen Bereich?

IngoKnito, 26. August 2011, um 20:50

Erstmal danke.

Ich glaube, im Groben folgen gekonnt zu haben.

CaptainHook, 26. August 2011, um 20:51

im uebrigen sieht man an der augenblicklichen August Wertung deutlich wie der VSF Konkurrenz auf Platz 1-10 stimuliert. Nirgendswo sonst in der Tabelle findet man 10 Plaetze zusammen, wo der VSF von allen Beteiligten zwischen ca. 2-3 liegt. Das ist ja auch erwuenscht und gut. Der Nebeneffekt wie er z.Z. in der Formel implementiert ist, ist leider halt die Ungleichbehandlung von Gluecksgewinnern und Pechlosern mit respektiven positiven und negativen Schnitten.

Stoni, 26. August 2011, um 21:13

Nein qwertz, der neue VSF bei FT steigt im Vergleich zu OD bis 600 Spiele schneller an, bleibt dann aber deutlich drunter und erreicht nicht bei 1200 Spielen den Wert 2 wie bei OD, sondern erst bei unendlich:
http://img696.imageshack.us/img696/9931/diagramm3.png

Ex-Füchse #9035, 26. August 2011, um 21:16

Ich gebe zu, dass ich nicht genug Mut hat alle Beiträge zu lesen. Allerdings denke ich, dass dies für die folgende Behauptung auch nicht zwingend notwendig ist.

_________________________
"Somit gilt:
VSF_neu = Sqrt(VSF_alt) "
_________________________

Vorher lag der VSF zwischen 1 und 4 nun liegt der VSF zwischen Sqrt(1) und Sqrt(4) das bedeutet also zwischen 1 und 2.
Mann kann also durch den VSF seinen Schnitt "nur" noch verdoppeln statt wie bisher vervierfachen.

Wenn man dies nun beispielsweise mit OD vergleicht, wo wohl der Faktor zu niedrig sein soll kommt man schnell zu folgenden Zahlen:

Auch bei OD kann man einen VSF von 2 erreichen.
Dafür braucht man 1200 Spiele
Wenn man mehr als 1200 Spiele macht steigt der VSF nicht mehr, sondern bleibt konstant auf 2.

Mit 1200 Spielen hatte man im FT bisher einen VSF von 2,67 (gerundet) nun noch 1,63 (gerundet).

Break....

Hm?

Schaun wir kurz genauer hin:

Spiele FT (alt) FT (neu) OD
200 1 1 1,00
300 1,33 1,15 1,10
400 1,6 1,26 1,20
500 1,82 1,35 1,30
600 2 1,41 1,40
700 2,15 1,47 1,50
800 2,29 1,51 1,60
900 2,4 1,55 1,70
1000 2,5 1,58 1,80
1100 2,59 1,61 1,90
1200 2,67 1,63 2,00

Wir sehen also , dass der neue VSF eine Weile knapp über dem OD-Wert liegt und dann darunter.

Beurteilung?

- 180 Grad Wendung

- negativer Bereich weg ignoriert (siehe Ausführungen von Khan)

- Festhalten an Berechnungen/Untersuchungen die einst zu einem extremal Ergebnis geführt haben

- Vielspieler (jenseits der 700 Spiele) haben es schwerer als bei OD, wobei man fairer Weise sagen muss, dass man natürlich auch hier in Richtung der 2,0 kommt.

IngoKnito, 26. August 2011, um 21:24

> - 180 Grad Wendung

> - Festhalten an Berechnungen/Untersuchungen die einst zu einem extremal Ergebnis geführt haben

Hm.

Fanthomas, 26. August 2011, um 21:36
zuletzt bearbeitet am 26. August 2011, um 21:38

@Hawking
Wo siehst Du in der Tabelle die Reihenfolge 1 2 2 4? Ich sehe nur schön geordnete Plätze 1 2 3 4 usw. Anscheinend hast Du übersehen, dass nur Fördermitglieder Platzierungen erhalten. Nicht-Mitglieder werden zwar entsprechend ihrer Wertung in der Tabelle geführt, aber ohne Platzierung und Ligapunkte.

@HDF
Die aktuelle DDV-Rangliste (Stand 22.08.2011) enthält 203 Teilnehmer. Somit bewegen sich die Plätze 33-96 sehr wohl in der oberen Hälfte der Tabelle. Platz 96 hat einen Listenschnitt von +2,7 (entspricht Spielschnitt +0,1125), was noch deutlich im positiven Bereich liegt. Für eine Monatswertung ist wegen des Abstiegskampfes aber auch der negative Bereich im unteren Drittel der Tabelle sehr wichtig. Darum ging es mir bei meinem Vergleich.

@tattvamasi
Vielleicht machst Du Dir besser doch erst mal die Mühe, ALLES in Ruhe durchzulesen?

@khan
Eine Anwendung des VSF nur im positiven Bereich halte ich für sehr fragwürdig, ebenso irgendwelche Verschiebungen des gesamten Wertungsbereichs in den positiven Zahlenbereich. Ich halte Regel 2 für wirklich sehr wichtig:
"Positive und negative Ergebnisse werden gleichermaßen behandelt. Ein positives Ergebnis basiert genauso wahrscheinlich auf Kartenglück oder Können wie ein negatives Ergebnis auf Kartenpech oder Nicht-Können."
Dies kann nur mit einem einheitlichen VSF auf alle Schnitte erreicht werden. Es gibt keinen vernünftigen Grund, warum positive Schnitte durch einen VSF höher gewichtet werden, negative Schnitte dagegen aber nicht. Da könnte ja genauso auch jemand behaupten, man sollte einen VSF nur für negative Schnitte einsetzen. Dies wäre dann ebenso unlogisch wie ein VSF nur für positive Schnitte.
Ich habe es doch in meinen Beiträgen sehr genau erklärt.

Ex-Füchse #9035, 26. August 2011, um 21:40

"@tattvamasi
Vielleicht machst Du Dir besser doch erst mal die Mühe, ALLES in Ruhe durchzulesen? "
____________

mache ich bestimmt mal, sobald ich Lust verspüre etwas zu schreiben, wozu ich dies muss.

CaptainHook, 26. August 2011, um 21:55

Der Anspruch den Grenzwert 2 erreichen zu koennen ist nur theoretisch vorhanden, denn kaum einer wird in die Naehe der dafuer notwendigen Spielzahl kommen. Nun ist also ein Grossteil vom Anreiz zur Vielspielerei verloren gegangen. Warum nicht einfach den Grenzwert auf 2,5-3 herabsetzen und es ansonsten bei der alten Formel belassen ist mir nicht klar. Abgesehen davon sollte man nach wie vor auf die Behandlung von Negativschnitten mit dem VSF verzichten. Denn hier werden Spieler, die eine Pechstraehne haben eindeutig benachteiligt und das kann man nicht weg argumentieren damit, dass Spieler mit einer Glueckstraehne vom VSF zusaetzlich Rueckenwind bekommen.

CaptainHook, 26. August 2011, um 22:02

@Thomas, leider ist es so, dass diejenigen, die die Arbeit haben, auch in der Erklaerungspflicht stehen. Deshalb liegt es an Dir zu erklaeren, warum z.B. ein Spieler der eine Pechstraehne hat auch nochmal vom VSF eins ueber die Ruebe bekommt. Ist nicht boese gemeint...ist aber z.Z. leider so. Das Argument, "die Anwendung des VSF muss auf alle Schnitte gleichermassen erfolgen" klingt recht stur. Was ist daran logisch jemanden mit einer Pechstraehne zu bestrafen?

Stoni, 26. August 2011, um 22:04

Ich bin auch noch sehr verwirrt über die extreme Änderung und kann sie nicht ganz nachvollziehen.

Ich verstehe, sie ist Folge einer statistischen Simulation und soll dem Leitsatz 3 gerecht werden:
Regel 3: Wenigspieler mit kaum mehr als 200 Pflichtspielen, moderate Vielspieler und exzessive Vielspieler (mit 1000 und mehr Spielen) müssen die gleichen Chancen und Risiken haben.

Aber warum ausgerechnet die Wurzel des alten VSF ?

Hat man nach 200 Spielen einen Schnitt von 0,8 erreicht, dann brauchte man bisher nur noch einen Schnitt von 0,2 (!) in den Folgespielen um sein Ergebnis von 0,8 zu halten - Weiterspielen war ohne jedes Risiko möglich ja nötig. Jetzt braucht man 0,5 - was ok aussieht...

Vom Gefühl her und nach ersten Rechnungen müsste das Niveau des VSF etwas höher verlaufen...

HDF, 26. August 2011, um 22:06
zuletzt bearbeitet am 26. August 2011, um 22:08

fanthomas, du springst ein wenig zu kurz, du musst die rangliste zum ende eines wertungszeitraumes betrachten und dann sind es ca. 160 plätze und durch die qaulifikationen bei der DEM geht es über die 100 hinweg, evtl. auch 110, da ist es dann nichts mehr mit oberere hälfte, da solltest du schon meinen zahlen glauben, verstehe ich ein wenig mehr von als du :-))

Fanthomas, 26. August 2011, um 22:15
zuletzt bearbeitet am 26. August 2011, um 22:16

@khan
Meiner Erklärungspflicht bin ich in diesem Thread sicherlich ausreichend nachgekommen. Das Durcharbeiten kann ich Dir leider nicht abnehmen ...

@Stoni
Erst Begeisterung, dann Verwirrung, dann Verständnis. :-)))
Gefühl ist bei Zahlen manchmal richtig, manchmal aber auch ganz falsch. Also nichts, worauf man sich verlassen kann.

@HDF
Na was denn nun? Sind die Plätze 33-96 relevant oder alle Plätze bis ca. 160. Letzteres wäre ja mal ein Grund, das Wertungssystem der DDV-Rangliste ein wenig zu überarbeiten ... :-)

CaptainHook, 26. August 2011, um 22:20

mit dem VSF ist es wie mit Arzneimitteln: zu wenig = keine oder nicht die erwuneschte Wirkung, zuviel = Rausch oder unerwuenschte Nebenwirkungen. Vorher wars zu viel, nun ist es zu wenig. Nebenwirkungen sind hier z.B. die auf Vielspielern mit Negativschnitten.

Hier laesst sich noch etwas verbessern. Aber dafuer muss man die Kraefte die walten und die Motivation der Spieler verstehen und nicht stur auf die Anwendung nur einer einzigen Formel pochen. Jeder versteht, dass man keinen mit einer Pechstraehne bestrafen muss, nur damit es eine einzige Formel gibt.

zur Übersichtzum Anfang der Seite