Verbesserungsvorschläge: Sterne

Seltsam, 22. Dezember 2010, um 21:33
zuletzt bearbeitet am 22. Dezember 2010, um 21:35

Die Idee ist sehr gut, nur wird sich erst im Laufe der Zeit herausstellen, ob die hier angewandte Methode für Doko taugt. Im Moment zweifele ich ein wenig, denn
1. stehe ich z.Zt. auf Platz 17, was eigentlich nicht sein kann, da ich zwar kein schlechter Spieler bin, aber bestimmt auch nicht zu den Top 50 gehören dürfte (oder gibt es hier tatsächlich nur so wenig wirklich gute Spieler/innen?!).
2. Auffällig auch, wie Spieler 4 oder 4 1/2 Sterne haben können, die sich an Pos. 2 von Kontra die Alte ziehen lassen und sonst nix haben, die Dulle in Herz 9 verballern, oder (nach der Klärung) den P abstechen und den Fuchs ausbrüten (bis zum letzten Stich aufbewahren, statt mal was zu riskieren). Aus Erfahrung weiß ich, so was ist schlechtes Doko. Bei aller Liebe, das spricht momentan nicht für aussagekräftige Berechnungen.
Also halte ich mich weiterhin an meinen Schnitt zur eigenen Einschätzung. In der Langzeitbewertung über alle Spiele halte ich das zur Zeit noch für aussagekräftiger (so lange man halt seine Dollars nicht löscht), als die neue Liste. Und da bin ich, so wie ich mich selbst auch einschätze, eben nur leicht überdurchschnittlich.
Mich würde interessieren, ob hier vielleicht auch ein paar gute Mathematiker spielen und ob die ncht mal erläutern möchten, wie man Spielstärke sonst noch vernünftig ermitteln könnte?

Ex-Füchse #365, 22. Dezember 2010, um 21:40
zuletzt bearbeitet am 22. Dezember 2010, um 21:45

@Lottchen,
ich glaube, da hat uns jemand ein Geschenk gemacht (ist ja auch bald Weihnachten).
Die Fuchsstola und die roten Sterne zeigen an, dass man zum erlauchten Kreis der Förderer gehört.
Ich nehme die Gabe freudig an und bedanke mich bei den großzügigen Weihnachtsmännern und -frauen, denn eine Ahnung, wer es sein könnte hab ich ja schon *gg*.
______________________________________

Zitat Seltsam:
**********
Mich würde interessieren, ob hier vielleicht auch ein paar gute Mathematiker spielen
************
Mir fallen da ganz spontan mindestens zwei Leute ein.
Du weißt sicher, wen ich meine.

Doko_Engel, 22. Dezember 2010, um 21:43

hab auch rote sterne und hab noch nix zu fördern
denke eher das der schwanz nur was aussagt ....

Seltsam, 22. Dezember 2010, um 22:00

Na klar fallen mir die gleichen Jungs ein und vielleicht kommt ja nach ein paar Tagen noch was von ihnen. Aber bezügl. der roten Sterne muss ich dich enttäuschen, meine sind auch rot und ich wüsste nicht, wer mich hier zum Förderer befördern wollte, wo ich doch immer so eine dicke Lippe riskiere. Garantiert sind die Farbverteilungen noch ein wenig willkürlich und bald bin ich ergraut ^^

Ex-Füchse #197, 22. Dezember 2010, um 22:26
zuletzt bearbeitet am 22. Dezember 2010, um 22:30

Na,das mit den Sternen,das muss mir mal jemand genauer erklären.Ich hab zB viele Spiele mit Herrmann gemacht und doch nur 3 Sterne? naja....

Ich hab keine roten Sterne,gw an Eva und Christian.
Ich hatte bis dato noch zuviel bei OD zu tun.Im neuen Jahr starte ich hier voll durch ggg

Ex-Füchse #197, 22. Dezember 2010, um 22:42

@ seltsam,es macht doch Sinn,wenn die Betreiber eine Fördermitgliedschaft an Spieler verschenken,die häufig hier sind.Du hast zB knapp 9000 Spiele,ich keine 300...

foxxy, 22. Dezember 2010, um 23:16
zuletzt bearbeitet am 22. Dezember 2010, um 23:58

Hallo seltsam,

1. Nach meiner Erfahrung gehoerst Du innerhalb des Fuchstreffs mit Sicherheit zu den staerksten (stabilsten) Spielern.

2. Das laesst sich pauschal nicht beantworten. Wenn du mit X sagen wir mal 10 Spiele gespielt hast und X da ziemlichen Bockmist baut gibt es verschiedene Erklaerungen, unter anderem:
a, X hatte einen schlechten Tag oder keinen Bock und spielt nicht immer so und hat die Sterne damit "zurecht".
b. X spielt immer "schlecht" und wird seine Sterne schnell wieder los.
c. X spielt insgesamt so gut, dass er sich einige Schnitzer erlauben kann ("Partner abstechen", "Fischer-As").
Alles vorausgesetzt natuerlich die Berechnung stimmt.

Eigentlich ist doch die Motivation (fuer TrueSkill), unterschiedliche Spielerkombinationen in unterschiedlichen Mannschaften zu beruecksichtigen, ideal fuers Doppelkopf. Anders als ein Ranking auf Basis des Spielergebnisses (Wenn Spartakus deutscher Meister ist und naechstes Jahr Vizemeister, ist er ja deshalb kein schlechterer Spieler, sondern hatte nur ein relativ schlechteres Ergebnis in den Turnierenspielen erzielt), soll doch TrueSkill gerade den Bereich angeben, in dem die Staerke des Spielers hoechstwahrscheinlich liegt.
Aber unabhaengig davon, irgendeinen Tod stirbst Du immer, und egal welche Metrik angewendet wird, kann man einzelne Ausrutscher praktisch nicht ausschliessen. Ein einzelnes Ranking ist immer nur eine Momentaufnahme.

@seeadler
Die Sterne entsprechenden der geringsten Wertung innerhalb der potentiellen Spielstaerke, bei Dir 17. Das heisst nicht, dass Deine Spielstaerke auf 17 geschaetzt wird, sondern dass sie hoechstwahrscheinlich hoeher liegt. Wie hoch erkennst Du an den beiden anderen Zahlen Mittelwert und Abweichung. Deine Spielstaerke liegt sicher irgendwo zwischen 17,41 und 38,04. Wenn Du mehr Spiele mit mehr unterschiedlichen Spielern spielst, verringert sich der Bereich immer mehr um den Mittelwert, aktuell 27,72. Aber die Sterne beziehen sich eben nur auf den Minimalwert.
Oder mit anderen Worten: X hat einen Stern mehr als Y heisst nicht automatisch, dass X der bessere Spieler ist, sondern zunaechst mal nur, dass der Bereich, indem Xens Spielstaerke liegt, hoeher beginnt als der von Y. Fuer die eigentliche Spielstaerke muss man noch Mittelwert und Varianz beruecksichtigen.

Seltsam, 22. Dezember 2010, um 23:27

Das mit den Sternchen hat sich, glaube ich, aufgeklärt. Am Spietisch werden rot und grau unterschieden, im Profil sind alle rot. Am Spieltisch sind meine grau, also wurde hier nix verschenkt ^^

Ex-Füchse #3620, 22. Dezember 2010, um 23:44

Doch Seltsam bei mir war der Weihnachtcliff FG und schenkte mir ein Rot/Weißes Schwänzchen.

agnes, 23. Dezember 2010, um 09:00
zuletzt bearbeitet am 23. Dezember 2010, um 10:04

Guten Morgen!

Es ist leider so, dass es keine deutsche Anleitung für die TrueSkill-Sache gibt und ich verstehe sie leider auch nicht, weil ich nie gut in Mathe war. Aber foxxy erklärt das super, vielen, vielen Dank dafür! Die Berechnungen sind aber auch noch nicht abgeschlossen.

Stoni, 23. Dezember 2010, um 09:16

Etwas mehr Transparenz täte gut. Vielleicht weiß ja jemand was. Die 3 Zahlen sind für mich nicht selbsterklärend.

agnes, 23. Dezember 2010, um 09:59
zuletzt bearbeitet am 23. Dezember 2010, um 10:37

Gut, dass es foxxy oben gemacht hat. Vielleicht kannst Du Dir ja vorstellen, dass an solchen Tagen, wo viel Neues online geht, hier alle bis zum Hals in Arbeit stecken und dass noch nicht alles perfekt erklärt ist und auch noch nicht auf Anhieb ganz richtig ist. Aber wenn wir es anders machen, brauchen wir halt 3-4mal länger und obs besser wird, ist dann auch nicht sicher. Und jeden, der sich interessiert, kann sich ja in die Artikel fuchsen, die wir verlinkt haben :)

Der Wert vor der Klammer ist der Wert, wie ihn die Sterne darstellen. Der in der Klammer an erster Stelle sagt, wie Du eigentlich eingestuft bist und der dahinter ist der “Unsicherheitsfaktor”, den wir mal 3 nehmen und von dem höheren Wert in der Klammer abziehen. Daraus ergibt sich dann der Wert vor der Klammer, der Deine Sterne zeigt und somit pessimistischer ist.

Kurz: Skill = Mittelwert - 3 * Standardabweichung

foxxy, 23. Dezember 2010, um 10:45
zuletzt bearbeitet am 23. Dezember 2010, um 10:50

Genau, aber die kurze Eklärung von Agens möchte ich nochmal detaillieren, denn nach links von der Gleichung gehört Sternewert, nicht der "eigentliche Skill".

Der Sternewert ist die Spielstärke, die jemand mindestens haben muss, um das erspielte Ergebnis zu erreichen. Die wahrscheinlichste Spielstärke ist auf Basis des bisherigen Ergebnisses der Mittelwert, wie unsicher das System ist, zeigt die dritte Zahl an.
Dadurch ist (nach Definition) mit 99,7% Wahrscheinlichkeit die tatsächliche Spielstärke höher als der Sternewert. Also eigentlich

Sternewert = mittlerer Skill - 3 * Standardabweichung

Was heisst das konkret?
Wie schon angemerkt, ist es nicht trivial, die "wahre" Spielstärke anzugeben. Wenn jemand in 10 Spielen 8$ macht, hat man zwar nen guten Schnitt, aber was sagt das über den Spieler aus? Viele schlechte Spieler haben mal so einen Lauf. Zieht man mehr Spiele heran (300 Spiele, 70$), wird die Schätzung schon besser, aber ist noch immer relativ unsicher. Spieler mit Stärke 17 haben das (an einem guten Tag) geschafft und Spieler mit Stärke 38 (an einem schlechten Tag). Sind die 300 Spiele repräsentativ, also würde der Spieler bei mehreren Listen von 300 Spielen immer wieder etwa 70$ erzielen, dann entspräche das einer Spielstärke von 27. Bei nur einem Satz á 300 Spielen kann man sich da aber nicht sicher sein.

Dadurch erklärt sich seeadlers aktueller Sternewert von 17, weil man hier konservativ bzw. pessimistisch schätzt. Warum nimmt man nicht die 27 für die Sterne? Weil man dann zum nicht mehr weiss als jetzt auch, dafür aber nach oben UND nach unten unsicher bzgl. der tatsächlichen Spielstärke ist, während man bei Angabe des Mindestwerts ziemlich SICHER sein kann (nämlich 99,7%ig), dass der Spieler auf jeden Fall schon mal Spielstärke 17 hat. Kommen dann mehr Spiele hinzu, wird die Einschätzung immer besser und der Sternewert steigt sehr schnell an (falls der Spieler weiterhin entsprechende Ergebnisse erzielt, die das zulassen) oder bleibt wie es ist (wenn der Spieler tatsächlich schlecht ist, sinkt sehr schnell der Mittelwert). In beiden Fällen wird aber mit mehr Spielen die Berechnung immer genauer und Varianz sinkt (wenn die Ergebnisse das zulassen).

Ex-Füchse #177, 23. Dezember 2010, um 15:13

Ähh vielen Dank für die Erläuterung, ich finde die Sternchen einfach hübsch u versuche aus jedem Blatt das Beste zu machen

Ex-Füchse #197, 23. Dezember 2010, um 23:27

danke Foxxy

Ex-Füchse #5463, 24. Dezember 2010, um 08:00

also ich wiederhole meine Aussage daß die Sterne nichts aber auch gar nichts über die Spielstärke aussagen, sondern mich nur irritieren. Wenn jemand mit im am Tisch sitzt und hat 2 oder 3 Sterne erwarte ich doch, daß dieser Spieler mindestens die Grundregeln beherrscht. Aber anscheinend habe nur ich immer das rätselhafte "Vergnügen " !!!
Mein Rat: Schafft die Sterne wieder ab, sie verwirren nur. Das ein Spieler mit Minus$ 2 Sterne besitzt, erschließt sich mir in keinstem Fall.
Obwohl ich mich auf Spieler mit Minus$ sicherlich einstellen kann, und nicht so viel erwarte. Gruß Curley

Seltsam, 24. Dezember 2010, um 11:24

Also ich hatte gestern jemand mit 4 Sternen am Tisch und fast 150 Nassen. Kaum zu glauben? Doch, spielte vernünftig, in Ansätzen richtig gut. Da finde ich es eher mutig, seine fast 150 nicht zu löschen, weil man ja mit Minus schnell stigmatisiert wird.

Die Sterne ansich sind gut, das Feintuning fehlt aber wirklich noch, denn ich stimme Curley insofern zu, 3 Sterne sollten Mitspieler sein, die wissen, dass man den Partner nicht übersticht, das die Partner Kreuzdame hoch ist, wenn beide Dullen raus sind und der Fuchs angespielt werden kann und nicht zum Ende auf KaroBube beim Gegner landet, grauenhaft, so Leute dürften wirklich nicht 3 Sterne haben.

Ex-Füchse #6944, 24. Dezember 2010, um 12:07

Also was ich nicht gut finde ist , dass sich die Anzahl der Sterne je nach gewonnenen oder verlorenen Spielen ändert , denn dann sind die Sterne ja wieder vom Kartenglück abhängig und sagen nichts über die Spielstärke aus.

foxxy, 24. Dezember 2010, um 12:19
zuletzt bearbeitet am 24. Dezember 2010, um 12:43

Wenn ich das richtig in Erinnerung habe werden die Listen ja nochmal aktualisiert berechnet (wäre gut zu wissen, wann die endgültig sind).

Du kannst Dir TrueSkill so vorstellen, dass es kein lineares Absolutmaß wie man es von Celsius behauptet ist (ich hab drinnen 22°C) sondern die Spieler in Relation zueinander setzt (drinnen ist es wärmer als draußen). Die Skala ist so geeicht, dass 2,5 Sterne eben dem Durchschnittsspieler im Fuchstreff entspricht und 3 Sterne eben auch zu den 2 Dritteln Spielern gehören, die nahe am Durchschnitt sind. da ist die Differenzierung der Sterne nur sehr grob. Je mehr bessere Spieler sich registrieren, desto klarer verständlich passt sich die Eichung der Sterne an.
Vielleicht hilft auch die Vorstellung einer Skala von -2,5 bis +2,5. In der hätte der Spieler den Wert 0,5.

Fällt mir gerade ein, wäre eine 6 Sterneeinteilung nicht klarer wegen 2*3σ?

Ex-Füchse #5463, 24. Dezember 2010, um 14:32

warum so kompliziert????? Curley

agnes, 25. Dezember 2010, um 10:11

Weil solche Berechnungen nun mal höhere Mathematik sind. Selbst wenn wir nur gut oder schlecht ins Profil schreiben würden, wären dahinter komplizierte Rechnungen. Und wir wollten ja eine Einstufung, die nicht nur auf Spielgeld basiert, denn da hieß es ja auch, man könne nicht darauf schließen, ob es ein guter oder schlechter Spieler ist. Und das zurecht…

Und was ich zuletzt aus dem Büro gehört habe war: ja, es wird nochmal neu gerechnet

Suse, 26. Dezember 2010, um 12:00

Sterne hin, Sterne her, ich vermute, dass die TrueSkill-Methode für Spiele geeignet sind, die immer die "selbe" Ausgangsposition haben. Bei Schach, Dame, Mühle, Kegeln etc. ist das der Fall.
Doppelkopf ist ein r e i n e s Glücksspiel, wobei die Ausgangspositionen immer anders sind.
Ob man gewinnt oder nicht gewinnt richtet sich nach der Kostellation der Karten und das kann ich als Spieler nicht beeinflussen, da der Mischer verteilt.
"Schlechte Spieler/innen" gewinnen mit "guten" Karten das Spiel, wobei ein guter Spieler/innen
eben mit schlechten Karten verliert. Die TrueSkill-Methode registriert aber nur das End-Ergebnis. Für Doppelkopf daher nicht effektiv, weil der "Glücksfaktor" nicht berechenbar ist.
So sehe ich das im Moment...

Ex-Füchse #3620, 26. Dezember 2010, um 12:42
zuletzt bearbeitet am 26. Dezember 2010, um 12:45

Wenn ich mit Leuten spiele ich nenne mal Spartakus oder einige andere kann ich auch mit schlechten Karten gewinnen weil viele hier vergessen das Doppelkopf ein Partnerspiel ist. Und gut Spieler können durch ihr können viel über Ihr Blatt mitteilen ohne Kartenverrat zu machen. Ich Persöhnlich zähle mich da noch nicht zu aber ich lerne.

Ex-Füchse #365, 26. Dezember 2010, um 12:43

Zitat Suse:
**********
Doppelkopf ist ein r e i n e s Glücksspiel
**********
Ganz so einfach ist es m.E. nicht, Suse.
Natürlich ist beim Doko das Kartenglück ein ganz wichtiger Faktor, da sind sich sicher alle einig.
Selbst der beste Spieler der Welt wird mit einer Megagrotte verlieren, und auch der totale Anfänger wird gewinnen, wenn er eine echte Omma auf der Hand hat.
Aber der gute Spieler wird bei einem miesen Blatt durch geschickten Einsatz seiner wenigen Trümpfe und kluges Ausspiel der Fehlkarten vielleicht nur mit k9 verlieren während der schwächere Spieler mit k6 oder k verloren hätte..
Bei einem Brett findet der erfahrene Spieler die k6, k3 oder sogar die Schwarzabsage, während der Neuling allerhöchstens k9 sagt, meist jedoch gerade mal den Mut für das Re aufbringt.
Auf diese Weise kommen sehr schnell bei dem einen Pluspunkte aufs Konto, während der andere womöglich in die Miesen geht.
Ein guter Spieler zählt die gefallenen Trümpfe mit und weiß, ob er zum Ende des Spieles hin den Sonderpukt für Charly anstreben sollte oder lieber nicht. Ein schwächerer weiß hingegen oft nicht genau, ob sein Charly steht oder nicht und lässt sich so oft aus Gier nach dem Sonderpunkt den womöglich siegbringenden letzten Stich entgehen oder er wirft der stehenden Kreuzbuben weg, hält statt dessen eine Dame und verzichtet auf den Extrapunkt (ein Fehler, der mir relativ häufig passiert).

Erfahrungsgemäß gleichen sich bei einer genügend großen Anzahl von Spielen Glück und Pech ohnehin meist aus.
Jeder hat mal ne Grottenserie und jeder auch mal nen Lauf.
Wobei die üblen Serien meist länger in Erinnerung bleiben sodass bei vielen Spielern irgendwann das Gefühl überwiegt man werde vom Mischer oder von Fortuna benachteiligt.

Stoni, 26. Dezember 2010, um 12:51

Nicht nur dem Glück guter/schlechter Karten ist man unterworfen, sondern auch dem, was man guter/schlechter Lauf nennen kann. Einmal gewinnt man mit 120, ein anderes Mal verliert man mit 119. Einmal läuft das zweimal besetzte Herz-As, ein anderes Mal wird das blanke schwarze Ass abgestochen. Einmal fallen beim Solo alle Buben, ein anderes Mal sitzen sie 4-0-0 dagegen.

Betrachtet man 20 Spiele, kann es gut möglich sein, daß selbst ein Neuling Spieler wie Spartakus / HDF hinter sich läßt. Das gibt es beim Schach natürlich nicht. Bei 200 Spielen wird es schon viel seltener, das Glück wird sich verteilen. Bei 2000 Spielen werden die Ergebnisse schon deutlich aussagekräftiger. Hier liegen dann wirklich nur die guten Spieler vorne, weil der Anteil des Glücks nur noch geringer Natur ist. Fanthomas hat dazu eine wirklich gute Berechnung durchgeführt.

Online-Monatswertungen oder die Deutschen Meisterschaften werden zB über 200 Spiele ausgetragen. Auch hier braucht man Glück, um zu gewinnen. In vielleicht 5% der Fälle (alle 20 Jahre) gewinnt aber auch mal jemand, der gar nicht zu den Top200 in Deutschland/Welt gehört.

Jahreswertungen online oder in den Vereinen werden über mind. 2000 Spielen entschieden. Hier kann ein schlechter Spieler nicht gewinnen. Aber auch hier gewinnen mal Leute, die schlechter sind als die anderen. Gute Karten oder ein guter Lauf haben auch hier noch eine gewisse Bedeutung. So konnte ich zB 2010 Berlin gegen die beste Spielerin der Welt gewinnen, weil das Glück auf meiner Seite war.

Aber zB auch beim Fussball werden selbst Mannschaften wie Kaiserslautern oder Wolfsburg mal Meister, wenn Glück, guter Lauf und mentale Stärke zusammenkommen.

Die Sterne brauchen deshalb natürlich auch eine Langzeitbetrachtung und beginnen erst ab 500 / 1000 Spiele Aussagekraft zu erlangen. Aber dann können sie durchaus was aussagen. Glück und guter Lauf gleichen sich da in 98% der Fälle aus.

zur Übersichtzum Anfang der Seite