Blue Flower

In der Übersicht Ratingsysteme der Badmintonratingsysteme sind verschiedene Punkte aufgelistet, in denen sich die Ratingsysteme unterscheiden. Hier wollen wir zu den einzelnen Punkten ein paar erklärende Bemerkungen machen.

 

Allgemeines (Spielsystem): Gerne wird das ELO-System als Silver Bullet für ein Ratingsystem angesehen und das damit ermittelte Rating muss einfach richtig sein. Dies ist aber nicht der Fall.

- Schachverbände, die später ein Ratingsystem eingeführt haben, haben sich für andere, komplizierte Systeme entschieden:

 - Der nordamerikanische Schachverband (U.S. Chess Federation) benutzt eine Variante von Glicko.

- Bei einem Wettbewerb mit $10.000 Preisgeld wurde das ELO-System und Glicko klar geschlagen bzgl. der Vorhersagegeneuigkeit.

- Bei neueren Multiplayerspielen werden verbesserte Ratingssysteme eingesetzt. Microsoft benutzt bei der XBOX das selbst entwickelte TrueSkill.

 

ELO wertet nur Sieg, Niederlage oder Unentschieden aus (Im Badminton nur Sieg oder Niederlage, aber zum Teil mit der Unterscheidung zwischen 2-Satz-Sieg und 3-Satz-Sieg). Die zusätzliche Information, wie hoch der Sieg gewesen ist (= erzielten Punkte in den Sätzen), wird nicht ausgewertet.

 

Granularität: Die meisten System berechnen für jede Disziplin ein eigenes Rating, so dass es insgesamt fünf Listen gibt (Dameneinzel, Herreneinzel, Damendoppel, Herrendoppel, Mixed). Madu wertet alle Spiele zusammen aus und berechnet somit nur ein einziges Rating pro Spieler. Ob dies zu einer systematisch Ungenauigkeit führt (manche Spieler sind in einer Disziplin erheblich besser in als eine anderen) lässt sich schwer sagen. Der Vorteil eines einzigen Ratings ist, dass es auf mehr Spielen pro Spieler beruht (die Spiele eines Spielers verteilen sich nicht auf mehrer Disziplinen).

 

Datenbasis: Je mehr Spiele als Grundlage genommen werden, desto besser. Die meisten Spieler machen nur wenige Spiele pro Jahr, so dass die Berechnungsgrundlage ohnehin spärlich ist. Umso wichtiger ist es, dass möglichst alle verfügbaren Quellen benutzt werden.

 

Aktualität: Auch wenn es wünschenswert ist, direkt nach einem Turnier sein neues Rating zu sehen, ist tatsächlich eine Neuberechnung alle paar Wochen ausreichend. Realistisch gesehen ändert sich sich die Spielstärke von Woche zu Woche nicht soviel. Deshalb sollte man bei die Aktualität der Berechnung (wöchentlich oder monatlich) nicht überbewerten.

 

Rating-Stabilität: Darunter verstehen wir, ob und wie das Rating eines Spielers sich unter bestimmten Bedingungen verändert.

- Ratingverlust bei Siegen: Zunächst klingt es vernünftig, wenn ein Spieler bei einem Sieg zumindest sein Rating nicht verschlechtern kann (schließlich hat er ja gewonnen, was will man mehr?). Vielleicht müßte er sein Rating sogar mindest ein kleine bisschen steigen. Berücksichtigt man jedoch, wie ein Spiel gewonnen wird, so wird man zu dem Schluss kommen: Wenn ein als sehr viel besser eingerateter Spieler nur knapp (bspw. in drei Sätzen oder nur 21:19) gewinnt, so scheint er tatsächlich doch nicht so viel besser zu ein, wie ursprünglich gedacht. Folglich muss sein Rating (trotz des Siges) schlechter sein als ursprünglich angenommen. Mit anderen Worten: Wenn sich das Rating trotz eines Sieges verschlechtern kann (oder trotz Niederlage besser werden kann), dann ist das ein gutes Zeichen für das Ratingsystem: es merkt früher als andere Systeme, dass sich ein Spieler verbessert/verschlechtert.

 

- Ratingänderung ohne Spiel: Darf sich das Rating eines Spielers ändern, auch wenn er kein Spiel gemacht hat? Eigentlich nicht, sollte man denken, und es wäre schön, wenn man ein Ratingsystem hätte, bei dem dies auch eine Bedeutung hätte. Hinter der Forderung "Kein Spiel, also auch keine Änderung im Rating" steckt der Wunsch und die Annahme, dass Ratings von unterschiedlichen Zeitpunkten (bspw. von heute und von vor einem Jahr) sich vergleichen lassen nach dem Motto "heute bin ich 20 Punkte stärker als vor einm Jahr". Dies leistet aber kein Ratingsystem! Für ELO ist bekannt, dass es unter Inflation leidet, die ELO-Werte von heute sind mit denen vor etlichen Jahren nicht vergleichbar (siehe chessmetric). Streng genommen dürfen deshalb nur Ratings zum gleichen Zeitpunkt verglichen werden, nicht Ratings, die an unterschiedlichen Zeitpunkten berechnet wurden. Damit  wird aber die schöne Forderung, dass sich ohne Spiele das Rating nicht ändern hinfällig. Mit oder ohne Spiele: ich kann die beiden Ratings nicht miteinander vergleichen.

Zudem kann man es auch als Vorteil sehen, wenn sich auch ohne Spiele das Rating ändern kann. Alle Ratings berücksichtigen die Spielstärke der Gegnern. Liegen nun neue (= genauere) Erkenntnisse über die Spielstärke der Gegner vor (weil diese weitere Spiele gemacht haben), so kann auch das Rating eines Spielers noch nachträglich geändert werden.

 

Dokumentation: Dokumentation des verwendeten Verfahrens stärkt das Vertrauen, dass die Zahlen, die den Spieler zugeordnet werden, auch tatsächlich eine Bedeutung haben und etwas über die Spielstärke aussagen. Je besser und genauer die Dokumentation ist und für einen Außenstehenden nachvollziehbar ist, desto besser lassen sich Stärken und Schwächen des Ratingsystems herausfinden.