mathematik-werner-brefeld

Berechnung der Beliebtheit der Lottozahlen

Fragen und Bemerkungen gerne an: werner.brefeld@web.de, Adresse: siehe Impressum, Themenübersicht auf der Hauptseite:

Mathematik im Alltag, verblüffende Mathematik-Rätsel, Stochastik und Polyeder, irdisches und außerirdisches Leben


Wie kann man die Beliebtheit von Lottozahlen berechnen?


Hier wird erläutert, wie man die auf den Web-Seiten über Lotto 6 aus 49, EuroJackpot und EuroMillions aufgeführten Beliebtheiten der Lottozahlen berechnet.

Aufstellen der Gleichungen, mit denen man die Beliebtheit der Lottozahlen bei Lotto 6 aus 49 berechnen kann

Am Ende dieser Seite: Die entsprechenden Gleichungen für EuroJackpot und EuroMillions

Die Beliebtheit einer Lottozahl bei Lotto 6 aus 49 ist der Faktor, mit dem die Lotto-Spieler diese Lottozahl häufiger ankreuzen als in dem Fall,
dass alle Lottozahlen gleich häufig angekreuzt würden. Daraus folgt, dass alle Lottozahlen die Beliebtheit 1 hätten, wenn sie alle gleich häufig angekreuzt würden.
Außerdem ergibt sich aus der Definition, dass die Summe der Beliebtheiten aller 49 Lottozahlen gleich 49 sein muss.

Da die Beliebtheiten der Lottozahlen nicht von der Gewinnklasse abhängen (die Tipper wissen beim Ankreuzen ja noch nicht, ob oder in welcher Gewinnklasse sie gewinnen werden),
kann man sich für die Berechnung eine Gewinnklasse aussuchen. Eine Gewinnklasse mit vielen Gewinnern hat dabei den großen Vorteil, dass der statistische Fehler der Berechnung
klein bleibt. Bei Lotto 6 aus 49 wird deshalb für die Berechnung die Gewinnklasse für 3 Richtige (ohne Superzahl) verwendet.

Man kann mathematisch zeigen, dass sich die Beliebtheit bz einer Lottoziehung in guter Näherung als eine Art Produkt der Beliebtheiten der einzelnen Lottozahlen ausdrücken lässt.
Bei der Gewinnklasse für 3 Richtige (ohne Superzahl) gibt es daher die Beliebtheiten br1, br2, br3 für die von den Lottospielern angekreuzten 3 richtigen Zahlen und die Beliebtheiten
bf1, bf2, bf3 für die ebenfalls angekreuzten 3 falschen Zahlen. Es gilt also in guter Näherung:

br1 · br2 · br3 · bf1 · bf2 · bf3 = bz

Dabei ist die Beliebtheit bz einer Lottoziehung das Verhältnis von theoretischer Quote zu tatsächlicher (aus der Zahl der Gewinner und der abgegebenen Tipps genau berechneten)
Quote (bezogen auf die Quoten für 3 Richtige ohne Superzahl). Für die anderen Gewinnklassen ergeben sich natürlich andere Quotenverhältnisse und damit andere Beliebtheitswerte bz für
diese Lottoziehung.

Nun verbergen sich aber hinter der Beliebtheit br1, br2 und br3 für die 3 richtigen Zahlen (über die vielen Tippscheine mit 3 Richtigen verteilt) die Beliebtheiten für alle
6 gezogenen Lottozahlen. Deshalb muss man die 6. Wurzel aus der dritten Potenz der Beliebtheit dieser 6 Lottozahlen nehmen, damit sie quasi auf die 3 br-Faktoren "schrumpfen".

Zusätzlich verbergen sich hinter den Beliebtheiten bf1, bf2 und bf3 für die 3 falschen Zahlen (wieder über die vielen Tippscheine mit 3 Richtigen verteilt)
die Beliebtheiten für alle 43 nicht gezogenen Lottozahlen. Deshalb muss man die 43. Wurzel aus der dritten Potenz der Beliebtheit dieser 43 Lottozahlen nehmen,
damit sie quasi auf die 3 bf-Faktoren "schrumpfen". Wenn man nämlich 43-mal die 43. Wurzel einer dritten Potenz miteinander multipliziert, bleibt ja die dritte Potenz übrig,
die dann quasi dem Produkt der 3 Faktoren bf1, bf2 und bf3 entspricht.

Bezeichnet man die 6 gezogenen Lottozahlen mit bz1 bis bz6 und die 43 nicht gezogenen Lottozahlen mit bnz1 bis bnz43, dann ergibt sich aus der obigen Gleichung
die folgende Gleichung:

(bz13)1/6 · (bz23)1/6 · (bz33)1/6 · (bz43)1/6 · (bz53)1/6 · (bz63)1/6 · (bnz13)1/43 · (bnz23)1/43 · (bnz33)1/43 · ... · (bnz413)1/43 · (bnz423)1/43 · (bnz433)1/43 = bz

Eine Gleichung reicht natürlich nicht aus, um die Beliebtheit der 49 Lottozahlen zu bestimmen. Dafür braucht man mindestens 49 Gleichungen, also die Daten von mindestens 49 Ziehungen.
Da im Mittel etwa 35,08 Ziehungen gebraucht werden, damit alle 49 Lottozahlen mindestens einmal vorkommen, würden normalerweise auch 49 Ziehungen ausreichen.
Um den Einfluss von 2 unvermeidbaren Fehlerquellen zu verringern, werden für die Berechnung allerdings nicht nur 49, sondern etwa 200 Ziehungen verwendet. Ein Problem ist der schon oben erwähnte
statistische Fehler, der hauptsächlich durch die begrenzte Anzahl der Gewinner verursacht wird. Dieser Fehler wurde schon durch die Wahl der Gewinnklasse für 3 Richtige (ohne Superzahl)
mit ihren vielen Gewinnern deutlich verkleinert. Durch die Verwendung von 200 Ziehungen (also von 200 Gleichungen) wird der Fehler weiter unterdrückt. Eine zweite Fehlerquelle
ist die Vorliebe vieler Lottospieler für geometrische und arithmetische Muster. Ein geometrisches Muster entsteht beispielsweise, wenn die angekreuzten Lottozahlen auf dem Lottoschein
eine Diagonale oder einen waagerechten oder senkrechten Balken bilden. Wegen dieser Vorliebe ergeben sich schlechtere Lottoquoten, wenn solche Muster gezogen werden,
auch wenn die einzelnen Lottozahlen des Musters eher unbeliebt sind. Auch hier sorgen die 200 Ziehungen dafür, dass diese nur gelegentlich auftretenden Effekte die Werte
für die Beliebtheit der einzelnen Lottozahlen nicht zu sehr beeinflussen. Eine dritte Fehlerquelle ist die Änderung des Tippverhaltens der Lottospieler über die Zeit.
Da die Lottospieler zum Glück ihr Tippverhalten nur sehr langsam und sehr wenig ändern, entsteht durch die Wahl von etwa 200 Ziehungen kein nennenswerter Fehler.

Ein Gleichungssystem mit etwa 200 Gleichungen und 49 unbekannten Beliebtheitswerten ist natürlich überbestimmt. Deshalb werden die Ergebnisse für die Beliebtheit der einzelnen Lottozahlen
durch etwa 1000 Iterationen bestimmt. Dazu werden zu Anfang alle Beliebtheitswerte der Lottozahlen auf 1 gesetzt. Daraus ergeben sich am Anfang für die etwa 200 Ziehungen ebenfalls
Beliebtheitswerte von 1. Sie werden mit den tatsächlichen Beliebtheiten der Ziehungen verglichen. Die daraus gewonnenen Korrekturfaktoren werden nun entsprechend der Häufigkeit
der jeweiligen Lottozahlen normiert und daraus die iterierten Beliebtheiten der Lottozahlen bestimmt. Diese sind dann die Startwerte für die nächste Iteration.



Iterative Lösung eines multiplikativen Gleichungssystems

Wie man ein multiplikatives Gleichungssystem durch Iterationen löst, wird am Beispiel des folgendes Gleichungssystems von 3 Gleichungen erläutert:

x · y = 1,1904
y · z = 1,0416
z · x = 0,8064

Als Startwerte wählt man x = 1, y = 1 und z = 1. Mit diesen Startwerten ergibt sich für jede Gleichung das Ergebnis 1.
Die Abweichungen zu den tatsächlichen Werten kann man korrigieren, indem man in der ersten Gleichung den Korrekturfaktor
1,1904/1 = 1,1904 auf x und y verteilt. Man erhält x = y = √(1,1904) = 1,0911. Damit würde die Gleichung stimmen.
Allerdings ergibt sich aus der zweiten Gleichung entsprechend der Wert y = z = √(1,0416) = 1,0206.
Und aus der dritten Gleichung erhält man z = x = √(0,8064) = 0,8980.

Man bekommt also für jede Unbekannte zwei Iterationswerte. Deshalb geht man mit jeweils dem geometrischen Mittel (wegen des multiplikativen Gleichungssystems)
der beiden Werte in die nächste Iteration:

x = Wurzel(1,0911 · 0,8980) = 0,9899
y = Wurzel(1,0911 · 1,0206) = 1,0553
z = Wurzel(1,0206 · 0,8980) = 0,9573

Diese 3 Werte für x, y und z wären dann die Startwerte für die zweite Runde. Daraus ergibt sich für die erste Gleichung der Wert x · y = 1,0446.
Und daraus wiederum der neue Korrekturfaktor 1,1904 / 1,0446, den man wieder auf x und y verteilen muss usw.

Nach vielen solchen Iterationen nähern sich dann die Werte für x, y und z den richtigen Werten x = 0,9600, y = 1,2400 und z = 0,8400.



Die entsprechenden Gleichungen für eine Ziehung bei EuroJackpot

Bei EuroJackpot (5 aus 50) muss man für die Berechnung mindestens 50 Ziehungen verwenden. Da im Mittel etwa 43,55 Ziehungen gebraucht werden,
damit alle 50 Zahlen mindestens einmal vorkommen, würden normalerweise auch 50 Ziehungen ausreichen. Wegen der oben bei Lotto 6 aus 49
genannten Gründe verwendet man jedoch sinnvollerweise ebenfalls etwa 200 Ziehungen und bis zu 1000 Iterationen.

Für die Berechnung der Beliebtheit der Zahlen werden bei EuroJackpot aus den gleichen Gründen wie bei Lotto 6 aus 49 die Gewinner mit
3 richtigen Zahlen (unabhängig von der Anzahl der richtigen Eurozahlen) verwendet. Da bei EuroJackpot 5 aus 50 Zahlen gezogen werden, haben
die Gewinner neben 3 richtigen Zahlen also auch 2 falsche Zahlen angekreuzt. Die Gleichung pro Ziehung sieht dann folgendermaßen aus:

br1 · br2 · br3 · bf1 · bf2 = bz

Nun gibt es aber 5 gezogene (richtige) Zahlen und 45 nicht gezogene (falsche) Zahlen. Die 5 richtigen Zahlen müssen sich also
die 3 Faktoren für die Beliebtheit der richtigen Zahlen und die 45 falschen Zahlen die 2 Faktoren für die Beliebtheit der falschen
Zahlen teilen. Die Beliebtheit der 5 richtigen Zahlen muss deshalb mit der dritten Potenz der fünften Wurzel, die der 45 falschen
Zahlen mit dem Quadrat der 45. Wurzel auftauchen:

(bz13)1/5 · (bz23)1/5 · (bz33)1/5 · (bz43)1/5 · (bz53)1/5 · (bnz12)1/45 · (bnz22)1/45 · (bnz32)1/45 · ... · (bnz432)1/45 · (bnz442)1/45 · (bnz452)1/45 = bz

Etwa 200 solcher Gleichungen müssen dann - wie oben beschrieben - iterativ gelöst werden.



Die entsprechenden Gleichungen für eine Ziehung bei EuroMillions

Bei EuroMillions (5 aus 50) muss man für die Berechnung mindestens 50 Ziehungen verwenden. Da im Mittel etwa 43,57 Ziehungen gebraucht werden,
damit alle 50 Zahlen mindestens einmal vorkommen, würden normalerweise auch 50 Ziehungen ausreichen. Wegen der oben bei Lotto 6 aus 49
genannten Gründe verwendet man jedoch sinnvollerweise ebenfalls etwa 200 Ziehungen und bis zu 1000 Iterationen.

Für die Berechnung der Beliebtheit der Zahlen werden bei EuroMillions aus den gleichen Gründen wie bei Lotto 6 aus 49 die Gewinner mit
nur 2 richtigen Zahlen (unabhängig von der Anzahl der richtigen Eurozahlen) verwendet. Da bei EuroJackpot 5 aus 50 Zahlen gezogen werden,
haben die Gewinner neben 2 richtigen Zahlen also auch 3 falsche Zahlen angekreuzt. Die Gleichung pro Ziehung sieht dann folgendermaßen aus:

br1 · br2 · bf1 · bf2 · bf3 = bz

Nun gibt es aber 5 gezogene (richtige) Zahlen und 45 nicht gezogene (falsche) Zahlen. Die 5 richtigen Zahlen müssen sich also
die 2 Faktoren für die Beliebtheit der richtigen Zahlen und die 45 falschen Zahlen die 3 Faktoren für die Beliebtheit der falschen
Zahlen teilen. Die Beliebtheit der 5 richtigen Zahlen muss deshalb mit dem Quadrat der fünften Wurzel, die der 45 falschen
Zahlen mit der dritten Potenz der 45. Wurzel auftauchen:

(bz12)1/5 · (bz22)1/5 · (bz32)1/5 · (bz42)1/5 · (bz52)1/5 · (bnz13)1/45 · (bnz23)1/45 · (bnz33)1/45 · ... · (bnz433)1/45 · (bnz443)1/45 · (bnz453)1/45 = bz

Etwa 200 solcher Gleichungen müssen dann - wie oben beschrieben - iterativ gelöst werden.



Erläuterung, warum die Beliebtheit eines Lotto-Tipps für Lotto 6 aus 49 in guter Näherung gleich dem Produkt der Beliebtheiten der 6 getippten Lottozahlen ist

Die Wahrscheinlichkeit, dass ein Spieler 6 bestimmte Lottozahlen ankreuzt, lässt sich in guter Näherung als Produkt der Beliebtheit der 6 Lottozahlen
geteilt durch 13.983.816 darstellen. (496) = 13.983.816 ist die Anzahl aller möglichen verschiedenen Lotto-Tipps. Die Beliebtheit eines Tipps ist also in guter Näherung
gleich dem Produkt der Beliebtheit der 6 Lottozahlen.

Sind die Beliebtheiten der 6 Lottozahlen genau 1, erhält man für die Beliebtheit des Tipps auch den Wert 1. Die Beliebtheit des Tipps ist hier also genau gleich
dem Produkt der Beliebtheiten der 6 Lottozahlen.

Die gleichen aber etwas komplizierteren Überlegungen kann man anstellen, wenn alle 6 angekreuzten Lottozahlen eine von 1 abweichende Beliebtheit haben.
Dann ist die Beliebtheit des Tipps nicht mehr genau das Produkt der Beliebtheit der 6 Lottozahlen, sondern weicht davon ab.

Wenn z.B. die Beliebtheit der 6 Lottozahlen l1 bis l6 jeweils gleich 1,1 ist, erhält man für die Beliebtheit des Lotto-Tipps nach dem Produktverfahren
den Wert 1,16 = 1,771561.

Um die exakte Beliebtheit für diesen Tipp zu berechnen, muss man sich klarmachen, dass die Summe der Beliebtheiten der 49 Lottozahlen per Definition gleich 49 ist.
Die Wahrscheinlichkeit, dass der Spieler als erste Lottozahl l1 wählt, beträgt also:

Beliebtheit von l1 geteilt durch die Gesamtbeliebtheit der Lottozahlen, aus denen er eine Lottozahl wählen kann, also 1,1 / 49.

Die Wahrscheinlichkeit für das Wählen von l2 als nächste Lottozahl beträgt dann 1,1 / 47,9. Die Gesamtbeliebtheit der 48 Lottozahlen, aus denen er nur noch wählen kann,
beträgt ja nur noch 49 – 1,1 = 47,9. Bei l3 ist die Wahrscheinlichkeit dann 1,1 / 46,8. Die Wahrscheinlichkeit, dass der Spieler diese 6 Lottozahlen in der Reihenfolge
von l1 bis l6 auswählt, beträgt also:

(1,1 / 49) · (1,1 / 47,9) · (1,1 / 46,8) · (1,1 / 45,7) · (1,1 / 44,6) · (1,1 / 43,5)

Da man aber 6! = 1·2·3·4·5·6 = 720 verschiedene Reihenfolgen für die 6 Lottozahlen l1, l2, ... , l6 wählen kann (also z.B. l3, l5, l2, l6, l1, l4), muss man die Wahrscheinlichkeit noch
mit 720 multiplizieren:

720 · (1,1 / 49) · (1,1 / 47,9) · (1,1 / 46,8) · (1,1 / 45,7) · (1,1 / 44,6) · (1,1 / 43,5) = 1275,52392 / 9739076165 = 1,831456 / 13.983.816

Der Wert 1,831456 ist aber nur etwa 3,4% größer als der obige Wert von 1,771561. Die Beziehung zwischen der Beliebtheit des Tipps und der Beliebtheit der entsprechenden
6 Lottozahlen lässt sich also tatsächlich in guter Näherung durch eine Produktgleichung darstellen. Wird der Tipp dann wirklich gezogen, spiegelt die Beliebtheit der Ziehung
für die Gewinnklasse mit 6 Richtigen die Beliebtheit des Tipps wider.

Dieses Verfahren versagt jedoch, wenn sich die Beliebtheiten der Lottozahlen zu weit von 1 entfernen. Grob gesagt, sollte die Beliebtheit der unbeliebtesten Lottozahl
nicht kleiner als 0,5 und die Beliebtheit der beliebtesten Lottozahl nicht größer als 2 sein. Von diesen Grenzen ist man aber weit entfernt. Denn wäre dem so, käme man beim
Lotto-Spielen deutlich in die Gewinnzone. Aber diese Situation wird aus nachvollziehbaren Gründen wohl nie eintreten.



Copyright © Werner Brefeld (1979; Originalquelle)