myNFP Logo

Menstruation vorhersagen

Wie der rote Balken in myNFP funktioniert

Als myNFP noch in den Kinderschuhen steckte, wurde der Beginn der nächsten Menstruation mit dem Durchschnitt der vergangenen Hochlagenlängen berechnet. Aus einem Bauchgefühl heraus hatte ich das System irgendwann so umgestellt, dass es anstatt des arithmetischen Mittels den Median der vergangenen Hochlagenlängen berechnete und zusätzlich besonders lange Hochlagen einfach ignorierte. Für viele Zyklen wurde die Menstruationsprognose damit verbessert. Ich konnte jedoch nicht benennen, wie hoch die Verbesserung gewesen ist.

Du liest einen Artikel aus dem ehemaligen myNFP-Blog. Der Artikel erschien ursprünglich im Jahr 2011.

Neulich bei ein paar Bierchen mit meinem Kumpel Sebastian kam die Idee auf, dass man die Zyklusdaten doch etwas genauer untersuchen könnte. Sebastian hat seine Dissertation im Bereich Maschinelles Lernen verfasst und beschäftigt sich nun beruflich mit der Analyse von Daten.

Warum überhaupt die Menstruation vorhersagen?

Für viele Frauen ist es interessant zu wissen, wann die nächste Menstruation beginnt. Das kann verschiedene Gründe haben. Manche wollen vorbeugende Maßnahmen gegen PMS oder Regelschmerzen treffen soweit das möglich ist. Andere wollen wissen, wann ihre Stimmung sich verändert. Und manchmal möchte man einen Termin so legen, dass er nicht mit der Menstruation zusammenfällt.

Schwierigkeiten bei der Vorhersage

Die Vorhersage der nächsten Menstruation ist gar nicht so einfach.

Dennoch: Viele Zyklen sind relativ regelmäßig und in den Daten lassen sich sehr interessante Muster finden.

Was wir gemacht haben

Wir verwendeten anonymisierte Daten aus 85.000 Zyklen, um ein globales Regressions-/Vorhersagemodell zu erstellen. Mit diesem Vorhersagemodell ist es möglich, für jede Nutzerin – auch wenn noch keine Daten über frühere Zyklen vorliegen – recht genau den Menstruationsbeginn zu prognostizieren.

So stellten wir beispielsweise fest, dass sich in den ersten drei Zyklen der Menstruationsbeginn relativ gut anhand der 1. höheren Messung berechnen lässt. Wenn Daten über frühere Zyklen vorliegen, lassen wir ebenfalls den Median der vergangenen Zykluslängen mit in die Vorhersage einfließen.

Mit der früheren Vorgehensweise lag die Menstruationsprognose im Schnitt bis zu drei Tage „daneben“, war damit aber immer noch um 20 % besser als das eingangs erwähnte arithmetische Mittel.

Die neue Vorhersagemethode ist im Durchschnitt bis auf 1,5 Tage genau. Die Vorhersage wird genauer, je mehr Daten über frühere Zyklen vorliegen. Nach fünf Zyklen schwankt die Vorhersage nur noch um 1,25 Tage, nach 20 Zyklen nur noch um 1,1 Tage.

Was wir nicht gemacht haben

Das neue Vorhersagemodell gilt global für alle Nutzerinnen. Wir haben nicht für jede Nutzerin ein eigenes Modell trainiert, weil dafür pro Nutzerin zu viele Daten benötigt werden, um einigermaßen aussagekräftige Ergebnisse zu erzielen (mindestens 20 Zyklen).

Aufgrund der oben erwähnten Schwierigkeiten denken wir, dass eine 100 % genaue Vorhersagemethode derzeit nicht möglich ist.

Zusammenhang zwischen 1.hM, Hochlagenlänge und Zykluslänge

Die Daten zeigen, dass die zweite Zyklusphase (Hochlage) von der ersten Zyklusphase abhängt (schwache inverse Korrelation). Ist die Tieflage beispielsweise länger als 18 Tage, dauert die darauffolgende Hochlage im Mittel etwa 12 Tage und ist damit einen Tag kürzer als wenn die Tieflage kürzer als 18 Tage ist. Auch wenn die Abhängigkeit nur gering ist, können wir sie für die Menstruationsvorhersage nutzen.

Wir stellten weiterhin fest, dass die Hochlagenlänge bei verschiedenen Frauen sehr konstant ist. So schwanken die Hochlagenlängen aller Frauen etwa nur um zwei Tage (Standardabweichung = 1,8). Im Gegensatz dazu schwanken die Tieflagenlängen im Mittel sogar um mehr als vier Tage (Standardabweichung = 4,4).

Vorhersage der Menstruationsdauer

Neben der Menstruationsprognose war für uns auch die Frage interessant, wann die Menstruation wieder vorbei ist. Dazu haben wir die gleichen 85.000 anonymisierten Zyklen betrachtet.

Viele Frauen tragen auf myNFP die Stärke der Blutung ein, so wie sie sie subjektiv empfinden. Interessanterweise lässt sich praktisch keine Voraussage über die Menstruationsdauer treffen, wenn Schmierblutungen mit einbezogen werden.

Ohne Schmierblutungen lässt sich die Menstruationsdauer am besten vorhersagen, indem man schrittweise Informationen über vorherige Menstruationslängen einfließen lässt. Je mehr frühere Daten bekannt sind, desto aussagekräftiger ist das arithmetische Mittel der bisherigen Menstruationslängen und wird dementsprechend stärker gewichtet. Gleichzeitig steigt auch die Genauigkeit der Vorhersage.

Überraschenderweise hat die Anzahl der Tage mit einer leichten Blutung eine hohe Aussagekraft über die Menstruationsdauer. Ob die Blutungen zu Menstruationsbeginn stark oder normal ausfallen unterliegt oftmals äußerer Einflüsse und ist subjektiv auch nicht immer eindeutig zu kategorisieren. Tage mit leichter Blutung haben nicht nur den größten Anteil an der Menstruationslänge, sie schwanken auch weniger.

Das neue Verfahren arbeitet zuverlässiger als das alte Verfahren. Das bedeutet aber nicht, dass für jede Frau in jedem Zyklus ein perfektes Ergebnis erzielt werden kann. Insbesondere dann, wenn bereits mehr als 10 Zyklen vorliegen, fällt die Verbesserung relativ gering aus.

Vielen Dank an Sebastian für die tolle Arbeit.

Über Dr. Sebastian Briesemeister

Sebastian

Dr. Sebastian Briesemeister hat an den Universitäten Jena und York Bioinformatik studiert und seine Doktorarbeit im Themenbereich Maschinelles Lernen verfasst. Aktuell nutzt er maschinelle Lernverfahren zur Datenanalyse und Optimierung der Leistungen von Internet-Portalen.