Extreme Wetterereignisse wie Stürme oder Dürren entstehen durch komplexe Wechselwirkungen zwischen Atmosphäre, Landoberfläche und Wasserkreislauf. Forschende aus dem ETH-Bereich haben nun ein neues KI-Modell entwickelt, das diese Zusammenhänge eigenständig analysieren kann. Das sogenannte Earth System Foundation Model (ESFM) verarbeitet dabei unterschiedlichste Umwelt- und Wetterdaten gemeinsam und kann sogar fehlende Informationen ergänzen. Ziel ist es, Wetter- und Klimaprozesse präziser zu verstehen und langfristig bessere Vorhersagen zu ermöglichen.
Supertaifun Doksuri als Praxistest
Die Folgen waren gravierend: In kürzester Zeit verstärkte sich der Tropensturm Doksuri im Juli 2023 zu einem Supertaifun. Aussergewöhnlich starke Winde rissen entlang der Küsten Chinas und der Philippinen Dächer von Häusern, entwurzelten Bäume, und sintflutartige Regenfälle überfluteten Strassen und Wohngebiete. Vielerorts kam das öffentliche Leben vorübergehend zum Erliegen.
Extreme Ereignisse wie der Supertaifun Doksuri sind für Wetter- und Klimamodelle besonders schwer vorherzusagen, da sie aus komplexen Wechselwirkungen zwischen Atmosphäre, Landoberfläche und Wasserkreislauf entstehen. Forschende aus dem ETH-Bereich haben nun ein neues Modell der künstlichen Intelligenz (KI) vorgestellt, das genau diese Rückkopplungen selbstständig – und ohne menschliche Anleitung – erlernt hat und im Vergleich zu bisherigen KI-Modellen präziser versteht, wie Luft, Land und Wasser auf der Erde zusammenspielen.
Die Forschenden testeten ihr Modell am Beispiel des Supertaifuns Doksuri. Dieser war nicht Teil der Trainingsdaten. Dennoch sagte ESFM die Windstärke über mehrere Tage hinweg mit bemerkenswerter Genauigkeit voraus und bildete zugleich realistisch ab, wo sich der Sturm jeweils befand, wie schnell er sich bewegte und wie er sich räumlich ausdehnte. Dabei zeigte sich, wie gut das neue Modell sehr grosse, komplexe und heterogene Datensätze gemeinsam verarbeiten kann.
KI verknüpft Luft, Land und Wasser
Das neue Earth System Foundation Model (ESFM) behandelt atmosphärische und hydrologische, also wasserbezogene Prozesse nicht isoliert, sondern bildet sie als Teil des vernetzten Systems der Erde ab.
«Bisherige KI-Wettermodelle konzentrieren sich oft stark auf die Atmosphäre. Unser Modell dagegen verknüpft gezielt atmosphärische Wetterdaten mit hydrologischen und landbezogenen Daten. Auf dieser Grundlage erkennt die KI zentrale Muster, Trends und Zusammenhänge im Wettergeschehen auf der Erde – und erstellt darauf basierend Prognosen, selbst wenn wichtige Daten fehlen», erklärt Fanny Lehmann.
Sie ist Mathematikerin, ETH AI Center Postdoctoral Fellow und Mitglied des Teams, das das neue Modell entwickelt hat.
«Die eigentliche Stärke unseres Modells liegt darin, dass es die für das Wetter entscheidenden Wechselwirkungen aus verschiedenen Datenquellen erlernt. Dadurch kann das ESFM sehr unterschiedliche und schwer vergleichbare Datentypen zusammenführen und erstmals gemeinsam auswerten.»
Umgang mit unterschiedlichen und fehlenden Daten
Der integrative Ansatz des ESFM entspricht einem Bedarf in den Klima- und Umweltwissenschaften. In der Forschungspraxis sind Daten oft sehr unterschiedlich: Manche stammen aus Satellitenbildern, andere aus Wetterballons, Bodenstationen oder weiteren Sensoren. Entsprechend reichen sie von hochaufgelösten, kurzfristigen Messungen bis hin zu grossräumigen, langfristigen Beobachtungen. Auch die Datentypen unterscheiden sich stark: Während Satellitenbilder und Klimamodelle ihre Daten in Form grossflächiger Rasterkarten liefern, erfassen Bodenstationen oder Messbrunnen typische Grössen wie Temperatur, Luftdruck, Windgeschwindigkeit oder Wasserstand punktuell an bestimmten Orten und zu definierten Zeitpunkten.
Um diese unterschiedlichen Umweltdaten zusammenzuführen, verfolgt das ESFM einen integrativen, mehrstufigen Ansatz: Statt alle Daten von Beginn an in ein einheitliches Format zu zwingen, behandelt es sie zunächst je nach Typ getrennt – ob es Satelliten- oder Stationsdaten sind – und versieht sie mit Angaben dazu, wann und wo sie gemessen wurden. So lassen sich sehr unterschiedliche Daten in einem gemeinsamen räumlichen und zeitlichen Rahmen zusammenführen, ohne dass die datenspezifische Information dabei verloren geht. Auf dieser Grundlage erlernt das Modell die typischen, wiederkehrenden Prozessketten und die grundlegenden Wirkungszusammenhänge zwischen Land, Luft und Wasser.
Präzisere Vorhersagen trotz Datenlücken
«Frühere KI-Modelle für Wettervorhersagen wurden – anders als ESFM – oft nur mit einem einzelnen Datentyp oder wenigen, ähnlich aufgebauten Datensätzen trainiert», erklärt Firat Ozdemir, leitender Entwickler des ESFM-Teams und Senior Data Scientist am gemeinsamen Swiss Data Science Center von ETH Zürich und EPFL. «Sie verlieren oft an Leistungsfähigkeit, wenn sie mit sehr heterogenen oder unvollständigen Daten arbeiten müssen. ESFM hingegen integriert Daten aus mehreren Quellen und schliesst Datenlücken deutlich effizienter.»
«Das ESFM ist weder ein klassisches Klimamodell noch ein reines Wettervorhersage- oder spezielles Sturmwarnmodell, sondern es gehört zu einer eigenen Modellkategorie, die als flexible Basis für verschiedene Aufgaben in der Klima- und Wetterforschung dienen kann», sagt der Atmosphärenwissenschaftler Sebastian Schemm, Professor an der University of Cambridge und zuvor an der ETH Zürich. «Sein Vorteil liegt in einem erlernten Systemverständnis, dank dem es in vielen Fällen auch bei unvollständigen oder lückenhaften Daten plausible Vorhersagen liefern kann.»
Das ESFM hingegen ist nun gezielt darauf ausgelegt, mit fehlenden Daten umzugehen und unvollständige Beobachtungen intern zu rekonstruieren – etwa lückenhafte Satellitenbilder. Nach dem Training gelingt es dem Modell sogar selbst bei Satellitendaten, bei denen nur rund drei Prozent der Bildpunkte verfügbar sind, zuverlässige Vorhersagen zu liefern.
Die Forschenden, zu denen auch Benedikt Soja, Professor für Weltraumgeodäsie an der ETH Zürich, zählt, konnten sowohl für Wetterdaten aus Bodenstationen als auch für den langfristigen globalen ERA5-Datensatz zeigen, dass ihr Modell Datenlücken zuverlässig schliesst. Darauf aufbauend kann das Modell plausible Vorhersagen zum Wettergeschehen erstellen.
Flexible Einsatzmöglichkeiten des Modells
«Durch das Training mit sehr unterschiedlichen Datentypen erwerben Modelle wie das ESFM eine Art Grundwissen und können flexibel vielfältige Aufgaben lösen. In der KI-Forschung gelten sie daher als Basismodelle – oder auf Englisch: Foundation Models», sagt Torsten Hoefler, Informatikprofessor an der ETH Zürich, der am Supercomputing-Zentrum CSCS in Lugano federführend an neuen KI-Ansätzen mitwirkt.
Wie alle Basismodelle lässt sich das ESFM für verschiedene Aufgaben einsetzen und zudem gezielt an konkrete Anwendungen anpassen – in einem Prozess, der als Fine-Tuning bezeichnet wird. Das Team konnte zeigen, dass das ESFM grundlegende physikalische Gesetzmässigkeiten konsistent und zuverlässig anwendet – auch bei neuen Fällen oder Messgrössen, für die es nicht speziell trainiert wurde. Künftig können das ESFM oder gezielt feinjustierte Versionen somit zuverlässige Vorhersagen von Wetter- und Wasserprozessen liefern. «Wir wollen die Stärke des Modells für Bereiche wie Landwirtschaft, Biodiversität und Hydrologie erschliessen», sagt Mathieu Salzmann, Senior Scientist an der EPFL und stellvertretender Chief Data Scientist am Swiss Data Science Center (SDSC).
———————————————————————————————————————————————————————————————————————————————————————————————————————————-Originalpublikation: Ozdemir F, Cheng Y, Mohebi S, Lehmann F, Adamov S, Trentini L, Huang L, Lingsch L, Zhang Z, Fuhrer O, Soja B, Mishra S, Hoefler T, Schemm S, Salzmann M: ESFM – A foundation model framework for heterogeneous data integration. EGU General Assembly 2026, Wien, 3. –8. Mai 2026, EGU26-18011. DOI: 10.5194/egusphere-egu26-18011