Weniger Tierversuche dank maschinellem Lernen

Forschende der Eawag benutzen Computeralgorithmen, um die Toxizität von chemischen Substanzen auf Fische vorherzusagen. Mit maschinellem Lernen lassen sich Prioritäten für geplante Experimente setzen und längerfristig Tierversuche drastisch reduzieren.

Barbara Vonarburg 26.04.2022

Unzählige chemische Substanzen, darunter Düngemittel und Pestizide aber auch pharmazeutische Substanzen und Industriechemikalien, gelangen in das Grundwasser, die Seen und Flüsse. «Wir wollen wissen, wie sich diese Chemikalien auf die Lebewesen im Wasser auswirken, ob sie giftig sind oder nicht», sagt Marco Baity-Jesi, Leiter der Eawag-Gruppe Datenwissenschaften. Dazu werden typischerweise Fische in verschiedenen Tanks einer Substanz in unterschiedlicher Konzentrationen ausgesetzt. Diese Tierversuche, die für die Fische tödlich enden, sind ethisch umstritten und ausserdem kostspielig. «Anstatt solche Experimente durchzuführen, wollen wir die Auswirkung von Chemikalien auf Fische mit Methoden des maschinellen Lernens voraussagen», erklärt der Physiker Baity-Jesi. Für dieses Projekt arbeitet sein Team mit der Gruppe von Kristin Schirmer zusammen, welche experimentelle Alternativen zu Versuchen mit Fischen mittels Zelllinien vom Fisch entwickelt.

Für ihr Ausgangsmaterial nutzten die Forschenden die Datenbank der Umweltschutzbehörde der USA. Darin enthalten sind die Resultate von Versuchen mit knapp 2200 Chemikalien, die an 345 verschiedenen Fischarten getestet wurden. Insgesamt konnten die Forschenden gut 20'000 Einträge verwenden. «Das ist kein riesiger Datensatz, aber er reicht für unsere Zwecke», sagt der Physiker. Nach der Analyse und Aufbereitung der Daten schrieb sein Team die Computersoftware für verschiedene Modelle des maschinellen Lernens, die sich für den vorbereiteten Input eigneten. Den Grossteil der Daten verwendeten die Forschenden als Trainingsmaterial, mit dem sie ihre Modelle für maschinelles Lernen fütterten. Einen kleinen Teil behielten sie als Testdatensatz zurück, damit sie prüfen konnten, wie gut die berechneten Vorhersagen der Maschine mit den experimentellen Ergebnissen übereinstimmten.

Präzise Prognosen

In einer ersten Studie haben die Forschenden jetzt ihre Resultate veröffentlicht. Aufgrund der erlernten Muster können die Modelle blitzschnell vorhersagen, ob eine Chemikalie für eine Fischart mehr oder weniger giftig ist. Die Prognosen des Computers erwiesen sich zu über 90% als korrekt. «Die Modellvorhersagen können nicht ganz perfekt sein», erklärt Baity-Jesi: «Denn die Experimente sind es ebenfalls nicht.» So findet man oft widersprüchliche Angaben zu Versuchen mit einer bestimmten Substanz und Fischart. «Wenn man ein Experiment mit derselben Chemikalie zweimal durchführt, kann sie in zwei verschiedenen Toxizitätskategorien landen», sagt der Forscher: «Die Modelle können aber nicht besser sein als die Daten, von denen sie lernen.»

Erstaunt hat die Studienautoren, dass ein neues Modell, das in der Humantoxikologie erfolgreich ist, keineswegs genauere Resultate lieferte als die verwendeten Standardmodelle. «Insgesamt sehen unsere Ergebnisse sehr gut aus", sagt Baity-Jesi: "Aber obwohl unsere Modelle online sind und von jedermann genutzt werden können, sind noch viele weitere Tests erforderlich, bevor die Maschine Tierversuche ersetzen und in der Regulatorik verwendet werden kann.»

Von Fischen zu Wirbellosen und Algen

So stellen die aktuellen Ergebnisse nur einen Bruchteil aller möglichen Chemikalien und Organismen dar, die man testen möchte. Um den Anwendungsbereich der Modelle zu erweitern, braucht es ein breiteres Spektrum an Daten sowohl für das Training der Algorithmen als auch für deren Tests. Als nächstes will die Forschungsgruppe neben Fischen denn auch Wirbellose und Algen in ihre Arbeit einbeziehen. Zudem sollen in Zukunft auch die Daten von Experimenten mit Fischzelllinien die Modelle stützen. Wie erfolgreich diese Arbeiten von Schirmers Gruppe sind, zeigte sich im vergangenen Jahr, als die OECD den an der Eawag entwickelten Fischzelllinientest als neue Richtlinie bei der Zulassung von Chemikalien anerkannte.

«Je mehr Daten man den Modellen präsentiert, umso besser werden sie», erklärt Baity-Jesi. Man müsse zudem darauf achten, dass man die Modelle dort trainiert habe, wo man sie auch einsetzen wolle. Weichen Chemikalien oder Organismen zu sehr von denjenigen ab, die in den Experimenten getestet wurden, sinkt auch die Treffsicherheit des maschinellen Lernens. Es gilt also, Grenzen für dessen Zuverlässigkeit zu erkennen.

Auch in Zukunft müssen wohl die Computervorhersagen in einigen Fällen durch Tests bestätigt werden. «Deshalb ist es unwahrscheinlich, dass das maschinelle Lernen allein in der Lage sein wird, Tierversuche vollständig zu ersetzen, aber es kann sie sicher drastisch reduzieren», schreiben die Forschenden. Und Baity-Jesi sieht schon jetzt eine wichtige Einsatzmöglichkeit für die Computeralgorithmen: «Hat man beispielsweise nur Ressourcen für fünf Versuche, aber Tausende von Chemikalien und Tierarten, so können unsere Modelle sagen, welche Substanzen und Tiere zuerst getestet werden sollten.» Das maschinelle Lernen hilft also, Prioritäten in der Umweltforschung zu setzen.