Google Research hat MedGemma 1.5 in die Freiheit entlassen. Während andere KI-Modelle immer fetter werden, um überhaupt geradeaus denken zu können, geht Google den entgegengesetzten Weg. Das Modell ist mit 4 Milliarden Parametern fast schon schmächtig, was allerdings kein Zeichen von Unwissenheit ist, sondern von Effizienz. Der Clou dabei: Die KI passt damit auf Hardware, die tatsächlich in einem Krankenhaus stehen kann, ohne dass man dafür ein eigenes Kraftwerk oder eine Standleitung ins Silicon Valley benötigt. On-Premise ist hier das Zauberwort für alle, die Patientendaten ungern auf Wanderschaft schicken.
Die neue Version hat im Vergleich zum Vorgänger aus 2025 ordentlich dazugelernt. Konnte die erste Generation lediglich zweidimensionale Bilder betrachten, jongliert MedGemma 1.5 jetzt mit 3D-Datensätzen aus dem CT oder MRT. Es vergleicht zudem zeitliche Verläufe - eine Fähigkeit, die bisher eher menschlichen Radiologen vorbehalten war, die nach dem dritten Kaffee mühsam Voraufnahmen aus dem Archiv kramen. Ob Lungenbefunde, Gewebeschnitte oder die Netzhaut: Die KI schaut hin und liefert eine Einschätzung, die in internen Tests deutlich präziser ausfällt als zuvor.
Bei der Klassifizierung von CT-Befunden ist die Genauigkeit von 51 auf 65 Prozent gestiegen. Das klingt für Laien vielleicht erst einmal so, als würde die KI bei jedem dritten Patienten würfeln, ist aber in der Welt der medizinischen Bildanalyse ein beachtlicher Sprung für ein Modell dieser Größenklasse. Auch beim Extrahieren von Daten aus Laborberichten schlägt sich das System mit einem F1-Score von 78 Prozent wacker. Man merkt: Google möchte, dass die KI nicht nur klug daherredet, sondern handfeste Verwaltungsarbeit abnimmt.
Damit die Hände beim Dokumentieren frei bleiben, gibt es MedASR dazu. Das ist Googles Antwort auf die oft kryptische medizinische Spracherkennung. Das Modell ist darauf spezialisiert, Arztbriefe und Fallbesprechungen zu transkribieren, ohne über Fachbegriffe zu stolpern, die ein normales Smartphone-Diktiergerät als Fantasiewörter abtun würde. In Kombination mit MedGemma entsteht so ein Werkzeugkasten, der Text, Bild und Ton verarbeitet - quasi der multimodale Oberarzt für die Hosentasche.
Dass Google das Ganze als Open Source veröffentlicht, ist natürlich nicht nur reine Nächstenliebe. Man hofft darauf, dass die weltweite Entwickler-Community das Finetuning übernimmt und die Modelle für spezielle Fachbereiche optimiert. Wer besonders kreativ ist, darf sich sogar um 100.000 US-Dollar Preisgeld bei der "MedGemma Impact Challenge" bewerben. Ein nettes Taschengeld für alle, die helfen, die KI-Infrastruktur im Gesundheitswesen zu zementieren. In Taiwan nutzt die Gesundheitsverwaltung das System bereits, um Lungenkrebspatienten vor Operationen einzuschätzen - es ist also mehr als nur ein nettes Labor-Experiment.
Kommentare (0)