Schüler, die dort gewannen, wo ihre Lehrer verloren: Eine neue Definition von Brillanz ist geboren
Juli 2025: In einem australischen Prüfungsraum versuchen Hunderte von Teenagern, während die Uhr unaufhörlich tickt, einige der schwierigsten und anspruchsvollsten Mathematikaufgaben zu lösen. Sie haben weder Taschenrechner noch Internet. Nur Papier, Bleistifte und ihren Einfallsreichtum. Das Außergewöhnliche dieses Jahr war nicht nur das menschliche Talent, das sich bei der Internationalen Mathematik-Olympiade (IMO) versammelte, sondern die Tatsache, dass künstliche Intelligenz erstmals etwas vor einem Jahr Undenkbares vollbrachte . Und während die Maschinen glänzten wie nie zuvor … haben die Menschen gewonnen, zumindest vorerst.
Eine weitere Frage, die diese Geschichte aufwirft, ist, ob sich mit der zunehmenden Bedeutung der KI in der Wissenschaft zwangsläufig die Frage stellt: Was bedeutet es, in einer Ära brillant zu sein, in der KI fast alles lösen könnte?
Die IMO ist kein gewöhnlicher Wettbewerb. Zwei Tage lang müssen die Schüler sechs Aufgaben bewältigen, die nicht nur Logik und Technik, sondern auch Kreativität und mathematisches Gespür erfordern. Die Fragen, die von Algebra bis Zahlentheorie reichen, sind so konzipiert, dass sie einzigartig sind. Wenn sie Ähnlichkeiten mit bereits irgendwo auf der Welt gelösten Aufgaben aufweisen, werden sie verworfen.
Zu den Teilnehmern dieses Jahres zählten einige der klügsten jungen Köpfe der Welt, und zu den geladenen Gästen zählten führende Technologieunternehmen. Besonders hervorzuheben ist das KI-Modell Gemini Deep Think von Google DeepMind. Diese KI wurde nach denselben Kriterien und mit demselben Zeitaufwand wie Menschen bewertet: viereinhalb Stunden pro Prüfung, ohne externe Hilfe. IMO befasst sich mit originellen, neuartigen und unkonventionellen Problemen , während eine KI mit einer riesigen Menge an Problemen trainiert wird und den Prozess wiederholt. Nichtsdestotrotz gewann die KI die Goldmedaille, indem sie fünf der sechs Probleme perfekt löste und 35 von 42 möglichen Punkten erreichte. Dies war jedoch nicht das beste Ergebnis der Veranstaltung.
26 Studenten übertrafen die Maschinen. Aus dem amerikanischen Team, das hinter den Chinesen landete, stach Alexander Wang hervor, ein Student aus New Jersey, der seine dritte Goldmedaille in Folge gewann und laut Wall Street Journal einer der höchstdekorierten jungen Mathematiker aller Zeiten ist. Der andere war Qiao „Tiger“ Zhang , der sich tapfer dem gefürchteten Problem 6 stellte, dem schwierigsten dieses Jahres. Dieses letzte Problem, ein kombinatorisches Problem, stellte sowohl die KIs als auch 569 der 630 Teilnehmer vor ein Rätsel. Nur sechs Studenten lösten es vollständig.
Zhang gehörte zwar nicht dazu, doch seine Teillösung war mehr wert als die völlige Ideenlosigkeit der Maschinen. Dennoch sagte Zhang selbst voraus, dass die KI im nächsten Jahr die volle Punktzahl erreichen könnte. „An dem Tag, an dem eine KI Problem 6 lösen kann“, sagte Zhang, „würde ich mir Sorgen machen.“
-
Betrachten Sie ein 2025 x 2025 großes Raster aus Einheitsquadraten. Matilda möchte mehrere rechteckige Kacheln, möglicherweise in unterschiedlichen Größen, so auf dem Raster platzieren, dass jede Seite jeder Kachel auf einer Rasterlinie liegt und jedes Einheitsquadrat von höchstens einer Kachel bedeckt ist. Bestimmen Sie die Mindestanzahl an Kacheln, die Matilda platzieren muss, damit jede Zeile und jede Spalte des Rasters genau ein Einheitsquadrat enthält, das von keiner Kachel bedeckt ist.
Und als Thang Luong, Leiter des Google DeepMind-Teams, gefragt wurde , ob dies das letzte Jahr sein wird, in dem der Mensch die KI überholt, sagte er: „Das könnte sehr gut sein.“
Die Entwickler dieser KIs feierten ihre Erfolge. Google pries Geminis Leistung als historischen Sprung, nicht nur wegen der erreichten Punktzahl, sondern auch, weil das Modell im Gegensatz zum Vorjahr direkt in natürlicher Sprache argumentieren konnte, ohne die Probleme in Code übersetzen zu müssen. Außerdem wurde die Testzeit eingehalten – eine Leistung, die vor einem Jahr noch undenkbar gewesen wäre. OpenAI wiederum testete sein Modell außerhalb der offiziellen Veranstaltung, aber mit unabhängigen Gutachtern und denselben Problemen. Das Ergebnis war dasselbe: Gold.
Wenige Monate vor diesem Wettbewerb , im Mai 2025, fand auf dem Campus der University of California in Berkeley ein ungewöhnliches Treffen statt. Dreißig der weltweit renommiertesten Mathematiker trafen sich zu einem geheimen Treffen – nicht um miteinander zu debattieren, sondern um sich einer künstlichen Intelligenz zu stellen: o4-mini. Ein hochmodernes Sprachmodell von OpenAI, das mit beispielloser Geschwindigkeit und Genauigkeit schlussfolgern kann. Die Teilnehmer versuchten, hochkomplexe Probleme zu stellen, die die KI überfordern würden, doch diese zeigte eine beispiellose Problemlösungsfähigkeit. Die Teilnehmer bemerkten, es sei gewesen, als säße man vor einem äußerst kompetenten Doktoranden – „sogar noch kompetenter“.
Bedeutet dies, dass diese Forscher dort unterlegen waren, wo die jungen Forscher triumphierten? Die Antwort lautet nein, denn Kontext und Problemlösung sind unterschiedlich, aber es gibt einen interessanten Hintergrund.
Fragt man Gemini selbst, kommt man zu dem Schluss, dass die Studierenden in der IMO die KI bei der Lösung von Problemen, die für wettbewerbsorientierte Personen konzipiert sind, mit Kreativität, Genauigkeit und mathematischer Intuition in begrenzter Zeit schlagen . Die IMO-Probleme sollen Einfallsreichtum und Querdenken fördern, nicht nur rohe logische Kraft, und KIs tun sich mit solchen Problemen, die nicht offensichtliche Denksprünge erfordern, immer noch schwer. Bei formalen, strukturierten oder stark explorativen Problemen, wie denen der reinen Forschung, gewinnt die KI jedoch zunehmend .
Erfahrene Mathematiker arbeiten an der Entdeckung neuer Theorien, nicht nur an der Lösung von Rätseln. Der Vergleich zeigt, dass der Weg der menschlichen Mathematik nicht geradlinig verläuft; man kann sich durch die Lösung von Aufgaben anderer auszeichnen (meiner Meinung nach) und dann versuchen, Probleme zu schaffen, die noch niemand gelöst hat. Es ist also nicht so, dass einige verlieren und andere gewinnen. Es liegt daran, dass sie sich in unterschiedlichen Stadien desselben Prozesses befinden.
Einige der Entwickler dieser Maschinen sehen diese Entwicklung keineswegs als Bedrohung, sondern als neue Form der Zusammenarbeit. „Diese KI ist wie ein neuer Taschenrechner“, sagte Thang Luong, Leiter des DeepMind-Teams. „Ein Werkzeug, das uns weiterbringt, nicht ersetzt.“
Zhang selbst sieht die KI, obwohl er sie besiegt hat, nicht als Rivalen, sondern vielmehr als Ansporn, besser, tiefer und mutiger zu denken. Der ehemalige Goldmedaillengewinner und aktuelle DeepMind-Forscher Junehyuk Jung stimmt dem zu: Wirklich komplexe Probleme – wie das berühmte Problem 6 – werden Maschinen noch jahrelang vor Herausforderungen stellen.
Die Mathematiker bei dem geheimen Treffen überlegten, ob sie irgendwann zu „Fragenstellern“ werden könnten, die KIs zu neuen Entdeckungen führen. Und wenn ja, wissen sie noch nicht, was das bedeuten würde.
Vor einigen Jahren bedeutete brillante Mathematik unter anderem, Probleme lösen zu können, die sonst niemand lösen konnte. Heute reicht das nicht mehr aus. Wenn Maschinen dasselbe Niveau erreichen, liegt die neue Dimension der Genialität woanders: vor allem in der Fähigkeit, neue Fragen zu formulieren. Denn KI kann zwar Probleme geschickt lösen, weiß aber noch nicht, welche Fragen es wert sind, gestellt zu werden.
ABC.es