Kunstmatige intelligentie verandert het landschap van wiskundig onderzoek snel, waardoor zelfs amateurliefhebbers al lang bestaande, onopgeloste problemen kunnen aanpakken. Recente ontwikkelingen laten zien dat AI-modellen, met name grote taalmodellen zoals ChatGPT, een kritische drempel hebben overschreden in wiskundig redeneren, wat professionele wiskundigen verraste en duidde op een fundamentele verschuiving in de manier waarop wiskundige vooruitgang wordt geboekt.
De erfenis van het Erdő-probleem
De focus van deze vooruitgang ligt op de problemen van de legendarische Hongaarse wiskundige Paul Erdős. Erdős, productief in zijn carrière van zes decennia, specialiseerde zich in bedrieglijk eenvoudige maar uitzonderlijk moeilijke vragen op het gebied van combinatoriek, getaltheorie en andere gebieden. Meer dan 1.000 van zijn onopgeloste vermoedens bleven tot voor kort open en dienden als maatstaf voor vooruitgang in hun respectievelijke disciplines.
Deze problemen zijn weliswaar elementair om te stellen, maar vereisen vaak nieuwe inzichten om op te lossen. Wiskundigen zijn begonnen deze uitdagingen te introduceren in AI-tools zoals ChatGPT, aanvankelijk als experiment. Onderzoekers hebben sinds oktober een duidelijke verandering in de AI-prestaties waargenomen, waarbij modellen nu in staat zijn relevante literatuur te identificeren en zelfs gedeeltelijke of geheel nieuwe oplossingen te genereren.
Van hallucinaties tot geldige bewijzen
Thomas Bloom van de Universiteit van Manchester, die een catalogus van Erdős-problemen bijhoudt, herinnert zich dat AI aanvankelijk worstelde met elementaire wiskundige taken. “Vroeger verzon ChatGPT alleen maar papieren, volledig hallucinerend”, zegt hij. Recente verbeteringen hebben het echter mogelijk gemaakt bestaand onderzoek effectief op te halen en te analyseren.
Student Kevin Barreto en amateurwiskundige Liam Price zijn voorbeelden van deze verschuiving. Ze voerden Erdős probleem #728 door naar ChatGPT-5.2 Pro, wat een bewijs opleverde dat als “best aardig en verfijnd” werd beschouwd. Vervolgens gebruikten ze Aristoteles, een AI-tool gemaakt door Harmonic, om het bewijs te verifiëren met behulp van Lean, een formele wiskundige programmeertaal. Dit geautomatiseerde verificatieproces bespaart onderzoekers kostbare tijd.
Beperkte winst, maar aanzienlijke implicaties
Medio januari hadden AI-tools zes Erdős-problemen volledig opgelost, hoewel later bleek dat vijf al eerder waren opgelost. De enige geverifieerde nieuwe oplossing kwam van Barreto en Price voor probleem #205. Bovendien heeft AI gedeeltelijke oplossingen bijgedragen voor zeven andere problemen, waarvan sommige nieuw lijken te zijn.
Het debat concentreert zich nu op de vraag of AI echt nieuwe ideeën bewijst of eenvoudigweg vergeten oplossingen herontdekt. Bloom stelt dat het vermogen van AI om problemen in nieuwe vormen te vertalen en obscure papieren bloot te leggen waardevol is. “Veel van deze papieren zou ik niet hebben gevonden… misschien zou niemand het al veel langer hebben gevonden zonder dit soort hulpmiddelen”, benadrukt hij.
De toekomst van wiskundig onderzoek
Hoewel de huidige vooruitgang zich richt op relatief eenvoudige problemen, zijn deskundigen het erover eens dat de impact van AI verder zal reiken dan eenvoudige oplossingen. Terence Tao, van de Universiteit van Californië, Los Angeles, suggereert dat AI een meer empirische, grootschalige benadering van wiskunde mogelijk zou kunnen maken.
“We zijn zo beperkt in de hoeveelheid deskundige aandacht die we hebben, dat we niet naar 99 procent van alle problemen kijken die we zouden kunnen bestuderen”, legt Tao uit. AI zou wiskundigen in staat kunnen stellen honderden problemen te onderzoeken, verschillende methoden te testen en veelbelovende gebieden voor verder onderzoek te identificeren – iets wat voorheen onmogelijk was vanwege menselijke beperkingen.
Deze verschuiving zou de wiskundige verkenning kunnen democratiseren, waardoor onderzoekers kunnen putten uit bredere kennisbases en ontdekkingen kunnen versnellen. De huidige mogelijkheden van AI zijn nog steeds bescheiden vergeleken met de moeilijkste open problemen, maar zelfs deze “groene scheuten” vertegenwoordigen een fundamentele verandering in de manier waarop wiskunde wordt beoefend.



















