Die Frage, ob KI wissenschaftlich argumentieren kann, gehört definitiv zu den spannendsten, die derzeit diskutiert werden.
Ich hatte bisher nur einen flüchtigen Blick auf das Thema geworfen und war hin und her gerissen zwischen dem oben erwähnten Spektrum-Artikel, der sich auf das 4o-Modell von OpenAI bezogen hatte und einem eher zurückhaltenden Beitrag von Sabine Hossenfelder.
Allerdings stoße ich gerade auf einen Bericht, der bereits im Juli 24 auf Golem erschienen ist, und der sich um das Abschneiden von Googles Deepmind bei der internationalen Mathematikolympiade dreht. Hier sehen wir auch einige Details zur implementierten Methodik. Überzeugt Euch selbst: da geht mittlerweile einiges.
Festzuhalten bleibt auch auf diesem Level, dass die Systeme als Werkzeuge betrachtet werden sollten. Extrem fortgeschrittene zwar, aber Werkzeuge. Die sachgerechte Benutzung derselben bleibt eine Aufgabe, die eine hohe Qualifikation erfordert. Die Idee, Expertise ersetzen zu können, um damit Kosten einzusparen, wird sich hingegen in vielen Anwendungsgebieten als teurer Fehler erweisen.