OpenAI kündigte am Dienstag die qualifizierte Ankunft von GPT-4 an, seinem neuesten Meilenstein in der Entwicklung von Call-and-Response-Modellen für tiefes Lernen, die ihre fleischlichen Vorbilder in wichtigen Prüfungen zu übertreffen scheinen.
Laut OpenAI zeigt das Modell „Leistungen auf menschlichem Niveau bei verschiedenen professionellen und akademischen Benchmarks“. GPT-4 kann eine simulierte Anwaltsprüfung unter den besten 10 Prozent der Testteilnehmer bestehen, während sein Vorgänger GPT-3.5 (die Grundlage von ChatGPT) bei den unteren 10 Prozent lag.
GPT-4 hat auch bei verschiedenen anderen Prüfungen gut abgeschnitten, z. B. beim SAT Math (700 von 800). Es ist jedoch nicht universell einsetzbar, da es bei der AP English Language and Composition nur 2 Punkte erzielte (14. bis 44. Perzentil).
Eine Sache, die man beachten sollte: Die GPT-Reihe von OpenAI ist von Natur aus eine Familie von Wiederkäuermaschinen, die auf Material zurückgreift, mit dem sie trainiert wurde, und es neu zusammensetzt, um Ihre Anfrage zu beantworten. Manchmal liegt sie richtig, manchmal falsch. Dass sie sich bei Prüfungen an Details erinnern kann, mag für Sie nicht besonders beeindruckend sein, oder es ist eher ein Kommentar zu den Prüfungen, die wir Menschen ablegen müssen.



