OpenAI enthüllt GDPVal: KI übertrifft Menschen in 44 Berufen
Artikel anhörenAutomatisch generierte Sprachausgabe

Die Leistungsfähigkeit Künstlicher Intelligenz erreicht eine neue Dimension.
Mit der Veröffentlichung des GDPVal-Benchmarks präsentiert OpenAI ein wissenschaftliches Verfahren, das erstmals systematisch vergleicht, wie gut KI-Modelle im Vergleich zu menschlichen Fachkräften reale Arbeitsaufgaben bewältigen.
Was steckt hinter GDPVal?
Laut dem offiziellen Bericht „Measuring the performance of our models on real-world tasks“ (OpenAI, 2025) ist GDPVal ein neues Bewertungssystem, das die praktische Leistungsfähigkeit von Sprachmodellen wie GPT-4o, GPT-4-Turbo und GPT-5 untersucht.
Dabei wurden Aufgaben aus neun zentralen Wirtschaftssektoren analysiert – unter anderem Finanzen, Verwaltung, Technik, Bildung und Handel.
Ziel war es, herauszufinden, in welchen Bereichen KI-Systeme bereits menschliche Leistungsniveaus erreichen oder übertreffen.
So funktioniert die Benchmark .

Im zugehörigen technischen Bericht (GDPVal: A Benchmark for Measuring AI Performance Across Occupations, 2025) beschreibt das OpenAI-Forschungsteam die Methode als realitätsnahe Leistungsprüfung.
Künstliche Intelligenz musste dabei dieselben Aufgaben lösen wie menschliche Fachkräfte. Anschließend bewerteten unabhängige Expertenteams die Ergebnisse in einer blinden Bewertung – ohne zu wissen, ob sie von KI oder Menschen stammten.
Gemessen wurden Qualität, Genauigkeit, Effizienz und Entscheidungslogik.
Zentrale Ergebnisse der Studie.
Die GDPVal-Analyse umfasste 44 Berufe, die wirtschaftlich besonders relevant sind.
Dabei ergaben sich deutliche Unterschiede zwischen Berufsfeldern:
- Analytische Tätigkeiten wie Buchhaltung, Finanzanalyse und Logistik zeigen die höchste Automatisierbarkeit – hier erreichten KI-Modelle Werte über dem menschlichen Durchschnitt.
- Kreative und kommunikative Berufe, etwa Redaktion, Marketing und Softwareentwicklung, zeigten ein nahezu gleichwertiges Leistungsniveau.
- Berufe mit manuellen oder visuellen Komponenten, wie Ingenieurwesen oder Videobearbeitung, blieben weiterhin klar im menschlichen Vorteil.
In mehreren Bereichen übertrafen Modelle wie GPT-5 und GPT-5-high Menschen in über 50 % der getesteten Aufgaben – besonders dort, wo präzise Datenanalyse und strukturierte Entscheidungsprozesse gefragt sind.
Ziele und Bedeutung von GDPVal
OpenAI betont, dass die Benchmark nicht der Ersetzung von Arbeitsplätzen dient, sondern der objektiven Leistungsbewertung von KI-Systemen.
GDPVal soll es ermöglichen, die wirtschaftlichen Auswirkungen von generativer KI fundiert zu untersuchen und den Dialog über Automatisierung faktenbasiert zu gestalten.
Gleichzeitig unterstreichen die Ergebnisse die schnelle Weiterentwicklung moderner Modelle: Innerhalb von nur 15 Monaten hat sich die Effizienz von GPT-5-high im Vergleich zu GPT-4o laut OpenAI vervierfacht.
Fazit: Ein Meilenstein in der KI-Forschung
Mit GDPVal liefert OpenAI erstmals eine wissenschaftlich belastbare Grundlage, um den Einfluss von KI auf reale Berufsfelder zu messen.
Die Studie zeigt, dass Künstliche Intelligenz in datengetriebenen und sprachbasierten Tätigkeiten bereits jetzt ein konkurrenzfähiges Leistungsniveau erreicht.
Dennoch bleibt entscheidend, wie Wirtschaft und Politik diesen technologischen Fortschritt nutzen, um menschliche Arbeit zu ergänzen statt zu ersetzen.