LLM Benchmarks

Führende Sprachmodelle im Vergleich

Monatliche Leistungsanalysen führender Sprachmodelle – von OpenAI über Google bis zu lokalen Open-Source-Lösungen.

Der AI Strategy & Research Hub der TIMETOACT GROUP Österreich gehört zu den führenden Expert:innen im Bereich der angewandten Forschung zu generativer KI für Unternehmen. Unsere Forschungsergebnisse fließen unmittelbar in die Produktentwicklung ein – so setzen wir höchste Standards bei der Umsetzung KI-gestützter Anwendungen für Unternehmen.

Aktuelle LLM Benchmarks

Die Highlights des Monats:

Geheimnisse lüften – Schema-Guided Reasoning
OpenAI GPT-5-Releases sind ein großer Meilenstein
Ein strukturelles Problem beim GPT-5-Release
Grok-4 teilt sich den Spitzenplatz
Gemini 2.5 Pro
Qwen-3 ist nach wie vor sehr beliebt
DeepSeek – schrittweise Verbesserungen
Enterprise Reasoning Challenge (ERCr3)

Zu den aktuellen Benchmarks

Die Benchmark-Kategorien im Detail

Hier erfahren Sie, was wir mit den unterschiedlichen Kategorien der LLM Leaderboards genau untersuchen

Docs

Wie gut kann das Modell mit großen Dokumenten und Wissensdatenbanken arbeiten?

CRM

Wie gut unterstützt das Modell die Arbeit mit Produktkatalogen und Marktplätzen?

Integrate

Kann das Modell problemlos mit externen APIs, Diensten und Plugins interagieren?

Marketing

Wie gut kann das Modell bei Marketingaktivitäten unterstützen, z.B. beim Brainstorming, der Ideenfindung und der Textgenerierung?

Reason

Wie gut kann das Modell in einem gegebenen Kontext logisch denken und Schlussfolgerungen ziehen?

Code

Kann das Modell Code generieren und bei der Programmierung helfen?

Cost

Die geschätzten Kosten für die Ausführung der Arbeitslast. Für cloud-basierte Modelle berechnen wir die Kosten gemäß der Preisgestaltung. Für lokale Modelle schätzen wir die Kosten auf Grundlage der GPU-Anforderungen für jedes Modell, der GPU-Mietkosten, der Modellgeschwindigkeit und des operationellen Overheads.

Speed

Die Spalte "Speed" gibt die geschätzte Geschwindigkeit des Modells in Anfragen pro Sekunde an (ohne Batching). Je höher die Geschwindigkeit, desto besser.

LLM Benchmarks Archiv

LLM Benchmarks | April 2025

LLM Benchmarks | März 2025

LLM Benchmarks | Februar 2025

LLM Benchmarks | Jänner 2025

LLM Benchmarks | Dezember 2024

LLM Benchmarks | November 2024

LLM Benchmarks | Oktober 2024

LLM Benchmarks | September 2024

LLM Benchmarks | August 2024

LLM Benchmarks | Juli 2024

LLM Benchmarks | Juni 2024

LLM Benchmarks | Mai 2024

LLM Benchmarks | April 2024

Entdecken Sie unsere KI-Workshops für Unternehmen

Ob Grundlagen der KI, Schulungen im Prompt Engineering oder Potenzialanalysen – wir bieten maßgeschneiderte Lösungen für jeden Bedarf.

Zum KI-Workshop Angebot

Transformieren Sie Ihre digitalen Projekte mit den besten KI-Sprachmodellen!

Entdecken Sie die transformative Kraft der besten Sprachmodelle und revolutionieren Sie Ihre digitalen Produkte mit KI! Bleiben Sie zukunftsorientiert, steigern Sie die Effizienz und sichern Sie sich einen klaren Wettbewerbsvorteil. Wir unterstützen Sie dabei, Ihren Business Value auf das nächste Level zu heben.

Vorname

Nachname *

Unternehmen *

E-Mail *

Telefonnummer

Ihre Nachricht *

* Pflichtfelder

Wir verwenden die von Ihnen an uns gesendeten Angaben nur, um auf Ihren Wunsch hin mit Ihnen Kontakt im Zusammenhang mit Ihrer Anfrage aufzunehmen. Alle weiteren Informationen können Sie unseren Datenschutzhinweisen entnehmen.

Martin Warnung

Sales Consultant TIMETOACT GROUP Österreich GmbH +43 664 881 788 80

Kontakt

Blog 01.10.24

ChatGPT & Co: September-Benchmarks für Sprachmodelle

Entdecken Sie die neuesten Erkenntnisse aus unseren unabhängigen LLM Benchmarks vom September 2024. Erfahren Sie, welche großen Sprachmodelle am besten abgeschnitten haben.

Blog 12.11.24

ChatGPT & Co: Oktober-Benchmarks für Sprachmodelle

Entdecken Sie die neuesten Erkenntnisse aus unseren unabhängigen LLM Benchmarks für Oktober 2024. Erfahren Sie, welche großen Sprachmodelle am besten abgeschnitten haben.

Blog 07.01.25

ChatGPT & Co: Dezember-Benchmarks für Sprachmodelle

Entdecken Sie die neuesten Erkenntnisse aus unseren unabhängigen LLM Benchmarks für Dezember 2024. Erfahren Sie, welche großen Sprachmodelle am besten abgeschnitten haben.

Blog 20.02.25

ChatGPT & Co: November-Benchmarks für Sprachmodelle

Entdecken Sie die neuesten Erkenntnisse aus unseren unabhängigen LLM Benchmarks für November 2024. Erfahren Sie, welche großen Sprachmodelle am besten abgeschnitten haben.

Blog 20.02.25

ChatGPT & Co: Januar-Benchmarks für Sprachmodelle

Entdecken Sie die neuesten Erkenntnisse aus unseren unabhängigen LLM Benchmarks für Jänner 2025. Erfahren Sie, welche großen Sprachmodelle am besten abgeschnitten haben.

Insights 17.03.25

ChatGPT & Co: Februar-Benchmarks für Sprachmodelle

Entdecken Sie die neuesten Erkenntnisse aus unseren unabhängigen LLM Benchmarks für Februar 2025. Erfahren Sie, welche großen Sprachmodelle am besten abgeschnitten haben.

Blog 25.05.23

Roadmap zu digitalen Produkten

Was ist bei der Skalierung von API-Initiativen zu beachten? Wie werden durch zentrale Verwaltung und Veröffentlichung von APIs diese Daten und Dienste zugänglich?

African American Business woman hard working, debtor, deferred debt, Times Interest Earned, Subsidiary Ledger, Special Journal, Shareholders Equity, Scrap value, Price Index, Profitability Ratios

Blog 28.09.23

Dokumentenmanagement mit GPT optimieren

KI und GPT sind in aller Munde. Welche konkreten Use Cases sind möglich? Wie sieht die Einführung aus? Wir zeigen, wie unser Kunden Dokumentenmanagement durch den Einsatz von GPT revolutioniert hat.

Lösung

Cloud-Produkte

Unsere Produkte und Solutions auf einen Blick

Produkt

Atlassian-Produkte

Die gesamte Produktpalette von Atlassian ist darauf ausgerichtet, die Arbeit von Projekt-Teams zu optimieren.

Referenz

Produkt-Echtzeitanalyse bei Maschinenbauunternehmen

Ein deutsches Maschninenbauunternehmen ermöglicht mit Hilfe von X-INTEGRATE und Industrie 4.0 Technologie ihren Kunden, den Status jedes Geräts visuell und in Echtzeit zu überwachen.

Produkt

Atlassian-Produkte & catworkx-Apps

Atlassian-Produkte (z.B Jira & Confluence) unterstützen Teams optimal bei der Zusammenarbeit. Ergänzend dazu bieten unsere hauseigenen Apps spezifische Funktionalitäten oder Integrationen.

novaCapta: Ihr Partner für die digitale Transformation mit Microsoft Technologien

Übersicht

novaCapta-Produkte, Apps & Assets

Entdecken Sie die novaCapta Apps, Assets & Produkte: Egal ob kleine App oder Produkt mit individuellen Anpassungen – mit unseren eigenen Entwicklungen sind Sie gut gerüstet.

Training_Master

Unternehmensprozesse digitalisieren – am besten mit Low-Code

Auch heute geht das Digitalisieren von Unternehmensprozessen eher schleppend voran. Low-Code Plattformen von Anbietern wie Mendix können hier Abhilfe leisten.

Blog 24.10.24

DevOps und APIOps in der Praxis: Best Practices

Wie lassen sich DevOps und APIOps erfolgreich kombinieren? In diesem Artikel erfahren Sie, welche Best Practices und Erfolgsfaktoren moderne Softwareentwicklung schneller und skalierbarer machen.

Blog 27.01.22

Ohne Digital Workplace keine digitale Transformation

Der Digital Workplace steht für neue Technologien und moderne Arbeitsweisen. Was aber zeichnet ihn aus und was ist notwendig, um die digitale Transformation zu meistern?

Referenz

woom: Die zentrale Lösung für ihre Office-Produkte

Woom produziert Fahrräder, die auf Kinder zugeschnitten sind. Von ergonomischen Sitzmöglichkeiten, bis hin zu kleineren Bremsen, haben sie alles für ein schönes Erlebnis durchdacht.

Führende Sprachmodelle im Vergleich