MiniMax-M3 und die harte Frage nach KI-Kosten

Rohtext Redaktion

· 01. Juni 2026 · 5 Min. Lesezeit

MiniMax-M3 und die harte Frage nach KI-Kosten

← Alle Beiträge

MiniMax-M3 ist kein weiterer Modellname für die ohnehin schon unübersichtliche KI-Liste. Interessant ist weniger, dass ein chinesisches KI-Startup ein neues großes Sprachmodell veröffentlicht hat. Interessant ist, wo MiniMax den Druck ansetzt: beim Preis.

Das Unternehmen hat M3 am Sonntagabend US-Ostküstenzeit vorgestellt und positioniert das Modell für anspruchsvolle Coding-Aufgaben, agentische Workflows, lange Eingaben und multimodale Nutzung. Genannt werden ein Kontextfenster von einer Million Token, native Multimodalität und eine API-Preisstruktur, die deutlich unter vielen proprietären US-Angeboten liegt. Für die kommenden Tage gibt es einen Sonderpreis von USD0,30 pro eine Million Eingabe-Token und USD1,20 pro eine Million Ausgabe-Token auf frischem Cache. Der reguläre Preis soll bei USD0,60 beziehungsweise USD2,40 liegen. Zusätzlich spricht MiniMax von neuen Token-Abonnements ab USD20 pro Monat.

Das ist der Punkt, an dem die Debatte nüchterner werden sollte. Die großen Modellanbieter haben lange so getan, als sei bessere Modellqualität zwangsläufig mit einer Preisklasse verbunden, die nur durch geschlossene Plattformen, hohe Margen und strikte API-Kontrolle darstellbar sei. MiniMax stellt diese Erzählung zumindest unter Stress.

Benchmarks sind keine Produktion

Die laut gemachten Vergleiche mit GPT-5.5 und Gemini 3.1 Pro klingen auf den ersten Blick brutal: M3 soll auf ausgewählten Benchmarks besser abschneiden und nur einen Bruchteil der Kosten verursachen. Genau hier ist Vorsicht angebracht. Ausgewählte Benchmarks sind nicht die Realität eines Unternehmensbetriebs. Sie sagen wenig über Latenzspitzen, Ausfallverhalten, Tool-Nutzung über mehrere Schritte, saubere Abrechnung, Datenhaltung, Support, Governance oder die Frage, wie stabil ein Modell in schmutzigen internen Workflows bleibt.

Das macht die Zahlen aber nicht irrelevant. Wer KI-Systeme nicht als Demo baut, sondern dauerhaft betreibt, kennt den Unterschied zwischen einem guten Modell und einer bezahlbaren Pipeline. Agentische Systeme verbrennen Token. Lange Kontextfenster verbrennen Token. Code-Analyse, Dokumentenprüfung, Rechercheketten und mehrstufige Automatisierung verbrennen Token. Wenn ein Modell dort brauchbare Ergebnisse liefert und die Kosten auf einen Bruchteil drückt, verändert sich die Kalkulation.

MiniMax ist dabei nicht automatisch der billigste Anbieter im Feld. In der genannten Preisübersicht liegen etwa Xiaomi MiMo-V2.5 Flash und DeepSeek-Varianten bei niedrigeren Summen. Der Vergleich ist also nicht simpel: MiniMax-M3 wird nicht nur über den niedrigsten API-Preis verkauft, sondern über die Kombination aus Modellklasse, Kontextlänge, Coding-Fähigkeit, Multimodalität und angekündigter Offenheit. Genau diese Kombination ist für Unternehmen interessanter als ein isolierter Cent-Betrag pro Million Token.

Open Weights sind ein Versprechen, noch kein Zustand

MiniMax kündigt an, M3 innerhalb der nächsten zehn Tage unter einer Open-Source-Lizenz mit offenen Gewichten bereitzustellen. Unternehmen sollen das Modell herunterladen, anpassen und ohne zusätzliche Lizenzkosten betreiben können. Falls das tatsächlich so kommt, wäre das für viele IT-Abteilungen relevanter als ein weiterer Benchmark-Sieg.

Aber auch hier gilt: Solange Lizenztext, Gewichte und praktische Bedingungen nicht vorliegen, ist es eine Ankündigung. Open Weights sind nicht dasselbe wie vollständige Transparenz über Trainingsdaten, Trainingsprozess, Evaluierungen und Sicherheitsentscheidungen. Für manche Unternehmen reicht das. Für andere nicht. Besonders regulierte Branchen werden genauer hinschauen, ob ein lokal betreibbares Modell wirklich weniger Risiko bedeutet oder nur andere Risiken verschiebt.

Trotzdem ist der strategische Effekt klar. Die Grenze zwischen geschlossenen Spitzenmodellen und offenen, günstigeren Alternativen wird poröser. Lange galt die Wahl als unbequem: Entweder man kauft Zugang zu den teuersten proprietären Systemen, oder man akzeptiert bei offenen Modellen Abstriche bei komplexem Schlussfolgern, Coding und langen Sequenzen. MiniMax behauptet nun, diese Trennung sei nicht mehr zwingend.

Der Druck kommt nicht nur aus Kalifornien

Auffällig ist auch, wie sich das Anbieterfeld verschiebt. In der Preisübersicht stehen neben MiniMax Namen wie DeepSeek, Xiaomi MiMo, Moonshot/Kimi und Z.ai. Das sind keine Randnotizen mehr. Der Kostendruck im Markt für Sprachmodelle kommt derzeit sichtbar aus China. Das bedeutet nicht, dass OpenAI, Google oder Anthropic plötzlich überflüssig wären. Sie kontrollieren weiterhin wichtige Produktoberflächen, Entwicklerökosysteme, Enterprise-Beziehungen und Integrationen.

Aber ihre Preissetzung wird angreifbarer. Wenn Unternehmen sehen, dass Modelle mit vergleichbarer Aufgabenabdeckung zu einem Bruchteil der Kosten angeboten werden, wird die alte Premiumlogik schwieriger zu verteidigen. Der Satz, dass das teuerste Modell eben das sicherste und beste sei, trägt in Beschaffungsrunden nur so lange, wie die Alternativen deutlich schlechter wirken. Sobald dieser Abstand kleiner wird, wandert die Debatte in Richtung TCO, Datenfluss, Lock-in und Verhandlungsposition.

Gerade für Softwareteams kann das relevant werden. Coding-Modelle werden nicht nur für Autocomplete genutzt. Sie prüfen Pull Requests, erzeugen Tests, analysieren Fehlerprotokolle, schreiben Migrationsskripte, durchsuchen große Codebasen und hängen an internen Werkzeugketten. Ein Kontextfenster von einer Million Token klingt in der Praxis erst dann nützlich, wenn es nicht jeden Lauf zur Budgetfrage macht. MiniMax setzt genau dort an.

Billiger heißt nicht automatisch besser

Der Fehler wäre nun, M3 vorschnell zum neuen Standard zu erklären. Niedrige API-Preise können durch Sonderaktionen verzerrt sein. Benchmark-Angaben können je nach Auswahl und Messmethode anders aussehen. Multimodalität sagt noch nichts darüber, wie robust ein Modell mit realen Dokumenten, fehlerhaften Tabellen, schlechten Scans oder widersprüchlichen Anweisungen umgeht. Und offene Gewichte lösen nicht automatisch Betrieb, Sicherheit, Monitoring und Verantwortung.

Für Unternehmen ist deshalb weniger die Schlagzeile entscheidend als der Test im eigenen Prozess. Wie verhält sich M3 bei internen Coding-Standards? Wie stabil bleibt es über lange Agentenketten? Wie gut lassen sich Ausgaben kontrollieren? Wie sieht die Kostenkurve bei wiederholten Läufen aus? Was passiert, wenn der Sonderpreis endet? Welche Zusagen gibt es für Verfügbarkeit und Datenverarbeitung?

Die Antwort kann je nach Organisation unterschiedlich ausfallen. Manche werden M3 nur als Verhandlungsargument gegenüber etablierten Anbietern nutzen. Andere werden es für bestimmte Workloads prüfen, bei denen Kosten bisher der begrenzende Faktor waren. Wieder andere werden abwarten, ob die offenen Gewichte tatsächlich kommen und wie belastbar das Lizenzmodell ist.

MiniMax-M3 zeigt vor allem, dass der Markt für große Sprachmodelle in eine weniger bequeme Phase eintritt. Nicht jedes neue Modell muss die Welt erklären. Dieses hier zwingt zunächst zu einer einfachen, harten Rechnung: Welche Modellqualität ist für welchen Preis noch vertretbar? Genau diese Frage kann für die KI-Ökonomie wichtiger sein als der nächste Rangplatz auf einer Benchmark-Tabelle.

📂

Kategorie

Künstliche Intelligenz, große Sprachmodelle, Bildgeneratoren und was sie wirklich können – und was nicht.

Über den Autor

Jens Könnig

Jens analysiert seit Jahren digitale Märkte, Preisbewegungen und Plattform-Strategien. Als Betreiber mehrerer datengetriebener Systeme wertet er täglich große Mengen an Produkt- und Trenddaten aus. Sein Fokus liegt auf Einordnung statt Hype: Was bedeutet eine Entwicklung wirklich für Nutzer, Preise und Märkte?

Alle Artikel von Jens Könnig →

MiniMax-M3 und die harte Frage nach KI-Kosten

Benchmarks sind keine Produktion

Open Weights sind ein Versprechen, noch kein Zustand

Der Druck kommt nicht nur aus Kalifornien

Billiger heißt nicht automatisch besser

Weitere Artikel in „KI"

Warum KI-Sicherheitszahlen oft nicht vergleichbar sind

Apples KI-Brille rutscht: Hardware setzt den Takt

Claude Mythos und das Ende des bequemen Patchfensters