Technik · 03.03.2026 11:02

Model-Schau: Coding, OCR und chinesisches Neujahr

Kurz: Der Februar brachte spannende Entwicklungen in der Welt der KI-Modelle, insbesondere im Bereich Coding und OCR.

Entwicklungen im Februar: Coding-Modelle, OCR und chinesische Neujahrstrends

Im Februar 2026 gab es bedeutende Fortschritte in der Welt der KI-Modelle. Die bevorstehenden Feierlichkeiten zum chinesischen Neujahr scheinen einige Anbieter dazu angeregt zu haben, ihre neuesten Modelle vorzustellen. Dieser Artikel beleuchtet die aktuellen Entwicklungen im Bereich Coding- und OCR-Modelle sowie die neuesten Trends aus China.

Fortschritte bei Coding-Modellen

Qwen3 Coder-Next

Bereits im September 2025 kündigte Qwen ein neues hybrides Modell an, das unter dem Namen Qwen3 Coder-Next bekannt ist. Dieses Modell hebt sich durch seine hybriden Attention-Layer hervor, die es ermöglichen, einen langen Kontext von bis zu 262.144 Token zu verarbeiten. Die Effizienz in Bezug auf Speicher und Rechengeschwindigkeit macht es besonders attraktiv für leistungsstarke Hardware, wie beispielsweise Macs mit Apple Silicon. Entwickler berichten von einer hohen Beliebtheit für lokale Anwendungen, die über das reine Coding hinausgehen.

OpenAI und GPT-5.3-Codex

OpenAI hat mit dem GPT-5.3-Codex ein neues Modell veröffentlicht, das schneller und besser für agentische Aufgaben geeignet ist. Die Einführung eines kleineren Modells, GPT-5.3-Codex-Spark, zielt darauf ab, Realtime-Coding zu unterstützen. Angesichts des Preisdrucks durch offene Modelle wird die Effizienz und Kostenkontrolle immer wichtiger.

Claude Opus 4.6 von Anthropic

Ein weiterer bedeutender Spieler im Coding-Bereich ist Anthropic mit seinem Modell Claude Opus 4.6. Dieses Modell zeigt sich nicht nur als exzellent für Coding-Aufgaben, sondern auch für Finanzanalysen und Präsentationen. Aufgrund seiner Vielseitigkeit erfreut es sich großer Beliebtheit, birgt jedoch auch das Risiko, hohe Kosten zu verursachen.

OCR-Modelle im Aufschwung

Vision-Language-Modelle

Die Integration von Vision-Language-Modellen hat OCR (Optical Character Recognition) revolutioniert. Mehrere neue Modelle wurden vorgestellt, die sich durch ihre Leistungsfähigkeit auszeichnen.

#### GLM-OCR von Z.ai

Das GLM-OCR-Modell von Z.ai hat sich als besonders leistungsstark erwiesen und übertrifft andere neue Modelle wie DeepSeek-OCR-2 und PaddleOCR-VL-1.5. Es kann Texte aus verschiedenen Formaten, einschließlich Tabellen, extrahieren, hat jedoch Einschränkungen bei der Umwandlung von Grafiken in Daten.

#### DeepSeek-OCR-2

Dieses Modell hat sich ebenfalls weiterentwickelt und bietet eine hervorragende Erkennung von Texten. Die Ergebnisse sind in den meisten Fällen fehlerfrei und bieten eine gute Grundlage für die Weiterverarbeitung.

#### PaddleOCR-VL-1.5

PaddleOCR-VL-1.5 hebt sich durch innovative Ansätze wie Text Spotting hervor und kann auch komplexe Tabellen über mehrere Seiten hinweg verarbeiten. Ein Alleinstellungsmerkmal ist die Fähigkeit, Daten aus Diagrammen zu extrahieren.

Neue Modelle aus China

Kimi K2.5

Die chinesischen Anbieter haben in den letzten Wochen bemerkenswerte Modelle hervorgebracht, insbesondere im Vorfeld des chinesischen Neujahrs. Kimi K2.5 wird als eines der stärksten offenen Modelle angesehen und zeichnet sich durch multimodale Trainingsdaten aus.

Moonshot und Agent Swarm

Moonshot hat das Agent Swarm-Modell entwickelt, das in der Lage ist, Agentenaufrufe parallel durchzuführen und somit die Effizienz bei komplexen Aufgaben erheblich zu steigern. Details zu dem Trainingsprozess wurden veröffentlicht, jedoch bleibt unklar, wie viel Rechenzeit benötigt wird.

Step-3.5-Flash

Ein weiterer Player ist Step-3.5-Flash, der trotz seiner geringeren Größe von 196 Milliarden Parametern beeindruckende Ergebnisse liefert. Erste Tests zeigen jedoch eine starke Fokussierung auf die chinesische Sprache.

GLM 5.0 von Z.ai

Z.ai hat kürzlich das Modell GLM 5.0 veröffentlicht, das mit 744 Milliarden Parametern eine enorme Leistungssteigerung im Vergleich zu seinem Vorgänger bietet. Die Community hat auf diese Neuheit gespannt gewartet und wurde in den Tests nicht enttäuscht.

MiniMax 2.5

MiniMax hat ebenfalls ein neues Modell vorgestellt, das mit 230 Milliarden Parametern konkurrenzfähig ist. Erste Ergebnisse zeigen vielversprechende Ansätze, auch wenn es noch nicht in vielen Benchmarks vertreten ist.

Open Responses: Ein neuer API-Standard

Ein bemerkenswerter Fortschritt ist die Entwicklung der Open Responses-API. Diese API zielt darauf ab, die Interoperabilität zwischen verschiedenen Modellen zu verbessern und bietet eine bessere Handhabung von Agenten. Zudem wird die Notwendigkeit einer Standardisierung in der Community immer deutlicher, da die Komplexität der Modelle und ihre Anwendungen stetig zunimmt.

Ausblick auf die Zukunft

Die rasante Entwicklung der KI-Modelle wirft Fragen zur Nachhaltigkeit und Transparenz auf. Während OpenAI seine Personalpolitik anpasst, bleibt unklar, wie lange die chinesischen Anbieter ihre Innovationskraft aufrechterhalten können. Insbesondere der Umsatzdruck durch offene Modelle wird entscheidend sein. Es bleibt abzuwarten, welche neuen Modelle und Technologien in den kommenden Monaten auf den Markt kommen werden.

Bild: Pexels: https://www.pexels.com/de-de/foto/blumen-bunt-farbenfroh-geschaft-14994386/ · Foto: Quý Nguyễn

Quelle: https://www.heise.de/hintergrund/Model-Schau-Coding-OCR-und-chinesisches-Neujahr-11196500.html?wt_mc=rss.red.ho.ho.atom.beitrag.beitrag