> kb/ai-stack-2026.md · STACK · 12 MIN

FIELD MAP

DER AI-STACK — MAI 2026

Die Application-Layer, auf der die meisten Teams shippen, ist heute zehn eigenständige Ebenen tief — umschlossen von zwei Rails, die jede einzelne berühren. Das ist eine Arbeitskarte, kein Buyer's Guide: wo jede Kategorie sitzt, was einige repräsentative Anbieter tun und wie die Teile zusammenhängen.

Lies sie von oben nach unten — von der Oberfläche bis zum Silizium. Die linke Rail, Observability, und die rechte Rail, Governance, sind keine Schritte im Flow; sie sind Concerns, die quer durch alle zehn Ebenen schneiden. Tippe einen Anbieter im Diagramm an, um zu seiner Erklärung und einem ausgehenden Link weiter unten zu springen.

DER AI-STACK — MAI 2026

Element antippen für Details ↓

01End-User-Oberflächen

Cursor

KI-first Code-Editor; agentische Edits und codebasisweite Änderungen aus natürlicher Sprache.

Anbieter besuchen

Claude

Anthropics Assistent für Web, Desktop und Mobile, ausgelegt auf Long-Context-Arbeit.

Anbieter besuchen

02Agent-Runtimes

Claude Code

Terminal-natives agentisches Coding von Anthropic; delegiert mehrstufige Engineering-Tasks.

Anbieter besuchen

Codex

OpenAIs Coding-Agent für Cloud und CLI, der Tasks in isolierten Sandboxes ausführt.

Anbieter besuchen

Cursor Agent

Cursors Background-Agent-Modus für parallele, länger laufende Coding-Arbeit.

Anbieter besuchen

03Orchestration Frameworks

LangGraph

Graph-basierte Orchestrierung für zustandsbehaftete, mehrstufige Agent-Workflows (LangChain).

Anbieter besuchen

Microsoft Agent Framework

Microsofts vereinheitlichtes Agent-Framework; konsolidiert Semantic Kernel und AutoGen.

Anbieter besuchen

04Protocol Layer

MCP

Model Context Protocol (Anthropic): Standard, um Modelle an Tools und Daten anzubinden.

Anbieter besuchen

A2A

Agent2Agent: vendorübergreifende Agent-Interoperabilität; von Google initiiert, jetzt Linux Foundation.

Anbieter besuchen

AG-UI

Agent-User-Interaction-Protokoll (CopilotKit): Event-Stream zwischen Agent-Backends und Frontends.

Anbieter besuchen

05Memory

Mem0

Drop-in-Memory-API, die Vector-, Graph- und Key-Value-Stores für Personalisierung kombiniert.

Anbieter besuchen

Letta

OS-artiges Agent-Memory mit Paging zwischen Kontext und Archiv-Storage (vormals MemGPT).

Anbieter besuchen

Zep

Temporales Knowledge-Graph-Memory (Graphiti), das Faktenänderungen über die Zeit verfolgt.

Anbieter besuchen

06Retrieval

Cohere Rerank

Reranking-Modelle, die Kandidaten-Passagen nach echter Relevanz neu sortieren.

Anbieter besuchen

07Storage

pgvector

Postgres-Erweiterung, die Vector-Similarity-Suche zur bestehenden Datenbank hinzufügt.

Anbieter besuchen

Turbopuffer

Serverlose Vector- und Volltextsuche auf Object Storage – günstig bei großem Maßstab.

Anbieter besuchen

08Model Gateway

Portkey

AI-Gateway mit Routing, Caching, Guardrails und Observability über Provider hinweg.

Anbieter besuchen

LiteLLM

Einheitliches SDK und Proxy, das 100+ Model-Provider hinter einer OpenAI-artigen API bündelt.

Anbieter besuchen

09Foundation Models

Claude (Anthropic)

Anthropics Claude-Modellfamilie, ausgelegt auf Reasoning, Coding und Long Context.

Anbieter besuchen

10Inference + Compute

Together AI

Inference-Cloud zum Betrieb und Fine-Tuning offener Modelle im großen Maßstab.

Anbieter besuchen

AMD MI400

AMDs Instinct-MI400-Serie an AI-Beschleunigern; AMDs Angriff auf NVIDIA im Rechenzentrum.

Anbieter besuchen
MEMBER · KOSTENLOS

Volltext lesen oder als PDF herunterladen

Der vollständige Artikel und das PDF sind Member-Inhalte. Magic-Link-Login, keine Kreditkarte, kein Risiko — und beides ist sofort verfügbar.