FIELD MAP
DER AI-STACK — MAI 2026
Die Application-Layer, auf der die meisten Teams shippen, ist heute zehn eigenständige Ebenen tief — umschlossen von zwei Rails, die jede einzelne berühren. Das ist eine Arbeitskarte, kein Buyer's Guide: wo jede Kategorie sitzt, was einige repräsentative Anbieter tun und wie die Teile zusammenhängen.
Lies sie von oben nach unten — von der Oberfläche bis zum Silizium. Die linke Rail, Observability, und die rechte Rail, Governance, sind keine Schritte im Flow; sie sind Concerns, die quer durch alle zehn Ebenen schneiden. Tippe einen Anbieter im Diagramm an, um zu seiner Erklärung und einem ausgehenden Link weiter unten zu springen.
- 01
End-User-Oberflächen
- 02
Agent-Runtimes
- 03
Orchestration Frameworks
- 04
Protocol Layer NEU
- 05
Memory NEU
- 06
Retrieval
- 07
Storage
- 08
Model Gateway
- 09
Foundation Models
- 10
Inference + Compute
Element antippen für Details ↓
01End-User-Oberflächen
Cursor
KI-first Code-Editor; agentische Edits und codebasisweite Änderungen aus natürlicher Sprache.
Anbieter besuchenPerplexity
Answer-Engine: dialogbasierte Suche mit Live-Quellen und Zitaten.
Anbieter besuchenChatGPT
OpenAIs Consumer-Assistent für Chat, Reasoning und Tool-Use.
Anbieter besuchenClaude
Anthropics Assistent für Web, Desktop und Mobile, ausgelegt auf Long-Context-Arbeit.
Anbieter besuchen02Agent-Runtimes
Claude Code
Terminal-natives agentisches Coding von Anthropic; delegiert mehrstufige Engineering-Tasks.
Anbieter besuchenDevin
Cognitions autonomer Software-Engineer, der Aufgaben end-to-end plant und ausführt.
Anbieter besuchenReplit Agent
Baut und deployt komplette Apps aus einem Prompt in Replits Cloud-IDE.
Anbieter besuchenCodex
OpenAIs Coding-Agent für Cloud und CLI, der Tasks in isolierten Sandboxes ausführt.
Anbieter besuchenCursor Agent
Cursors Background-Agent-Modus für parallele, länger laufende Coding-Arbeit.
Anbieter besuchen03Orchestration Frameworks
LangGraph
Graph-basierte Orchestrierung für zustandsbehaftete, mehrstufige Agent-Workflows (LangChain).
Anbieter besuchenMicrosoft Agent Framework
Microsofts vereinheitlichtes Agent-Framework; konsolidiert Semantic Kernel und AutoGen.
Anbieter besuchenPydantic AI
Typsicheres Python-Agent-Framework vom Pydantic-Team.
Anbieter besuchenMastra
TypeScript-Framework, das Agents, Workflows, Memory und Evals bündelt.
Anbieter besuchenGoogle ADK
Googles Open-Source Agent Development Kit (Python, Java, Go, TypeScript).
Anbieter besuchen04Protocol Layer
MCP
Model Context Protocol (Anthropic): Standard, um Modelle an Tools und Daten anzubinden.
Anbieter besuchenA2A
Agent2Agent: vendorübergreifende Agent-Interoperabilität; von Google initiiert, jetzt Linux Foundation.
Anbieter besuchenAG-UI
Agent-User-Interaction-Protokoll (CopilotKit): Event-Stream zwischen Agent-Backends und Frontends.
Anbieter besuchen05Memory
Mem0
Drop-in-Memory-API, die Vector-, Graph- und Key-Value-Stores für Personalisierung kombiniert.
Anbieter besuchenLetta
OS-artiges Agent-Memory mit Paging zwischen Kontext und Archiv-Storage (vormals MemGPT).
Anbieter besuchenZep
Temporales Knowledge-Graph-Memory (Graphiti), das Faktenänderungen über die Zeit verfolgt.
Anbieter besuchen06Retrieval
Cohere Rerank
Reranking-Modelle, die Kandidaten-Passagen nach echter Relevanz neu sortieren.
Anbieter besuchenVoyage AI
Hochwertige Embedding- und Reranking-Modelle (Teil von MongoDB).
Anbieter besuchenNeo4j GraphRAG
Graph-basiertes RAG, das Retrieval in einem Knowledge-Graph verankert.
Anbieter besuchenElastic
Hybride Keyword- und Vector-Suche auf der Elasticsearch-Engine.
Anbieter besuchen07Storage
pgvector
Postgres-Erweiterung, die Vector-Similarity-Suche zur bestehenden Datenbank hinzufügt.
Anbieter besuchenQdrant
Open-Source-Vector-Datenbank mit Payload-Filterung und Hybrid-Suche.
Anbieter besuchenTurbopuffer
Serverlose Vector- und Volltextsuche auf Object Storage – günstig bei großem Maßstab.
Anbieter besuchenPinecone
Vollständig gemanagte Vector-Datenbank für Production-Retrieval.
Anbieter besuchenneo4j
Native Graph-Datenbank für stark vernetzte Daten.
Anbieter besuchen08Model Gateway
Portkey
AI-Gateway mit Routing, Caching, Guardrails und Observability über Provider hinweg.
Anbieter besuchenLiteLLM
Einheitliches SDK und Proxy, das 100+ Model-Provider hinter einer OpenAI-artigen API bündelt.
Anbieter besuchenOpenRouter
Eine API, die Requests über viele Modelle und Provider routet.
Anbieter besuchen09Foundation Models
Claude (Anthropic)
Anthropics Claude-Modellfamilie, ausgelegt auf Reasoning, Coding und Long Context.
Anbieter besuchenGPT (OpenAI)
OpenAIs GPT-Familie universeller Frontier-Modelle.
Anbieter besuchenGemini (Google)
Die multimodale Gemini-Modellfamilie von Google DeepMind.
Anbieter besuchenMeta (Llama)
Metas Open-Weight-Llama-Modelle für Self-Hosting und Fine-Tuning.
Anbieter besuchenDeepSeek
Open-Weight-Modelle, bekannt für starkes Reasoning zu niedrigen Kosten.
Anbieter besuchenQwen
Alibabas Open-Weight-Qwen-Modellfamilie über Größen und Modalitäten hinweg.
Anbieter besuchen10Inference + Compute
Together AI
Inference-Cloud zum Betrieb und Fine-Tuning offener Modelle im großen Maßstab.
Anbieter besuchenFireworks AI
Schnelles, kosteneffizientes Inference-Serving für offene Modelle.
Anbieter besuchenvLLM
Open-Source-Inference-Engine mit hohem Durchsatz für LLM-Serving.
Anbieter besuchenNVIDIA
Data-Center-GPUs, die AI-Training und -Inference dominieren.
Anbieter besuchenAMD MI400
AMDs Instinct-MI400-Serie an AI-Beschleunigern; AMDs Angriff auf NVIDIA im Rechenzentrum.
Anbieter besuchenGoogle TPU
Googles Tensor Processing Units für Training und Serving auf Google Cloud.
Anbieter besuchenAWS
Cloud plus eigene Trainium- und Inferentia-Chips für AI-Workloads.
Anbieter besuchenGroq
LPU-basierte Inference mit sehr geringer Latenz bei der Token-Generierung.
Anbieter besuchen