
In einem entscheidenden Schritt, der die Wettbewerbslandschaft der Infrastruktur für künstliche Intelligenz (artificial intelligence) neu gestaltet, hat Microsoft eine dreijährige Vereinbarung über $750 Million mit dem KI-Such-Startup Perplexity abgeschlossen. Der Deal, der Ende letzter Woche finalisiert wurde, sieht vor, dass das „Answer Engine“-Einhorn einen erheblichen Teil seines Cloud-Computing-Bedarfs auf Microsoft Azure bündelt.
Diese Partnerschaft fällt zeitgleich mit Microsofts Vorstellung des Maia 200, eines Next‑Generation‑kundenspezifischen AI‑Chips, der speziell für Inferenz-Workloads (inference) entwickelt wurde. Das Zusammentreffen dieser beiden Ereignisse signalisiert eine strategische Neuausrichtung in Redmond: Microsoft finanziert nicht nur die KI‑Revolution, sondern integriert vertikal die notwendige Hardware und Software, um sie zu stützen, und stellt damit effektiv die Dominanz von Nvidia und Amazon Web Services (AWS) in Frage.
Die Vereinbarung markiert eine wichtige Diversifizierung für Perplexity, ein Unternehmen, das sich zuvor als „ganz auf AWS gesetzt“ beschrieben hatte. Während Perplexity betont, dass AWS weiterhin ein bevorzugter Partner bleibt, deutet das Volumen des Microsoft‑Deals – dreiviertel Milliarde Dollar über 36 Monate – auf eine erhebliche Verschiebung des operativen Schwerpunkts hin.
Nach den Bedingungen des Deals wird Perplexity Microsoft Foundry nutzen, einen Dienst, der einen einheitlichen Zugriff auf eine Suite von Frontier‑Modellen bereitstellt. Dies umfasst nicht nur OpenAI’s GPT‑Serie, sondern auch Modelle von Wettbewerbern wie Anthropic und xAI, die alle auf der Azure‑Infrastruktur gehostet werden. Für Perplexity, dessen Produkt darauf angewiesen ist, Antworten aus mehreren Modellen zu synthetisieren, um Genauigkeit zu gewährleisten und Halluzinationen zu reduzieren, ist diese Flexibilität von zentraler Bedeutung.
Das Timing ist besonders bemerkenswert angesichts der sich abkühlenden Beziehung zwischen Perplexity und Amazon. Nach einer Klage von Amazon bezüglich der „Buy with Pro“-Funktion von Perplexity dient der Schritt des Startups, Kapazitäten bei Microsoft zu sichern, sowohl als strategische Absicherung als auch als Unabhängigkeitserklärung. Durch die Festschreibung von Rechenkapazität bei Azure stellt Perplexity sicher, dass es sein Anfragevolumen – das auf über 100 Millionen pro Woche explodiert ist – skalieren kann, ohne einem einzigen Infrastrukturanbieter ausgeliefert zu sein.
Während die Schlagzeile der $750‑Millionen‑Vertrag ist, ist der zugrunde liegende technologische Enabler Microsofts neues Silizium. Der Maia 200‑Accelerator ist ein Application‑Specific Integrated Circuit (ASIC), das speziell für AI‑Inference (inference) – also den Prozess, ein Modell zur Generierung von Antworten auszuführen, statt es zu trainieren – entwickelt wurde.
Inference bzw. Inferenz ist der zentrale Kostenfaktor für nutzerorientierte KI‑Produkte wie Perplexity. Jedes Mal, wenn ein Nutzer eine Frage stellt, muss das System große Datenmengen in Echtzeit verarbeiten. Standard‑GPUs sind für diese spezifischen Aufgaben oft überdimensioniert oder energieineffizient. Die Maia 200, gefertigt in einem 3‑Nanometer‑Prozess bei TSMC, verspricht 30 % bessere Performance pro Dollar im Vergleich zu bestehenden kommerziellen Lösungen.
Kernfähigkeiten der Maia 200 umfassen:
Für einen Kunden wie Perplexity könnten Maia‑200‑Instanzen auf Azure theoretisch die „Kosten pro Anfrage“ senken, eine Kennzahl, die derzeit die Unit‑Economics von KI‑Suchmaschinen gegenüber traditioneller Keyword‑Suche belastet.
Der Deal unterstreicht den sich verschärfenden Kampf der „Big Three“ Cloud‑Anbieter, schnell wachsende KI‑Startups für sich zu gewinnen. Durch die Sicherung von Perplexity verwehrt Microsoft seinen Rivalen den exklusiven Zugriff auf eine der wenigen Consumer‑KI‑Apps mit echter Massenmarktdurchdringung.
Die folgende Tabelle veranschaulicht die derzeitige Ausrichtung der großen Cloud‑Anbieter mit wichtigen KI‑Playern und deren Hardware‑Strategien:
| **Cloud-Anbieter | Primäre KI-Partner | Strategischer Hardware-Fokus** |
|---|---|---|
| Microsoft Azure | OpenAI, Perplexity, Mistral, xAI | Maia Series: Fokus auf Kostenreduktion bei Inferenz (inference) und Verringerung der Abhängigkeit von Nvidia. |
| Amazon Web Services (AWS) | Anthropic, Hugging Face, Cohere | Trainium & Inferentia: Ausgereiftes kundenspezifisches Silizium, ausgerichtet auf Training und Inferenz. |
| Google Cloud | DeepMind (intern), Anthropic | TPU (Tensor Processing Unit): Das am längsten laufende Projekt für kundenspezifisches KI‑Silizium. |
Diese Tabelle hebt einen entscheidenden Trend hervor: Partnerschaften drehen sich nicht mehr nur um Credits; sie drehen sich um Hardware‑Ausrichtung. AWS hat seine Trainium‑Chips seit langem Partnern wie Anthropic angeboten. Nun setzt Microsoft die Maia 200 als Lockmittel ein, um kostenbewussten Startups zu zeigen, dass Azure der wirtschaftlichste Ort ist, um ihr Geschäft in großem Maßstab zu betreiben.
Perplexitys Bewertung ist auf nahezu $9 Milliarden gestiegen, angetrieben von dem Versprechen, die „ten blue links“ der traditionellen Suche durch direkte, zitierte Antworten zu ersetzen. Dieses Modell ist jedoch rechenintensiv. Das Generieren eines Textabschnitts erfordert um Größenordnungen mehr Energie und Rechenleistung als das Abrufen einer Datenbankzeile.
Um sein Wachstum zu tragen, muss Perplexity die Latenz‑ und Kostenfrage lösen. Der Microsoft‑Deal bietet einen Weg, beides anzugehen. Durch die Nutzung von Azures globaler Rechenzenter‑Präsenz und potenziell der Inferenz‑Fähigkeiten der Maia 200 kann Perplexity seine „Pro“-Funktionen – etwa tiefgehende Recherchen und Dateianalysen – mehr Nutzern zugänglich machen, ohne die Margen zu verwässern.
Darüber hinaus vereinfacht der Zugang zu Microsoft Foundry die Modell‑Orchestrierungsschicht. Anstatt separate API‑Integrationen für GPT‑4, Claude 3 und Grok zu verwalten, kann Perplexity diese Anfragen über Azures Managed Service leiten, was die Zuverlässigkeit erhöht und den Engineering‑Aufwand reduziert.
Der $750‑Millionen‑Deal schlägt Wellen durch das breitere KI‑Ökosystem.
Für Microsoft‑Investoren ist der Deal ein willkommener Hinweis darauf, dass die enormen Investitionen (CapEx) des Unternehmens in KI‑Infrastruktur in Form von umsatzgenerierenden Verträgen Früchte tragen. Es hatten sich Bedenken hinsichtlich der Rendite für die Milliarden ausgegebenen Dollar auf Rechenzentren aufgebaut. Ein $750‑Millionen‑Commitment von einem einzigen Startup hilft, die Nachfrageseite dieser Rechnung zu validieren.
Zudem spricht die Einführung der Maia 200 die Befürchtung der „Margenerosion“ an. Wenn Microsoft KI‑Workloads auf eigenen Chips statt auf teuren Drittanbieter‑GPUs bedienen kann, werden sich die Bruttomargen im Bereich AI‑Services im Laufe der Zeit verbessern.
Microsofts $750‑Millionen‑Vereinbarung mit Perplexity ist mehr als ein standardmäßiger Lieferantenvertrag; sie ist ein strategischer Zug, der Azures Stellung als Betriebssystem für das KI‑Zeitalter festigt. Durch die Kombination massiver Kapitalallokation mit der Einführung des Maia‑200‑Chips baut Microsoft eine vertikal integrierte Festung, die die nächste Generation von Tech‑Giganten anzieht. Für Perplexity bietet der Deal die Rechenleistung, die nötig ist, um seinen Angriff auf die traditionelle Suche fortzusetzen und sich in einer zunehmend ressourcenlimitierten digitalen Ökonomie zu behaupten.