Microsoft schließt 750-Millionen-Dollar-Azure-Cloud-Deal mit KI-Startup Perplexity ab

Microsoft zementiert seine KI-Dominanz mit $750 Million Perplexity-Deal und Vorstoß in kundenspezifisches Silizium

In einem entscheidenden Schritt, der die Wettbewerbslandschaft der Infrastruktur für künstliche Intelligenz (artificial intelligence) neu gestaltet, hat Microsoft eine dreijährige Vereinbarung über $750 Million mit dem KI-Such-Startup Perplexity abgeschlossen. Der Deal, der Ende letzter Woche finalisiert wurde, sieht vor, dass das „Answer Engine“-Einhorn einen erheblichen Teil seines Cloud-Computing-Bedarfs auf Microsoft Azure bündelt.

Diese Partnerschaft fällt zeitgleich mit Microsofts Vorstellung des Maia 200, eines Next‑Generation‑kundenspezifischen AI‑Chips, der speziell für Inferenz-Workloads (inference) entwickelt wurde. Das Zusammentreffen dieser beiden Ereignisse signalisiert eine strategische Neuausrichtung in Redmond: Microsoft finanziert nicht nur die KI‑Revolution, sondern integriert vertikal die notwendige Hardware und Software, um sie zu stützen, und stellt damit effektiv die Dominanz von Nvidia und Amazon Web Services (AWS) in Frage.

Eine strategische Ausrichtung: Das $750‑Millionen‑Commitment

Die Vereinbarung markiert eine wichtige Diversifizierung für Perplexity, ein Unternehmen, das sich zuvor als „ganz auf AWS gesetzt“ beschrieben hatte. Während Perplexity betont, dass AWS weiterhin ein bevorzugter Partner bleibt, deutet das Volumen des Microsoft‑Deals – dreiviertel Milliarde Dollar über 36 Monate – auf eine erhebliche Verschiebung des operativen Schwerpunkts hin.

Nach den Bedingungen des Deals wird Perplexity Microsoft Foundry nutzen, einen Dienst, der einen einheitlichen Zugriff auf eine Suite von Frontier‑Modellen bereitstellt. Dies umfasst nicht nur OpenAI’s GPT‑Serie, sondern auch Modelle von Wettbewerbern wie Anthropic und xAI, die alle auf der Azure‑Infrastruktur gehostet werden. Für Perplexity, dessen Produkt darauf angewiesen ist, Antworten aus mehreren Modellen zu synthetisieren, um Genauigkeit zu gewährleisten und Halluzinationen zu reduzieren, ist diese Flexibilität von zentraler Bedeutung.

Das Timing ist besonders bemerkenswert angesichts der sich abkühlenden Beziehung zwischen Perplexity und Amazon. Nach einer Klage von Amazon bezüglich der „Buy with Pro“-Funktion von Perplexity dient der Schritt des Startups, Kapazitäten bei Microsoft zu sichern, sowohl als strategische Absicherung als auch als Unabhängigkeitserklärung. Durch die Festschreibung von Rechenkapazität bei Azure stellt Perplexity sicher, dass es sein Anfragevolumen – das auf über 100 Millionen pro Woche explodiert ist – skalieren kann, ohne einem einzigen Infrastrukturanbieter ausgeliefert zu sein.

Der Aufstieg kundenspezifischer Siliziumlösungen: Die Maia 200

Während die Schlagzeile der $750‑Millionen‑Vertrag ist, ist der zugrunde liegende technologische Enabler Microsofts neues Silizium. Der Maia 200‑Accelerator ist ein Application‑Specific Integrated Circuit (ASIC), das speziell für AI‑Inference (inference) – also den Prozess, ein Modell zur Generierung von Antworten auszuführen, statt es zu trainieren – entwickelt wurde.

Inference bzw. Inferenz ist der zentrale Kostenfaktor für nutzerorientierte KI‑Produkte wie Perplexity. Jedes Mal, wenn ein Nutzer eine Frage stellt, muss das System große Datenmengen in Echtzeit verarbeiten. Standard‑GPUs sind für diese spezifischen Aufgaben oft überdimensioniert oder energieineffizient. Die Maia 200, gefertigt in einem 3‑Nanometer‑Prozess bei TSMC, verspricht 30 % bessere Performance pro Dollar im Vergleich zu bestehenden kommerziellen Lösungen.

Kernfähigkeiten der Maia 200 umfassen:

Optimierte Präzision: optimiert für 4‑Bit‑(FP4) und 8‑Bit‑(FP8) Datenformate, was schnellere Antwortzeiten ohne signifikanten Genauigkeitsverlust ermöglicht.
Speicherbandbreite: Hochbandbreiten‑Speicherarchitektur, ausgelegt für große Kontextfenster, die für Suchmaschinen essentiell sind, die mehrere Webseiten „lesen“ müssen, bevor sie antworten.
Vertikale Integration: Entwickelt, um direkt in Azures bestehende Serverracks zu passen und so den Bedarf an Rechenzenter‑Nachrüstungen zu minimieren.

Für einen Kunden wie Perplexity könnten Maia‑200‑Instanzen auf Azure theoretisch die „Kosten pro Anfrage“ senken, eine Kennzahl, die derzeit die Unit‑Economics von KI‑Suchmaschinen gegenüber traditioneller Keyword‑Suche belastet.

Wettbewerbslandschaft: Die Cloud‑Kriege eskalieren

Der Deal unterstreicht den sich verschärfenden Kampf der „Big Three“ Cloud‑Anbieter, schnell wachsende KI‑Startups für sich zu gewinnen. Durch die Sicherung von Perplexity verwehrt Microsoft seinen Rivalen den exklusiven Zugriff auf eine der wenigen Consumer‑KI‑Apps mit echter Massenmarktdurchdringung.

Die folgende Tabelle veranschaulicht die derzeitige Ausrichtung der großen Cloud‑Anbieter mit wichtigen KI‑Playern und deren Hardware‑Strategien:

**Cloud-Anbieter	Primäre KI-Partner	Strategischer Hardware-Fokus**
Microsoft Azure	OpenAI, Perplexity, Mistral, xAI	Maia Series: Fokus auf Kostenreduktion bei Inferenz (inference) und Verringerung der Abhängigkeit von Nvidia.
Amazon Web Services (AWS)	Anthropic, Hugging Face, Cohere	Trainium & Inferentia: Ausgereiftes kundenspezifisches Silizium, ausgerichtet auf Training und Inferenz.
Google Cloud	DeepMind (intern), Anthropic	TPU (Tensor Processing Unit): Das am längsten laufende Projekt für kundenspezifisches KI‑Silizium.

Diese Tabelle hebt einen entscheidenden Trend hervor: Partnerschaften drehen sich nicht mehr nur um Credits; sie drehen sich um Hardware‑Ausrichtung. AWS hat seine Trainium‑Chips seit langem Partnern wie Anthropic angeboten. Nun setzt Microsoft die Maia 200 als Lockmittel ein, um kostenbewussten Startups zu zeigen, dass Azure der wirtschaftlichste Ort ist, um ihr Geschäft in großem Maßstab zu betreiben.

Perplexitys Wachstumskurve und Infrastrukturbedarf

Perplexitys Bewertung ist auf nahezu $9 Milliarden gestiegen, angetrieben von dem Versprechen, die „ten blue links“ der traditionellen Suche durch direkte, zitierte Antworten zu ersetzen. Dieses Modell ist jedoch rechenintensiv. Das Generieren eines Textabschnitts erfordert um Größenordnungen mehr Energie und Rechenleistung als das Abrufen einer Datenbankzeile.

Um sein Wachstum zu tragen, muss Perplexity die Latenz‑ und Kostenfrage lösen. Der Microsoft‑Deal bietet einen Weg, beides anzugehen. Durch die Nutzung von Azures globaler Rechenzenter‑Präsenz und potenziell der Inferenz‑Fähigkeiten der Maia 200 kann Perplexity seine „Pro“-Funktionen – etwa tiefgehende Recherchen und Dateianalysen – mehr Nutzern zugänglich machen, ohne die Margen zu verwässern.

Darüber hinaus vereinfacht der Zugang zu Microsoft Foundry die Modell‑Orchestrierungsschicht. Anstatt separate API‑Integrationen für GPT‑4, Claude 3 und Grok zu verwalten, kann Perplexity diese Anfragen über Azures Managed Service leiten, was die Zuverlässigkeit erhöht und den Engineering‑Aufwand reduziert.

Implikationen für das KI‑Ökosystem

Der $750‑Millionen‑Deal schlägt Wellen durch das breitere KI‑Ökosystem.

Die „Multi‑Cloud“-Realität: Startups weigern sich zunehmend, an einen einzigen Anbieter gebunden zu sein. Während Microsoft und OpenAI eine eng gekoppelte, fast exklusive Beziehung haben, zeigt der Perplexity‑Deal, dass Azure offen für Geschäfte mit anderen großen Akteuren ist, selbst solchen, die Modelle von Konkurrenten nutzen.
Validierung von Microsofts Hardware: Sollte Perplexity einen signifikanten Teil seines Inferenz‑Traffics erfolgreich auf Maia‑betriebene Instanzen migrieren, wäre das ein starkes Referenzbeispiel für andere Unternehmen. Es würde beweisen, dass Microsofts Chips eine praktikable Alternative zu Nvidias H100s für Produktions‑Workloads darstellen.
Druck auf Google: Perplexity ist wohl der direkteste Konkurrent von Google Search. Durch die Stärkung von Perplexity führt Microsoft einen Stellvertreterkrieg gegen Googles Kerngeschäft und zwingt Google, seine eigenen AI‑Overview‑Rollouts zu beschleunigen, oft zulasten seiner traditionellen Werbeerlöse.

Finanzielle Aussichten und Anlegerstimmung

Für Microsoft‑Investoren ist der Deal ein willkommener Hinweis darauf, dass die enormen Investitionen (CapEx) des Unternehmens in KI‑Infrastruktur in Form von umsatzgenerierenden Verträgen Früchte tragen. Es hatten sich Bedenken hinsichtlich der Rendite für die Milliarden ausgegebenen Dollar auf Rechenzentren aufgebaut. Ein $750‑Millionen‑Commitment von einem einzigen Startup hilft, die Nachfrageseite dieser Rechnung zu validieren.

Zudem spricht die Einführung der Maia 200 die Befürchtung der „Margenerosion“ an. Wenn Microsoft KI‑Workloads auf eigenen Chips statt auf teuren Drittanbieter‑GPUs bedienen kann, werden sich die Bruttomargen im Bereich AI‑Services im Laufe der Zeit verbessern.

Schlussfolgerung

Microsofts $750‑Millionen‑Vereinbarung mit Perplexity ist mehr als ein standardmäßiger Lieferantenvertrag; sie ist ein strategischer Zug, der Azures Stellung als Betriebssystem für das KI‑Zeitalter festigt. Durch die Kombination massiver Kapitalallokation mit der Einführung des Maia‑200‑Chips baut Microsoft eine vertikal integrierte Festung, die die nächste Generation von Tech‑Giganten anzieht. Für Perplexity bietet der Deal die Rechenleistung, die nötig ist, um seinen Angriff auf die traditionelle Suche fortzusetzen und sich in einer zunehmend ressourcenlimitierten digitalen Ökonomie zu behaupten.