NVIDIA 與 Eli Lilly 斥資 10 億美元成立 AI 實驗室,推動突破性藥物發現
NVIDIA 與 Eli Lilly 宣布了一項具有里程碑意義的 10 億美元合作夥伴關係,將創建一個共同創新實驗室,專注於運用人工智慧改造藥物發現與藥品製造,目標是大幅縮短開發時程。

今年 KubeCon Europe 的敘事核心已明確轉向。如果說之前的版本是由將大型語言模型(Large Language Models,LLMs)整合到技術棧各個角落的瘋狂競賽所主導,那麼 KubeCon Europe 2026 則標誌著一個明顯的成熟期:重心已完全轉移到 AI 推論(AI Inference)。現場的工程師、網站可靠性工程師(SREs)和架構師的共識是,與 AI 「聊天」的興奮感正迅速被在生產規模下運行它的務實(且可以說更困難)挑戰所掩蓋。
在 Creati.ai,我們密切關注這一演變。幾個月來,論調已從「我們如何使用生成式 AI(Generative AI)」轉向「我們如何在雲原生(Cloud-native)環境中實現 AI 推論工作負載的運維化、安全化和成本優化?」KubeCon Europe 2026 給出了明確答案,強調了對雲原生計算基金會(CNCF)的一系列重大貢獻,這些貢獻承諾將曾經孤立、特定供應商的噩夢商品化。
本週主題演講和現場交流中最重大的收穫是 CNCF 加速了其 AI 工作組的路線圖,這得益於戰略性的捐贈,這些捐贈實質上正式化了 Kubernetes 上的 AI 標準。Nvidia 捐贈其 GPU DRA(Device Request Architecture) 驅動程序,簡而言之,正是雲原生生態系統一直渴望的缺失環節。
此前,在 Kubernetes 集群中分配和調度 GPU 資源是一個繁瑣、不透明的過程,通常與特定的私有驅動程序綁定。通過向 CNCF 捐贈,Nvidia 正在幫助將硬件調度的責任轉向原生 Kubernetes 調度器,而不是將其鎖定在特定供應商的抽象層之後。
該生態系統目前正受益於向開放標準的轉變,這些標準允許在不同基礎設施之間進行移植。以下是本次活動中展示的動搖 AI 基礎設施根基的主要技術變遷細目:
| 貢獻 | 類型 | 主要益處 | 運維影響 |
|---|---|---|---|
| GPU DRA 驅動程序 | 基礎設施 / 驅動程序 | Kubernetes 中 GPU 的統一調度 | 消除「調度稅」並減少資源碎片 |
| llm-d | 工作流編排 | 標準化的推論生命週期管理 | 平滑開源模型的部署和自動擴展 |
| 遙測標準 | 可觀測性 | AI 特有的指標整合 | 顯著改善即時模型健康監測 |
GPU DRA 驅動程序的整合重要性怎麼強調都不為過。通過轉向標準化架構,Kubernetes 調度器獲得了對 GPU 限制的深度原生理解。這是高效 雲原生 AI 的基石。當編排器深入了解設備的架構時,它就不再將 GPU 視為神秘的區塊,而是將其視為動態的、可共享的資產。
與此同時,llm-d(大型語言模型部署,Large Language Model Deployment)項目代表了開發人員的關鍵標準化層。就像 CSI(Container Storage Interface)重新定義了 Kubernetes 處理存儲的方式一樣,llm-d 正被定位為管理推論工作負載的事實標準。
雖然 KubeCon 慶祝了這些技術上的勝利,但現場也存在著一種謹慎的潛在主題,這與最近的行業對話相呼應——最明顯的是《The Register》最近關於 AI 代碼生成需要人工「照看」的報導。業界正意識到,雖然 AI 在編寫代碼方面變得越來越好,但基礎設施層級的複雜性也在並行上升。
如果一個 AI 模型消耗 5,000 美元的算力來生成一個 20 行的腳本,或者推論引擎在架構中製造了單點故障,那麼僅靠 AI 生成代碼是不夠的。這就是為什麼 CNCF 推入推論領域如此及時。它認識到 AI 開發人員與傳統軟體工程師一樣,無法逃避系統架構的限制。通過強化容器編排器與底層 GPU 硬件之間的層級,業界正在為大規模 AI 開發創造必要的「安全帶」。
隨著 KubeCon Europe 2026 的結束,企業的任務很明確:簡化技術棧。各組織正將重心從與雲巨頭的垂直整合轉向構建通用的、與雲無關的 AI 推論層。
技術負責人在未來幾個季度應該優先考慮什麼?
本週的會議不僅展示了閃亮的新工具;它還確認了「AI 時代」的實驗階段已正式結束。我們現在正進入生產、規模化和運維嚴謹性的時代。通過這些 CNCF 的捐贈,雲原生 AI 的底層機制終於得到了所需的徹底改造,以處理未來推論工作負載的巨大計算需求。