執行 DeepSeek R1 游刃有餘的 Apple M3 Ultra Mac Studio
Apple 最新推出的 Mac Studio,搭載強大效能與更高記憶體容量,成為高階專業工作者與 AI 相關開發的理想選擇。新款 Mac Studio 配備最多 32 個 CPU 核心與 80 個 GPU 核心,並支援高達 512GB 的統一記憶體。頂規版本採用眾所矚目的 M3 Ultra 晶片。
M3 Ultra 實際上是由兩顆 M3 Max 晶片透過台積電支援的先進晶片封裝技術 UltraFusion 結合而成。這項技術可使兩顆晶片邏輯上無縫結合,如同單一處理器般運作。這顆 SoC 擁有高達 1,840 億個電晶體,是目前 Apple 晶片家族中最強大的設計之一。
與前代 M2 Ultra 相比,M3 Ultra 的效能顯著升級。CPU 核心數由 24 核心(16 個效能核心 + 8 個節能核心)增加到 32 核(24 個效能核心 + 8 個節能核心),性能提升約 50%。而與初代搭載 M1 Ultra 的 Mac Studio 相比,整體效能更提升了 80%。GPU 部分也有所進化,從前代最多 76 核心,增加至 80 核心。核心數雖然增加不多,但實際效能增強主要來自 GPU 底層架構的改進。
Apple 之前聲稱,M3 GPU 核心比 M2 快 80%,這在一定程度上要歸功於硬體加速的網格著色和光線追蹤,M3 Ultra 上增加核心,使 GPU 的圖形工作負載速度大約是上一代的兩倍。
M3 Ultra 還搭載了 32 核神經網路引擎,可加速 Apple Intelligence 運算。最引人注目的升級之一,則是支援高達 512GB 統一記憶體。這一點對於 AI 開發者與研究人員來說意義重大,因為它使 Mac Studio 成為少數能夠在單一裝置上運行「超過 6000 億參數大型語言模型(LLM)」的消費等級電腦。
以近年備受關注的 DeepSeek R1 為例,傳統需仰賴大型資料中心或雲端平台來部署。M3 Ultra 的記憶體頻寬達 800GB/s,在如此高速且大容量的環境下,即便是在本地端,也能順利執行此類模型。值得一提的是,DeepSeek R1 採用了 Mixture of Experts(MoE) 架構,也就是「混合專家模型」,實際運作時僅需載入約 370 億個參數,因此在 512GB RAM 的 Mac Studio 上執行是可行的。
這種架構的好處在於可大幅減少模型在推論時的資源占用,同時保持高準確度。根據實測,Mac Studio 執行 DeepSeek R1 等大型模型時,其 token 生成速率約可達每秒 20 至 30 tokens,足以應付絕大多數開發與測試需求。這讓過去只能在雲端完成的模型調校、樣本生成與微調作業,如今有機會在本地進行,大幅提升靈活性與資料私密性。
這也是為什麼越來越多獨立開發者與 AI 愛好者選擇 Mac Studio 作為個人 LLM 開發主機:與使用雲端平台相比,長期來說更具成本效益,且完全掌握運算環境與模型行為,對於偏重隱私與模型控制的研究團隊來說尤為關鍵。
即使入門機型搭載的 M3 Max 晶片亦不容小覷。M3 Max 擁有最多 16 核心 CPU(12 個效能核心 + 4 個節能核心)、40 核心 GPU,並支援高達 128GB 記憶體,可滿足中階開發與創作用途。若再搭配高容量 SSD 或外接式 Thunderbolt 儲存裝置,對於進行中型 AI 模型測試、影音處理與科學運算等工作,亦相當實用。
M4 處理器登陸 MacBook Air
除了桌上型裝置,Apple 也更新了筆記型電腦產品,推出配備 M4 處理器的 MacBook Air。這款被動式冷卻系統設計的筆記型電腦不僅效能提升,且記憶體最少有 16GB,可應付日益複雜的應用需求。
M4 相較於前代提供多項優勢,其中最實用的一項,是支援多螢幕輸出,讓 MacBook Air 對於創作者更具彈性。13 吋機型搭載的是 M4 的輕量版本,擁有 8 核心 GPU,與 MacBook Pro 上使用的 10 核心 GPU。但是,其效能表現與記憶體配置仍遠勝以往,適合日常工作、多工處理及小型創作使用。15 吋版本則配備完整的 M4 晶片與 10 核 GPU,搭配更寬廣的視覺空間,成為喜歡大螢幕輕薄筆電的使用者首選。
Apple 新一代 Mac Studio 與 MacBook Air 的升級,代表著更大的自由與效能彈性。無論是創作者、工程師,還是希望在本地端部署 AI 模型的技術用戶,都能享受更高的處理效能,並獲得穩定且流暢的使用體驗。