科技前線
Jason··1 分鐘閱讀
Perplexity AI 發表邊緣雲端混合推論系統,開拓硬體整合新局
Perplexity AI 於 Computex 2026 發表混合推論系統,可自動切換邊緣設備與雲端模型運算,優化 AI 執行效率。
Perplexity AI 於 Computex 2026 發表混合推論系統,可自動切換邊緣設備與雲端模型運算,優化 AI 執行效率。
Cerebras Systems 聲稱其晶片運行兆級參數 AI 模型 Kimi K2.6 的速度可達每秒近 1,000 個 token,效能優於現有 GPU 雲端供應商,這標誌著高效 AI 晶片對傳統運算架構的強力挑戰。
AI 多代理系統透過 embedding-space 通訊與管理型 AI Agent 技術,顯著提升了推論速度並降低了運營成本,推動企業 AI 自動化發展。
新創公司 Gimlet Labs 獲 8000 萬美元 A 輪融資,旨在開發讓 AI 模型能跨 NVIDIA、AMD、Intel 等多種硬體架構運行,以解決當前 AI 推論瓶頸與硬體依賴問題。
Gimlet Labs 獲 8000 萬美元融資,其技術旨在實現 AI 推理運算在多種硬體架構(NVIDIA, AMD 等)上的無縫運行,降低企業成本。