久久午夜影院,91精品国产调教在线观看,日韩午夜免费,伊人久久大香线蕉av不卡

你的位置:首頁 > 電源管理 > 正文

24人團隊挑戰英偉達?Taalas HC1橫空出世:將大模型直接“刻”進硬件

發布時間:2026-02-25 來源:轉載 責任編輯:lily

【導讀】由前AMD集成電路總監、Tenstorrent創始人柳比薩·巴吉克(Ljubisa Bajic)領銜,Taalas于2026年2月正式浮出水面,宣布完成超2億美元融資并推出首款將模型權重直接固化于硬件的HC1平臺。這款僅由24人團隊耗時兩年打造的芯片,宣稱能將Meta Llama 3.1 8B模型的推理速度提升至每秒17000個token,成本僅為傳統GPU方案的幾十分之一,甚至有望讓大模型推理進入“亞毫秒級”時代。


forward.jpg


一夜之間,Taalas的產品刷屏硅谷,社交平臺網友紛紛開啟實測,并稱其性能驚人、將給英偉達GPU帶來巨大挑戰。HC1采用臺積電6nm制程,芯片面積與英偉達H100芯片相當,為815平方毫米。HC1芯片可以將整個8B版本的Llama 3.1模型集成到單顆芯片上。Taalas還模擬了DeepSeek R1-671B的多芯片解決方案,其存儲整個671B模型采用了大約30顆定制芯片,模擬結果表明,DeepSeek R1-671B每用戶每秒可生成約12000個token;Llama 3.1單個用戶的生成速度可達17000 token/秒,速度接近Cerebras推理平臺的10倍,英偉達H200的73倍、B200的48倍,構建成本為Cerebras現有方案的1/20、功耗僅為1/10。


Taalas創始人兼CEO柳比薩·巴吉克(Ljubisa Bajic)曾任職AMD集成電路設計與架構總監、英偉達高級架構師。他2016年創立AI芯片公司Tenstorrent,2023年將其交接給吉姆·凱勒(Jim Keller)后,又創辦了Taalas。Taalas的另外兩位創始人是巴吉克的妻子、曾在AMD擔任系統工程高級經理的萊拉·巴吉克(Lejla Bajic)以及曾在AMD擔任高級設計工程師、在Tenstorrent擔任工程師的德拉貢·伊格(Drago Ignjatovic)。不過在社交平臺上,有不少用戶吐槽:Taalas的產品確實快,但錯誤率過高。芯東西提問了“9.9和9.11比大小”以及經典的雞兔同籠題目,該模型分別在0.001秒、0.017秒內給出了錯誤答案。


巴吉克稱,Taalas的極端方案可能很適合某些特定應用,本質是找到追求經濟效益和速度而犧牲靈活性的方法。


Taalas還透露了下一步計劃,他們將基于HC1為第二款中等規模的推理模型打造芯片,該模型預計于今年春季在實驗室完成流片,并很快集成至其推理服務中;隨后,該公司將基于第二代芯片平臺HC2推出新大語言模型,HC2將提供更高的算力密度與更快的執行速度,計劃在今年冬季正式部署。


01.極致性價比30顆芯片模擬部署DeepSeek R1

2月20日,Taalas正式推出首款芯片平臺HC1,該平臺已集成Meta Llama 3.1 8B模型,用于聊天機器人演示與推理API服務。其官方博客提到,基于HC1,Llama 3.1單個用戶的生成速度可達17000個token/秒,速度接近Cerebras推理平臺的10倍,構建成本為Cerebras現有方案的1/20,功耗為1/10。Taalas發布了HC1集成Llama 3.1 8B的免費試用鏈接。芯東西提出的需求是“請詳細提供1960年至1972年阿波羅計劃逐年的完整歷史,包括任務目標、技術挑戰、核心人員、飛行里程碑與科學發現。”Llama 3.1僅0.078秒就輸出了答案,每秒可輸出15694個token,其輸出內容對關鍵分類進行了羅列。


根據Taalas發布的成本與延遲對比數據,基于Taalas的芯片方案,Llama 3.1 8B的推理查詢成本為每百萬token 0.75美分(約合人民幣0.052元),DeepSeek R1的成本為每百萬token 7.6美分(約合人民幣0.53元)。相比之下,Llama 3.1 8B在GPU吞吐量優化方案上的成本為每百萬token 3.79美分(約合人民幣0.26元),DeepSeek R1為20.2美分(約合人民幣1.4元),延遲優化方案中,Llama 3.1 8B的成本為28.61美分(約合人民幣2元),DeepSeek R1為49美分(約合人民幣3.37元)。


可以看出,Taalas在token生成成本、延遲上相較英偉達GPU效果都更好,尤其在參數規模更小的模型上更是實現了數量級的領先。該公司的第一代芯片平臺HC1采用了自定義的3位基礎數據類型,這是因為他們在進行研發設計時,低精度參數格式尚未形成標準。集成Llama時,Taalas還采用了激進的量化方案,混合使用3位與6位參數,相較于GPU基準測試,會帶來一定的精度損失。Taalas的收入來源將分為兩塊,推理即服務、HC硬件。在官宣博客中,Taalas將基于Llama 3.1 8B的HC1稱作測試版服務,其目的是讓開發者體驗大模型推理實現亞毫秒級速度、且成本近乎為零的同時,探索更多新應用。這一服務預計不會產生顯著收入。


02.遵循三大原則2個月內完成芯片定制

一般而言,對于更新的模型,Taalas能在不到兩個月內完成芯片定制。巴吉克對此的解釋是,由于Taalas的芯片高度專業化,其設計比英偉達的同類產品更簡單,因此生產速度更快。例如一塊Taalas芯片就能容納一個完整的大語言模型,將模型及其權重硬編碼到HC1中,然后將整個模型嵌入到定制的專用芯片中,而無需像英偉達和其他公司那樣依賴外部高帶寬內存。這一過程中,該公司遵循三個原則。第一是完全定制化(Total specialization):其團隊認為,在計算機發展史上,深度專業化一直是讓關鍵工作負載以極高效率運行的最可靠途徑之一。因此,Taalas會為每個單獨的模型生產最佳芯片,也就是將特定的模型神經網絡映射到芯片本身,從而針對每個模型優化基礎設施。第二是實現存儲與計算融合:此前,AI推理芯片架構設計中計算與存儲相互分離,且二者運行速度存在顯著差異,這直接導致當前AI推理硬件架構日趨復雜。系統不僅需要依賴先進封裝、HBM堆棧與超高I/O帶寬,再加上單芯片功耗攀升,有時必須依靠液冷方案才能穩定運行。其博客提到,Taalas的突破性就在于,將存儲和計算統一在單個芯片上,并達到DRAM級別的密度,以此來解決此前計算和內存分家的痛點。第三是極致簡化(Radical simplification):在融合存儲與計算,并針對每個模型定制芯片的基礎上,Taalas可以從根本上重新設計整個硬件堆棧。其最終得到的系統不依賴于復雜或特殊的技術,不需要HBM、先進封裝、3D堆疊、液冷等。HC在設計時還進一步降低了AI部署中的能耗和成本。HC系統每個機架的能耗為12-15千瓦,GPU每個機架的能耗則高達120-600千瓦。再加上Taalas的機架可采用風冷散熱,從而進一步降低數據中心的改造成本。此外,Taalas HC1 PCIe卡幾乎可以安裝在任何服務器中,并支持英特爾和AMD的CPU。


03.業界好評與擔憂并存缺乏靈活性、機架壽命短引熱議

憑借HC1的性能和極低成本,Taalas近期獲得了不少關注,但業界仍提出了反對意見。其優勢顯而易見。即便云服務商每次模型更新時都要更換數千顆加速芯片,在四年的可比使用周期內,Taalas方案的資本支出(CAPEX)仍能比其他AI加速方案節省60%–75%,同時還能為用戶提供全球最快的AI推理服務。企業擔憂的關鍵之一在于,Taalas的方案缺乏靈活性。使用其方案的企業將不得不長期適配同一固化模型的多個迭代版本,同時還要部署不同的芯片版本來運行各異的模型。如此繁多的版本,會加重數據中心的運營復雜度。但《福布斯》認為,即便如此這套方案依然非常劃算。因為如果一家數據中心只有少數幾個模型,卻占用了生產環境中絕大部分AI推理算力,那用這種專用芯片的性價比會很高。企業擔心的另一個點是Taalas機架的使用壽命較短。目前,英偉達和AMD的更新周期都是以年為單位,但Taalas的模式就意味著,每個模型都要跟著更新。大模型基本1~1.5年就會迭代一次,而新一代芯片的研發通常需要2~3年。針對這一隱憂,Taalas的應對策略是,通過對兩層金屬層進行改動來升級基礎邏輯層,無需徹底重新設計。《福布斯》估計,Taalas很可能讓臺積電預先存儲未完成的晶圓,以便添加這兩層金屬互連層,從而實現在兩個月內完成交付。


總結

Taalas的橫空出世無疑為AI基礎設施領域提供了一種極具顛覆性的新思路:通過“存儲計算融合”與“模型硬件固化”,它成功打破了傳統馮·諾依曼架構中內存墻的限制,在特定模型的推理速度與能效比上實現了對英偉達等通用GPU方案的代際超越。其提出的“兩個月定制芯片”模式及極致的成本控制,證明了在追求經濟效益和極速響應的垂直場景中,專用ASIC架構擁有巨大的應用潛力。


3-958x200_20251021044704_586.png

特別推薦
技術文章更多>>
技術白皮書下載更多>>
熱門搜索

關閉

?

關閉

久久午夜影院,91精品国产调教在线观看,日韩午夜免费,伊人久久大香线蕉av不卡
91精品一区二区三区综合| 天堂网在线观看国产精品| 尤物在线精品| 久久久久网站| 欧美日韩国产免费观看 | 国产成年精品| 毛片在线网站| 久久在线电影| 欧美日韩视频一区二区三区| 亚洲黄页一区| 日韩影片在线观看| 国产精品一级| 国产一区二区色噜噜| av综合电影网站| 欧美日韩第一| 中文精品在线| 日产欧产美韩系列久久99| 日韩激情av在线| 久久麻豆视频| 成人日韩精品| 丝袜脚交一区二区| 国产欧美三级| 日韩精品看片| 亚洲一二av| 国产极品模特精品一二| 亚洲永久av| 日韩视频一区| 欧美一区二区三区久久精品| 国产成人免费| 国产亚洲亚洲| 日韩不卡在线观看日韩不卡视频| 久久婷婷国产| 激情偷拍久久| 欧美一区91| 日韩免费小视频| 免费在线视频一区| 久久av超碰| 国精品一区二区| 青草av.久久免费一区| 国产精选在线| 中文字幕一区二区三区日韩精品| 嫩呦国产一区二区三区av| 欧美一区三区| 91大神在线观看线路一区| 日韩欧美看国产| 亚洲欧美日韩专区| 麻豆视频一区二区| 一本一本久久| 久久av免费| 影院欧美亚洲| 美女国产一区二区三区| 国产一区日韩欧美| 国产精品视频3p| 9色国产精品| 久久一区精品| 免费成人性网站| 欧美少妇精品| 日韩超碰人人爽人人做人人添| 精精国产xxxx视频在线野外| 日本精品一区二区三区在线观看视频| 欧美xxxx中国| 日韩高清不卡一区| 国产精品99一区二区| 久久亚洲黄色| 日本va欧美va瓶| 国内精品福利| 国产精品国产三级国产在线观看| 亚洲专区视频| 久久精品国产68国产精品亚洲| 国产毛片精品久久| 亚洲综合日韩| 亚洲风情在线资源| 婷婷精品在线| 狠狠干综合网| 日韩免费一区| 国产乱码精品| 亚洲精品字幕| 国产二区精品| 电影亚洲精品噜噜在线观看| 国产另类在线| 亚州精品视频| 国产精品日本| 久久中文字幕二区| 精品一区二区三区四区五区| 日日夜夜免费精品视频| 在线一区视频| 日本久久成人网| 精品久久网站| 久久国产精品免费一区二区三区 | 免费欧美一区| 精品久久国产一区| 欧美日韩99| 亚洲人亚洲人色久| 久久成人精品| 在线成人直播| 欧美福利在线| 91精品久久久久久久久久不卡| 久久久久久婷| 精品久久99| 久久一区国产| 久久这里只有精品一区二区| 日韩va亚洲va欧美va久久| 蜜桃视频第一区免费观看| 99视频精品免费观看| jiujiure精品视频播放| 久久精品动漫| 亚洲四虎影院| 日韩天堂在线| 香蕉成人av| 蜜桃精品在线| 日本国产精品| 91精品一区国产高清在线gif | 亚洲1区在线观看| 久久亚洲二区| 免播放器亚洲| 亚洲综合不卡| 蜜桃久久久久久久| 日韩精品一区第一页| 中文一区一区三区免费在线观 | 91麻豆国产自产在线观看亚洲| 国产精品一区三区在线观看| 国产三级一区| 国产探花一区二区| 国产视频网站一区二区三区| 国产日韩亚洲| 欧美经典一区| 国产成人精品一区二区三区在线| 精品美女在线视频| 精品精品久久| 中文字幕高清在线播放| av高清一区| 性欧美xxxx免费岛国不卡电影| 99精品网站| 91成人网在线观看| 亚洲一区二区三区免费在线观看 | 日本成人在线不卡视频| 日本不卡的三区四区五区| 欧美一区二区三区免费看| 国产精品久久久久9999高清| 久久99精品久久久久久园产越南| 国产一区三区在线播放| 国产精品久久久久久久久妇女| 韩国精品主播一区二区在线观看 | 黄毛片在线观看| 久久久水蜜桃av免费网站| 91精品1区| 最新亚洲国产| 国产精品密蕾丝视频下载| 久久久久久久欧美精品| 国产精久久久| 日韩欧美一区免费| 欧美精选一区二区三区| 中日韩男男gay无套| 婷婷综合一区| 久久亚洲黄色| 免费毛片在线不卡| 日韩欧美中文字幕电影| 麻豆精品新av中文字幕| 欧美成人精品三级网站| 激情综合网址| 日本成人在线一区| 国模精品一区| 欧美午夜不卡| 久久国产麻豆精品| 国产综合色区在线观看| 丝袜美腿亚洲一区| 国产精品久久久久av蜜臀| 欧美精品日日操| 一级欧美视频| 久久精品国产99国产| 国产一区亚洲| 97久久中文字幕| 亚洲人成在线网站| 三级久久三级久久久| 国产成人精品三级高清久久91| 黄色亚洲免费| 欧美国产另类| 午夜久久美女| 国产精品久久| 五月天综合网站| 国产精品久久久久久久久久妞妞| 日本欧美不卡| 日本欧美大码aⅴ在线播放| 国产精品羞羞答答在线观看| 久久裸体视频| 久久国产尿小便嘘嘘| 亚洲韩日在线| 欧美在线不卡| 欧美+亚洲+精品+三区| 国产精品一区高清| 91精品电影| 欧美国产日本| 蜜臀av亚洲一区中文字幕| 日产精品一区二区| 日本va欧美va瓶| 欧美1区免费| 精品一区视频| 日韩国产在线一| 久久理论电影| 国产亚洲观看|