世界杯官网 AMD前高管领衔24东谈主团队逆袭:硬编码芯片HC1打消每秒17000 token新冲破
发布日期:2026-02-22 11:09 点击次数:104

着手:ITBEAR科技资讯
一款名为HC1的AI推理芯片近日在硅谷激发平凡热心。这款由初创公司Taalas研发的芯片,凭借每秒17000个token的峰值推理速率,成为面前AI芯片领域的气象级居品。与传统决策比拟,HC1不仅将推理速率普及10倍,更将资本压缩至二十分之一,功耗贬低至十分之一,为LLM(大言语模子)的及时附近开辟了新可能。
HC1的中枢冲破在于其“芯片即模子”的架构打算。与传统将模子加载至内存的时势不同,Taalas团队胜利将Llama 3.1 8B模子固化在硅片上,通过掩模ROM时代打消模子与硬件的深度会通。这种打算虽断送了部分无邪性,却换来了极致的能效比——单颗芯片典型功耗仅250W,10颗芯片构成的工作器集群总功耗也不外2.5kW,可胜利接受旧例空气冷却决策部署。
性能对比数据突显了HC1的颠覆性。在换取模子测试中,Cerebras的推理速率为2000 token/s,SambaNova约为900 token/s,开云体育Groq为600 token/s,而英伟达Blackwell架构的B200仅350 token/s。HC1的17000 token/s发扬,相配于将行业标杆性能普及了数个数目级。这种上风源于其结构化ASIC打算理念:通过固定底层电路、仅治疗两层掩模的时势,将芯片开拓周期从传统6个月贬低至2个月,同期保捏打算资本可控。
时代打消层面,HC1接受台积电N6工艺,世界杯官网芯单方面积815mm²,解救开源生态。其改进性的存储架构包含可编程SRAM区域,用于保存微调权重(如LoRA)和KV缓存,而模子主体则通过掩模ROM固化推论。为弥补量化带来的精度失掉,讨论团队开拓了LaRA适配器进行重新磨练,并建树可调陡立文窗口,在无邪性与性能间取得均衡。这种“硬连线”打算虽濒临模子迭代风险,却为特定场景提供了前所未有的后果上风。
Taalas的运筹帷幄不啻于单芯片冲破。针对DeepSeekR1-671B等超大模子,团队漠视了多芯片协同决策:将SRAM部分拆分至稳重芯片,使单片HC1的存储密度普及至约20位参数。30颗定制芯片构成的集群可打消每用户每秒12000 token的处理速率,且资本不到同等GPU决策的50%。即使接头HC1每年更新的假定,其四年总资本仍优于GPU的四年更新周期。
这家诞生仅两年的公司,领有号称“AMD梦之队”的创始声威。聚首创始东谈主Ljubiša Bajić曾任AMD集成电路打算总监,主导过高性能GPU研发;Leila Bajić领有AMD、ATI、Altera的跨平台时代处罚训诫;Drago Ignjatović则是AMD前ASIC打算总监。三位时代首脑的深厚积淀,使Taalas在创立初期即赢得2亿好意思元融资,当今团队规模仅24东谈主,居品研发干涉仅3000万好意思元。
阛阓对HC1的评价呈现南北极分化。解救者合计其亚毫秒级延长将鼓励具身智能、及时交互等前沿领域发展;品评者则指出硬编码架构可能加速芯片落伍,尤其在模子迭代速过活益加速的布景下。这种争议赶巧响应了AI芯片打算的中枢矛盾:通用性与专用性的不朽博弈。Taalas的聘任,无疑为行业提供了一条激进却值得深念念的新旅途。
海量资讯、精确解读,尽在新浪财经APP
包袱裁剪:尉旖涵
{jz:field.toptypename/}