中國人工智慧新創 DeepSeek 宣布推出升級版 DeepSeek-V3.1 模型,不僅在處理速度上有所提升,還具備針對國產晶片的最佳化功能。
根據公司公告,DeepSeek-V3.1 採用 UE8M0 FP8 精度格式,這是一種 8 位元浮點數運算方式,可在降低記憶體佔用的同時提升運行效率,並已針對「即將推出的下一代國產晶片」進行設計。FP8 被視為新一代 AI 模型的關鍵資料處理格式,能在相同硬體條件下加速訓練與推理。
由於美國出口限制,中國企業難以取得 NVIDIA H20 等閹割版 GPU,因此 DeepSeek 也開始調整模型架構,以配合未來國產晶片的發展。此次升級同時引入 混合推理架構,用戶可透過官方平台的「深度思考」按鈕自由切換思考與非思考模式。
此外,DeepSeek 表示,經過「思維鏈壓縮訓練」後,V3.1-Think 模型在各項任務的平均表現與 R1-0528 大致相當,但輸出 token 數減少 20% 至 50%,展現更高的運算效率。
(Source:Deepseek)
DeepSeek 今年以低成本 AI 模型震撼市場,被視為中國對抗西方技術的代表。此次 V3.1 升級凸顯公司正推動 AI 模型與本土半導體的深度結合,以減少對美國技術的依賴,並鞏固中國在新興 AI 生態中的自主優勢。不過,公司並未透露支援的晶片型號或製造商。
(首圖來源:DeepSeek )
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:陈鹏)
如果把娃哈哈比喻作一棵树,枝桠是经销商体系,大大小小的果实是贡献程度不一的饮料单品,那么这棵树的树根,则是娃哈哈的管理体系。...[详细]
我国职工社会保险制度自建立起,就遵循了强制性的基本逻辑。...[详细]
[中东记者看阅兵后忍不住哭了]外籍记者看阅兵后忍不住哭泣:我特别希望中东能实现和平,过上像中国人一样的生活...[详细]
首次展出陆海空三位一体战略核力量[环球时报报道记者樊巍刘煊尊]在纪念中国人民抗日战争暨世界反法西斯战争胜利80周年阅兵式上,战略打击群的惊雷-1空基远程导弹、巨浪-3潜射洲际导弹、东风-61陆基洲际导...[详细]
9月3日举行的盛大阅兵式上,受阅官兵雄姿勃发、斗志昂扬,新型战车、无人作战、网电作战、高超声速、防空反导等国产现役主战装备和战略重器一一亮相,宣示了中国人民解放军粉碎台独分裂和外来干涉的钢铁意志和强大...[详细]
第一财经记者注意到,根据南京农业大学农学院、信息管理学院、理学院、园艺学院、工学院等多个学院公布的2026年推免工作方案,明确推荐条件之一为:必修课不及格记录不超过一门,且参加推免时经补考或重修(仅限...[详细]
邵永灵分析称,作为一款空射高声速弹道导弹,鹰击-21可用于打击一些时敏目标,特别是航母这样严密防护的高价值目标。...[详细]
如发现可疑情况,可通过12339国家安全机关举报受理电话、网络举报平台(www.12339.gov.cn)、国家安全部微信公众号举报受理渠道或直接向当地国家安全机关进行举报。...[详细]
刘某负责统筹,向某和伍某则主要负责包装发货,三人分工有序,生意做得有声有色。...[详细]
那么,这是社保新规吗?用人单位为劳动者缴纳社保,是现在才强制的吗?黎建飞:社会保险最重要的法律特征,就是其国家强制性,这是社会保险与商业保险的本质区别。...[详细]