中國人工智慧新創 DeepSeek 宣布推出升級版 DeepSeek-V3.1 模型,不僅在處理速度上有所提升,還具備針對國產晶片的最佳化功能。
根據公司公告,DeepSeek-V3.1 採用 UE8M0 FP8 精度格式,這是一種 8 位元浮點數運算方式,可在降低記憶體佔用的同時提升運行效率,並已針對「即將推出的下一代國產晶片」進行設計。FP8 被視為新一代 AI 模型的關鍵資料處理格式,能在相同硬體條件下加速訓練與推理。
由於美國出口限制,中國企業難以取得 NVIDIA H20 等閹割版 GPU,因此 DeepSeek 也開始調整模型架構,以配合未來國產晶片的發展。此次升級同時引入 混合推理架構,用戶可透過官方平台的「深度思考」按鈕自由切換思考與非思考模式。
此外,DeepSeek 表示,經過「思維鏈壓縮訓練」後,V3.1-Think 模型在各項任務的平均表現與 R1-0528 大致相當,但輸出 token 數減少 20% 至 50%,展現更高的運算效率。
(Source:Deepseek)
DeepSeek 今年以低成本 AI 模型震撼市場,被視為中國對抗西方技術的代表。此次 V3.1 升級凸顯公司正推動 AI 模型與本土半導體的深度結合,以減少對美國技術的依賴,並鞏固中國在新興 AI 生態中的自主優勢。不過,公司並未透露支援的晶片型號或製造商。
(首圖來源:DeepSeek )
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:骅梓)
我深感光荣、自豪和振奋人心。...[详细]
9月3日,李家超通过个人微博发文表示,自己有幸参加在北京举行的纪念大会和阅兵盛典,见证我们国家以最庄严的方式纪念胜利。...[详细]
来源:中国新闻网综合长江云新闻、央视网、法治日报、中国普法、南方都市报、九派新闻。...[详细]
据此前报道,比特币矿企Hut8首席执行官AsherGenoot在接受采访时表示,AmericanBitcoin与壳公司GryphonDigitalMining的合并交易预计即将落地,目标是在9月初上市...[详细]
到3日晚上8点,这些台湾线上渠道播放量已超500万。...[详细]
联销体是宗庆后在中国改革开放初期,信用体系不发达时的创新发明。...[详细]
7月3日,王一博经纪公司乐华娱乐发布维权声明,严正警告所有网络用户:立即停止发布及传播任何涉嫌侵害王一博先生名誉权等合法权益的信息。...[详细]
2,说特朗普很高兴吧,也不像。...[详细]
被保险人及其所在用人单位,必须依据国家法律规定的保险金额缴纳保险费,并不能自行选择缴费标准。...[详细]
空基战略导弹的正式亮相意味着我国成为现在世界上为数不多的拥有‘三位一体核打击力量的国家。...[详细]