DeepSeek被称为AI界拼多多,训练2个月仅花费了557.6万美元!
- 发布于:2025-01-28 14:19:27
- 来源:jrs低调看高清直播
1月28日讯 据钱江晚报报道,此次DeepSeek-V3在AI行业引发关注,关键的原因在于——超低的预训练成本。
“预训练”是AI大模型学习中的一种方法,指的是通过海量的数据,训练一个大模型。训练时需要大量的数据和算力支持,每次迭代可能耗资数百万至数亿美元。
官方技术论文披露,DeepSeek-V3在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。这个费用是什么概念?
据报道,GPT-4o的模型训练成本约为1亿美元。简单粗暴地说,这相当于DeepSeek-V3比同等性能的AI大模型,降了十几倍的成本。
早在2024年5月,深度求索发布DeepSeek-V2时,就曾因给模型的定价太过于便宜,开启了中国大模型的价格战,被称之为“AI界的拼多多”。
“相比于说它是‘拼多多’,它更像小米,贴近成本定价,并且自产自销。”马千里认为,训练成本比较低的原因,离不开深度求索团队自研的架构和算力,他们自身的算力储备可以与大厂比肩,并且更注重底层的模型。
“ChatGPT走的是大参数、大算力、大投入的路子,DeepSeek-V3的路径用了更多的巧思,依托数据与算法层面的优化创新,从而高效利用算力,实现较好的模型效果。”马千里说道。

- 体育战报 | 15岁小孩哥!伊朗选手法拉吉去年战胜王楚钦,今年赢下林诗栋
- 体育战报 | 乒乓球亚锦赛男团:中国队31战胜伊朗队,晋级四强
- 体育战报 | 世界田联公布年度最佳运动员候选:莱尔斯、麦克劳林等人在列
- 体育战报 | 票房首次破亿,上海大师赛再现“福地”效应
- 体育战报 | 斯诺克西安赛:马克威廉姆斯103墨菲,夺生涯第27冠
- 体育战报 | 中国女乒30横扫泰国女乒,晋级亚锦赛四强将战韩国
- 体育战报 | 王曦雨错失两盘领先02施奈德,止步宁波网球公开赛首轮
- 体育战报 | 表弟发言累到表哥腿抽筋成名场面,瓦舍罗委婉称费德勒帮到了自己
- 体育战报 | 费德勒上海开练梦回球员时期,穆雷调侃老费发球还能提升
- 体育战报 | 三项250赛开打,众球员冲刺年终总决赛!

- 欧冠 | 舍沃尔德父亲:五大联赛球队有意我儿子,但离开闪耀非好选择
- 中超 | CCTV5直播,申花核心外援复出,搭档吴曦镇守中场邵佳一全力阻击
- 英超 | 中超官方第24轮最佳评选:卡扎伊什维利领衔,刘若钒入选
- 英超 | 亚洲第一主场:大连英博本赛季场均58107人,排英超前6!
- 中超 | 中超第24轮最佳候选:卡扎伊什维利刘若钒在列
- 意甲 | 接连斩获意甲和国家队首球,佩杜拉:国米已计划加薪续约皮奥
- 西甲 | 皇马历史最佳阵容发布引争议!卡卡入选但克罗斯耶罗等皆落选
- 英超 | 托尼布鲁姆:英超转会费和薪资增长过快我不赞成海外赛
- 英超 | 密友:霍伊伦一家从未对曼联心存怨恨,离开也是正确的决定
- 西甲 | 争议!西甲最贵引援榜单发布:贝林厄姆封神切尔西坑了皇马