海通盘算机|DeepSeek初探:从V3到R1,高机能+廉价格翻开全新AI开展范式,推进AI在办公、教导、医疗普遍利用
海通盘算机|DeepSeek初探:从V3到R1,高机能+廉价格翻开全新AI开展范式,推进AI在办公、教导、医疗普遍利用
2025年02月09日 07:01
市场资讯
起源:海通研讨
杨林
海通盘算机首席剖析师
S0850517080008
DeepSeek热度低落,在168国度位居下载榜第一。近期,DeepSeek的热度居高不下。日前,英伟达、微软、亚马逊等AI巨子纷纭发布,已接入DeepSeek。DeepSeek在2024年12月26日推出V3模子(对标GPT4 o),因其明显的机能,用户敏捷开端增加,在1月20日宣布R1模子(对标 OpenAI o1)后,进一步出圈。依据七麦数据,停止1月30日,DeepSeek在168个国度位居下载榜第一名。1月24日,有名投资公司A16z的开创人马克·安德森发文称,Deepseek-R1是他见过的最令人赞叹、最令人印象深入的冲破之一,并且仍是开源的,它是给天下的一份礼品。DeepSeek日前最新开源模子DeepSeek-R1,用较低的本钱到达了濒临于OpenAI o1的机能。这一停顿破解了寰球AI工业临时以来“堆算力”的门路依附,其影响也进一步涉及了资源市场。
DeepSeek-V3:极低练习本钱带来微弱机能。2024年12月16日,DeepSeek全新系列模子 DeepSeek-V3 首个版本上线并同步开源。DeepSeek-V3是一个年夜型混杂专家(MoE)模子,领有671B参数,此中每个token激活37B。DeepSeek依据一系列片面的基准测试对DeepSeek-V3停止了评价。只管练习本钱不高,但片面的评价标明,DeepSeek-V3-Base已成为彼时最强盛的开源基本模子,而且在一系列尺度跟开放式基准测试中实现了与当先的闭源模子(包含GPT-4o跟Claude-3.5-Sonnet)相称的机能。DeepSeek-V3的完全练习仅破费278.8万GPU小时。假设H800 GPU的租赁价钱为每GPU小时2美元,DeepSeek-V3的总练习本钱仅为557.6万美元。
DeepSeek-R1:改革推理范式+强化蒸馏后果。1月20日,DeepSeek-R1正式宣布,其在后练习阶段年夜范围应用了强化进修技巧,在仅有少少标注数据的情形下,极年夜晋升了模子推理才能。在数学、代码、天然言语推理等义务上,机能比肩OpenAI o1正式版。DeepSeek经由过程DeepSeek-R1的输出,蒸馏了6个小模子开源给社区,此中32B跟70B模子在多项才能上实现了对标OpenAI o1-mini的后果。别的,DeepSeek-R1遵守MIT License,容许用户经由过程蒸馏技巧借助R1练习其余模子。DeepSeek-R1 API效劳订价为每百万输入tokens 1元(缓存掷中)/4元(缓存未掷中),每百万输出tokens 16元,在现在主流o1类推理模子中订价最低。对照来看,OpenAI o1每百万输出tokens 438元,是DeepSeek-R1的27倍以上。
咱们以为,DeepSeek系列模子的共通之处在于,都在凭仗对算法、框架跟硬件的协同优化,年夜幅下降了练习与应用本钱,同时保持了行业顶尖的机能程度,使其在性价比上远超同类竞品。特殊是 DeepSeek-R1,借助蒸馏技巧实现了低参数、低本钱与高机能的联合,这无疑将推进 AI 在办公、教导、医疗等浩繁范畴的普遍利用。这些经由蒸馏处置的轻量化模子,可能轻松停止端侧安排。值得一提的是,DeepSeek 的开源战略对 AI 利用发生了深远影响,攻破了多数企业的技巧把持,激起了其余企业跟科研机构的技巧翻新与摸索热忱,推进了AI技巧的疾速开展。总结来说,DeepSeek的系列模子正在经由过程高机能+廉价格的形式翻开全新的AI开展范式,AI片面落地的时期也在无望其的推进下减速到来。
危险提醒。AI技巧开展不迭预期,AI贸易落地不迭预期,市场竞争加剧的危险。
本择要选自海通证券研讨所研讨讲演:海通盘算机 | DeepSeek初探:从V3到R1,高机能+廉价格翻开全新AI开展范式
对外宣布时光:2025年2月7日
新浪财经大众号
24小时转动播报最新的财经资讯跟视频,更多粉丝福利扫描二维码存眷(sinafinance)