DeepSeek让大模型水涨船高
作者: 宋婧 来源: 中国电子报 编辑: 杨小婷 时间:2025-02-21 15:51:19
作为当前最为耀眼的AI明星之一,DeepSeek激起的AI热潮层层迭起,一浪接一浪。先是芯片厂商、云厂商、运营商、手机厂商、汽车厂商等竞相接入DeepSeek,掀起模型平权和应用浪潮;紧接着,ChatGPT和文心一言两大闭源模型代表同时宣布免费,并上线深度搜索功能,文心大模型4.5更是直接从闭源转为开源,DeepSeek的“鲶鱼效应”引发行业震动。然而,DeepSeek的后来居上、一骑绝尘也给豆包、Kimi、文小言等带来了巨大压力。滚滚洪流下,“豆包们”是被动跟随还是主动出招?又该如何书写新的篇章?
DeepSeek太快了,还是“豆包们”变慢了?
作为一款现象级大模型,DeepSeek走红的速度出乎所有人意料。在发布后短短一周内,DeepSeek就实现了用户破亿,打破了由ChatGPT保持的纪录;2025年1月27日,DeepSeek超越ChatGPT登顶美国应用商店榜首,之后在100多个国家陆续霸榜,同一天,英伟达股票狂跌17%左右,单股蒸发5890亿美元,这个数字创造了美股历史之最,没有之一;1月28日,DeepSeek日活跃用户数(约2063万)首次超越豆包(约1936万),并在3天后突破3000万大关达到了3286万,创全球最快纪录。截至目前,DeepSeek的日活用户量已超过4000万,达到ChatGPT日活用户量的74.3%。
而在此之前,字节跳动旗下的豆包、月之暗面的Kimi和百度的文小言曾是被业界寄予厚望的AI原生APP“三强”。研究机构QuestMobile发布的报告显示,截至2024年12月底,中国AIGC(人工智能生成内容)应用的月活跃用户规模达到1.2亿。彼时,豆包、Kimi、文小言的月活跃用户量分别为7523万、2101万和1224万,包揽了全行业80%的流量。其中尤以豆包用户数最多,约占行业63%的市场份额;Kimi用户增长速度最快,年复合增长率达到69.4%,是豆包的3倍、文小言的15倍。
彼时,QuestMobile判断称,虽然已与其他AI原生APP拉开差距,不过和微信、抖音、微博等动辄数亿的国民级应用相比,前三大AI原生APP还远称不上是超级应用,“三强”地位也并不稳固。如今,这一观点也得到了印证,DeepSeek一路狂飙,把曾经的AI原生APP“三强”远远甩在了身后。
“‘豆包们’增速放缓有迹可循。”成都市人工智能产业协会秘书长李娅娜在接受《中国电子报》记者采访时表示。在技术迭代上,“豆包们”普遍依赖通用性模型,复杂逻辑推理能力比DeepSeek低20%左右,Kimi在长文本处理能力上被DeepSeek超越,导致其用户增速下降了35%;在市场策略上,豆包虽然月活跃用户(MAU)达7861万,但海外用户占比仅15%,且未开放核心模型,限制了开发者生态扩展。相比之下,DeepSeek的开发者生态规模是豆包的3倍。此外,随着用户需求变迁,职场场景对AI专业度要求更高,根据用户反馈的数据,超60%的用户认为豆包在“深度思考”能力上存在不足。
不过,现在下结论还为时尚早。Gartner高级研究总监方琦对《中国电子报》记者说道:“DeepSeek-R1接近模型第一梯队的表现,将互联网搜索和推理模型的结合,让大量的用户得到了新的体验。但是从中长期来说,DeepSeek应用存在各种不稳定性,等用户的新鲜劲儿褪去之后,比拼的还是产品的运营以及是否能够真正帮助客户解决他们的问题,并持续提供优秀的用户体验。从这点来讲,‘豆包们’没有变慢,如何做好自己的产品能力和用户留存才是最重要的问题。”
只能被动跟随,还是应主动出招?
DeepSeek头顶的光环越亮眼,就越发映衬出“豆包们”的尴尬局面。“对投资人来说,DeepSeek出现以后很难再出现第二个了。豆包砸了这么多钱,DeepSeek零广告,却席卷全球。”洪泰基金创始人、资深投资银行家盛希泰感慨道。
实际上,“豆包们”也并非全无胜算。以豆包为例,背靠字节跳动,既有算力预算充足和数据高速增长带来的模型训练优势,又有以抖音为核心的自有流量池,豆包的竞争力并不弱。根据StrikeDigital统计的数据,截至2025年1月,TikTok(国际版抖音)的全球用户规模估计为20.5亿户,且预计每年将继续以2%至3%左右的速度增长,这也为豆包提供了天然的用户入口。
“通过硬件撬动AI软件的流量,也是一种很好的做法。”QuestMobile产业研究院研究总监陈燕表示,对比硬件上市前后的流量,耳机的出货量对豆包月活起到了比较好的拉动作用。据了解,字节跳动在2024年10月推出一款名为OlaFriend的智能耳机。如果用户想去调用AI功能,就需要下载豆包APP,这种硬件绑定的方式可以大幅提升大模型应用的用户黏性。
不过,豆包也存在劣势。比如,技术方面,模型创新性不足,在垂直领域的深度比行业领先模型低30%,主要依赖热点更新维持用户黏性;生态方面,开发者生态薄弱,企业级定制化服务能力受限,目前企业级客户数量仅为行业领先者的20%;全球化方面,进程相对滞后,在海外市场特别是欧美地区市场占有率不足5%,未抓住全球AI应用爆发期。
要在激烈的AI大模型竞争中分得一杯羹,“豆包们”必须主动出击,差异化破局。李娅娜指出,一方面,要聚焦垂直场景深耕,例如在教育领域开发针对学生个性化学习的专用模型,在医疗领域开发辅助诊断模型等,借鉴DeepSeek开源策略,开放API接口,吸引开发者,构建“模型+工具链+社区”生态。另一方面,像豆包、文小言等大模型的背后都有实力雄厚的母公司支持,应最大限度地撬动资源,打造差异化能力,比如Kimi强化情感交互、豆包探索“AI+短视频”内容生成,与DeepSeek形成场景区隔。此外,还应与华为昇腾、寒武纪等厂商合作,优化硬件适配,同时加速拓展海外市场,重点抢占东南亚、印度等新兴市场。
2025年将成为“大浪淘沙”的一年
从2023年的“百模大战”,到2024年令人眼花缭乱的行业应用,再到2025年的“大浪淘沙”,大模型行业的竞争格局正在从分散走向收敛。咨询机构弗若斯特沙利文指出,中国目前在通用基础大模型领域的竞争者已缩减至20余家,主要由互联网企业、云计算巨头及人工智能创业公司主导。
与产业链上下游相比,处于中游的模型厂商普遍面临盈利困境。一方面,从云服务商手中购买算力开支巨大;另一方面,产品商业化目前仍处于探索阶段,远未能形成稳定的和足够覆盖成本的收入。DeepSeek的出现有望改变这一局面,加速模型平权和普惠AI的到来。
“Gartner在2023年9月就提过真正做大模型的企业不会超过10家,在这一轮洗礼后,如果一个商业化模型的性能接近或者还比不上开源模型,那它的商业化就大概率不会成功。同时,开源模型厂商也需要找到合适的商业模式,可持续地为市场提供价值,对这类厂商来说这也是一个挑战。”方琦坦言。
“AI大模型洗牌趋势是从野蛮生长到价值验证,市场竞争的关键在于技术突破、生态构建与场景落地。”李娅娜表示。能存活下来的大模型应该具备三大核心特征:一是低成本与高性能平衡,如DeepSeek通过MoE架构将推理成本降低40%,并适配国产硬件;二是开源,开源模型将主导开发者生态,预计未来开源模型市场份额将达70%;三是专业化,教育、工业等细分领域专业化模型更具生命力,预计未来两年垂直细分领域模型市场规模将增长80%。而那些存在技术同质化问题、缺乏差异化能力、应用场景模糊、高度依赖于资本输血而非商业闭环的大模型将逐渐被市场淘汰,预计2025年将有50%以上的大模型因商业化失败而退出。
此外,全球化能力也很重要,必须做好本地化运营,避免困于单一市场。从目前国内外专业榜公布的相关数据来看,国内大模型除了DeepSeek、Qwen-Max(阿里旗下)等少数应用能够跻身全球前十排名以外,其他绝大多数大模型仍局限于国内应用榜内。DeepSeek的冲击尽管给它们带来了巨大压力,但也未尝不能成为本土大模型的“觉醒”动力。
“当前,AI行业竞争已从技术单点突破转向‘技术+生态+场景’综合较量。企业需以用户需求为导向,解决实际问题,如提升办公效率、辅助医疗诊断、优化工业生产等,在成本、性能、差异化中找到平衡,才能在浪潮中立于不败之地。”李娅娜表示。经过新一轮“大浪淘沙”,未来将会有更多“金子”破土而出,在国际市场上绽放光彩。