国产大模型的竞争突然转向了长文本。
最初,是月之暗面宣布旗下对话式AI助理产品Kimi已支持200万字无损上下文输入;而后,阿里宣布免费面向大众开放最高1000万字的长文本处理能力;有报道称百度也将在4月开放长文本能力,文字范围在200万字—500万字。
这多少有些令人意外——Sora问世之时,人们争相讨论的尚是AI技术是否迈过了一个全新的里程碑、文生视频将如何颠覆现有产业格局。
“长文本的竞争,并不是技术的竞争,而是商业模式之争,本质上是消耗更多算力来取悦用户。”工业和信息化部工业文化发展中心AI应用工作组执行组长、行行AI董事长、顺福资本创始人李明顺在近日接受《每日经济新闻》记者专访时表示。
“错失恐惧”的焦虑和“巨头游戏”的压力兼具,李明顺穿梭于中、美、日、东南亚之间,专注AI领域和全球跨境项目的投资,而在此之前,他已在互联网行业浸润24年,并在15年前活跃于早期投资领域。
今年年初,李明顺前往美国硅谷参访。在长达一个月的时间里,他在当地接触了四十余个创业团队,希望寻找大模型技术爆发中“超级应用”的方向。在他看来,解决大模型普惠的钥匙依旧是超级应用,而当前尽管大模型已经成为被数亿人使用过的工具,但频度依旧不够,大模型应用在商业闭环中尚未找到最佳解决方案,这是中美技术界共同面临的挑战。
AI优先:“没有AI,可能在硅谷就融不到钱”
当今的科技圈几乎言必称AI,这在中美两国都没什么差别。
“如果做一个新项目,里面没有AI,可能在硅谷就融不到钱,招人的时候,好的人才可能会觉得项目不够‘漂亮’,而客户则会疑惑这是一个什么样的公司。”这是李明顺观察到的硅谷的一种“共识”。
AI优先是当今的硅谷内各类项目的显著特点,这与十年前移动互联网席卷各行各业时如出一辙。“AI会成为改造原有生产力的最重要的工具之一,‘强应用+多模型’的生态正在各行各业诞生。”
李明顺硅谷之行所接触到的多是华人创业团队,他们或是有大厂的工作经验,或是毕业于顶尖名校。这些创业者亦是华人工程师在这波AI浪潮中的缩影,他们大多拥有强大的技术背景,致力于提升AI的认知能力,通过不断优化参数与同行展开激烈竞争,更倾向于在技术层面寻找创业的突破口。
李明顺在演讲 图片来源:受访者供图
与美国的情况有所不同,中国的创业者们更倾向于在应用场景中发掘机会,例如社交、娱乐以及与电商结合的商业应用等。
“这是中美之间各自寻找的方向,也是各自的优势所决定的。”李明顺解释称,鉴于当前投资环境的变化,创业者获取融资的难度更大,长期研究所需的成本可能难以覆盖,如果没有充足的风险投资(VC)支持创业者进行长期研究,就必须迅速实现商业成果,完成商业闭环,以确保项目的可持续发展。因此,中国的创业者也就更加“务实”。
不同于互联网时期的创业潮,李明顺认为,当前的大模型创业潮与绝大多数创业者是无关的。
这不难理解。当前AI大模型的创业者,要么是全球知名的顶级学霸,如月之暗面的杨植麟、智谱AI的张鹏,要么是早已荣誉加身的业界知名大佬,如李开复、王小川。
与此同时,早期投资人似乎在“退场”。
在上一轮互联网创业热潮中声名大噪的金沙江创投主管合伙人朱啸虎明确表示,自己不会投目前市场上任何一家中国大模型公司,“因为一看就知道,这个肯定没戏”,并直言自己没有投Mini Max是因为“一开始就很贵”。
“以前的游戏规则已经失效。”作为一个关注早期项目的投资人,李明顺坦言,当前的大模型创业潮中,早期投资人所能发挥的作用很小。此前,早期投资人辅助着企业在婴儿期、幼儿期的发展后退出,而项目未来的成长有后续A、B、C轮融资支撑;如今,仅把项目培养至婴儿期并不能保证“成功”,现在的大模型初创企业大多在“Day 1”就需要集合多种资源的庞大资金,离开大额资本的支持将很难发展。
朱啸虎的“不投”,李明顺赞成一半。
“大部分应用如果仅仅是‘套皮应用’,就没有商业价值,随着模型的不断演进,很多应用将被覆盖。”李明顺认为,在当前环境下,从商业角度出发,AI应用在中国显得尤为重要。特别是在多数商业场景中,应用需要具备足够的深度。如果只是简单地利用大模型进行轻度调用,这种商业模式的根基不够稳固。
不过,从生态角度,AI大模型却是不得不投。李明顺认为,AI已成为国家之间的竞争焦点,中国若放弃在大模型领域的投资,可能会错失未来的发展机遇,因而国家背景的基金参与大模型的基础研究投资是非常必要的。
洗牌不可避免:“AI四小龙”的潮起潮落不代表大模型的成败
AI领域掀起创业热潮并非史上第一次,“AI四小龙”正是上一轮浪潮中的佼佼者。
2017年时,在刷新了单笔融资纪录后一个月,旷视科技创始人印奇曾称,未来两年会有纯人工智能的公司上市,希望旷视科技会是第一个。然而“AI四小龙”围绕“第一股”展开的拉锯战,最终以商汤科技“后发制人”登陆港股落幕。
有观点认为,商汤科技的投资回报表现会是这一轮大模型创业公司的下限,但李明顺并不认同。在他看来,从投资回报率的角度来看,“AI四小龙”并不理想。不过,它们的潮起潮落也并不代表这波大模型公司的成败,因为在那个时期,AI是被高估的。
回头复盘,“AI四小龙”的技术原理并不如预想中具有革命性,视觉技术在多数应用场景,如安防和交通领域,所发挥的作用相对有限。后来这种技术迅速扁平化,失去了原有的壁垒,项目在初期获得了超过其商业成就的估值,最终导致了资本退出时的“滑铁卢”。
“在当前众多竞争者均表现出色的背景下,除了技术实力外,商业模式的完整性和可持续性至关重要。”李明顺预判,国内头部大模型在下一阶段可能会面临一次洗牌,这一趋势不可避免——若企业持续投入资金而无法形成商业闭环,最终依旧要面临投入由谁买单的问题。
李明顺在英伟达总部 图片来源:
“明年这个时候,大概率会有一些公司产生合并,因为这一轮它们的估值都到了几十亿美元的规模,再融一两轮,如果有些公司融不到钱,可能就会被甩开。”
洗牌不可避免,但这并不影响这波大模型热潮的价值。李明顺认为,不同于“AI四小龙”时期AI是少数公司的“专利”,未来AI将渗透到各个行业,就像数字化对于当前公司的不可或缺性一样,AI也将成为未来所有公司竞争的核心力量。
李明顺坚信,大模型是AI的“iPhone时刻”,在应用领域的拓展潜力巨大,回报同样可观。
而在这一轮大模型热潮中,李明顺在坚定地寻找应用领域的创业者。
在李明顺看来,大模型应用若能与特定场景紧密结合,不是简单地套用,就具有实际投资价值。在与众多创业者交流时,他也鼓励创业者专注于深度的行业和产业应用开发,而非仅仅局限于当前热门但较为“肤浅”的领域,如换脸、制作表情包等。这些应用虽然在短期内可能吸引一定关注度,但长远来看缺乏真正的核心竞争力,难以形成稳固的市场壁垒。
也正是出于这一逻辑,在当前的投资决策过程中,李明顺并不过分关注项目中的AI成分,而是聚焦于市场本身的价值及其潜在的增长空间。
对于好项目的评判标准,他的四条准则是:用最先进的AI技术;赋能最成熟、最“肥”的商业场景;充分利用中国强大的供应链和生产能力,这包括传统制造业的硬件资源以及工程师等软性资源;在全球范围内寻找最适合、最强大的团队。类比而言,就如同在汽车行业这一成熟的商业场景里,智能电动车和无人驾驶等AI技术的发展使汽车更加科技化,这就是好项目。
寻找超级应用:部分大模型公司要转向垂直领域求生
“寻找超级应用”永远是新技术走向普惠的关键。就像当初人们在移动互联网时代寻找到微信、美团、抖音,将移动互联网迅速普及化一样,在大模型时代,解决大模型普惠的钥匙依旧是超级应用。
“科技对我们生活的改变,是润物细无声的。”李明顺以移动支付的普及为例:尽管此前已有相当的进展,但直到微信红包的推出,给了一些本不熟悉技术的人群接触和使用移动支付的契机,这一技术才算是走向了普惠。
大模型同样需要一个更加普及、受欢迎的应用,让“iPhone时刻”再升华一步,覆盖更广泛的三线、四线,甚至偏远地区的用户。
寻找超级应用是中美技术界共同面临的挑战,即便是OpenAI也没有实现超越——尽管大模型已经被数亿人使用过,但高频度依旧不够,因此大模型的应用在商业闭环中尚未找到最佳解决方案。
图片来源:视觉中国-VCG31N2008743681
但李明顺认为,当前已经无限逼近于大模型第二波浪潮的来临,就像iPhone诞生后,真正的超级应用在四到六年后才逐渐崭露头角,如微信、抖音、头条、滴滴和美团等。这些应用经历了一个孕育期,进而实现了真正的爆发式增长。
不过,李明顺也指出,当超级应用被找到,未来仅需要大模型底座,可能仅有少数几家公司存活,其他公司可能会将焦点转向特定领域的场景价值挖掘——这意味着有一部分大模型公司要转型成垂直领域的应用公司。
“我们在不同领域里都看到了一些应用的雏形,但是距离超级应用还需要一些时间。”李明顺认为,国内做得比较好的大模型公司如Kimi,月活数据也仅仅达到200多万,尚未达到超级应用的量级。
此外,许多在垂直领域的应用,无论是面向B端还是与特定行业结合的应用,用户规模则更小。尽管这些应用可能在商业回报方面表现良好,如在电商领域已有超过亿元的收入,但依旧不能被称为是超级应用,只能称为一个很好的商业模式。
更大的机会究竟是在C端还是B端?李明顺认为,C端无疑是一个巨大的市场,但B端市场同样毋庸置疑。
“我们对大模型的看法是,它不是一个单纯的技术,大模型在把所有的AI进行重构,比如多模型多模态,然后就诞生了2.0时代的AI。”李明顺说,B端路线的公司稳健性更高,能够更快与商业场景结合,存活的可能性也更大;但是C端一旦挑战成功,企业的价值可能会更加显著。
“就像珠峰的两面,谁爬到最高峰其实都不容易,只是看你爬的是哪一面。Kimi和智谱我都很看好,但是我认为最终(在行业洗牌期)他们都需要面临生死存亡的挑战。”
在追求超级应用的过程中,最大的挑战不仅仅是确定哪个场景将成为其诞生地,大模型的理解力探索之路也仍然漫长。技术上,大模型仍需进一步的技术突破,以确保结果的精确性。尽管目前行业广泛采用Transformer模型体系并已发展至万卡时代,但这些模型的理解力仍基于逻辑,未能达到真正的认知水平,即具备独立思考和价值情感判断的能力,且当前这条路径也面临算力、能源方面的挑战。
然而,作为商业应用,创业者不必过于深究这些理论上的可能性,应当更加关注大模型当前的成熟度,以及它们能在哪些场景下替代传统应用,进而改变人类的工作方式。
“相当于今天只有刀,就先让刀成为生产力,用刀切菜、打猎,到了火枪时代,再用枪去打猎。我们只能随着这个时代的进步去做这个时代的具体应用。”李明顺说道。