界面新闻记者 |
李开复自己带队研发的大模型来了。
11月6日,李开复披露了其AI创业公司零一万物成立7个月以来的最新进展:Yi系列两款大模型问世,包含34B和6B两个版本,目前都已开放免费商用申请。
继杨植麟的moon shoot.ai、王小川的Baichuan2-192K大模型之后,李开复的Yi系列模型再次刷新上下文窗口长度纪录——参数量达340亿的Yi-34B,可支持200K超长上下文窗口,可处理约40万汉字超长文本输入,是目前全球最长的上下文窗口。
34B的大模型是李开复心目中基础模型的黄金尺寸,其刚好达到了涌现的门槛,但又没有过大,既满足了精度的要求,又对训练推理成本友好。
李开复表示,在百模大战中,很多公司由于GPU不够或因为其他的商机原因弃基础模型而做行业模型,但基础底座模型才定义了行业模型的天花板。他认为Yi-34B是很好的底座模型,适合发挥于多元场景,亦能满足开源社区的需求,另一款Yi-6B则适合个人及研究用途。
出人意料地是,李开复在这场发布会上强调,零一万物会坚定不移地走消费者To C路径,做超级应用Super APP,做微信、抖音一类的应用,理由是“它们规模化、利润率和收入质量要高于大部分做商业、做系统集成的公司”。“AI 2.0时代到来了,最大的一个商机一定是超级应用。”李开复坦言。
但从AI 1.0时代和目前百模大战的情况来看,仍是大多数大模型仍选择从To B到To C的落地路径,全球大模型商业化灯塔OpenAI也是通过B端和C端的合作实现了ARR(年度经常性收入)接近10亿美金的规模。
零一万物AI Infra负责人戴宗宏向界面新闻进一步解释了其商业探索的主逻辑,“我们在整个过程中会关注实际消费方和使用方的ROI(投资回报率),只有ROI能打正,相应的算力投入、算法投入和研发投入才会真正有价值。”
在他看来,AI 2.0时代成本会极其高昂,更大的商业机会在于所产生价值的放大性,能不受限于太多的物理限制,“ROI做正之后无非就是规模化问题,也因此,零一万物可以坚定用C端推进商业化。”
作为创新工场的塔尖孵化项目,零一万物仅一轮融资后估值便超过10亿美元,达到独角兽水平。界面新闻还了解到,零一万物已完成的新一轮融资由阿里云领投,其首款预训练大模型Yi-34B已在阿里云魔搭社区开源首发。
另据李开复透露,零一万物还有一款千亿参数的100B模型已经启动训练,会在数月之内问世。