1月24日,岩芯数智正式发布自研大模型“Yan模型”。Yan模型采用非Transformer架构,为非Attention机制的通用自然语言大模型。据了解,该大模型有相较于同等参数Transformer的7倍训练效率、5倍推理吞吐和3倍记忆能力。
界面新闻
只服务于独立思考的人群
1月24日,岩芯数智正式发布自研大模型“Yan模型”。Yan模型采用非Transformer架构,为非Attention机制的通用自然语言大模型。据了解,该大模型有相较于同等参数Transformer的7倍训练效率、5倍推理吞吐和3倍记忆能力。
广告等商务合作,请点击这里
