淘宝数字人专利可模拟用户声音

天眼查知识产权信息显示,3月15日,淘宝(中国)软件有限公司申请的“基于数字人的视频生成与交互方法、设备、存储介质与程序产品”专利公布。

摘要显示,本申请实施例基于用户的声音特征和情感标签进行文本转语音处理,以及基于用户的声音特征和表情系数之间的映射关系进行语音转表情处理,并基于语音信号和表情系数渲染数字人模型,以得到数字人模型的视频数据。该专利精准地模拟用户的声音特征,确保了数字人的语音输出不仅听起来自然,而且实现数字人的个性化驱动,提高数字人在声音和动态形象方面的逼真度,进而提高用户体验,提升了数字人的互动性、真实感和沉浸感。

    广告等商务合作,请点击这里

    未经正式授权严禁转载本文,侵权必究。

    打开界面新闻APP,查看原文
    界面新闻
    打开界面新闻,查看更多专业报道

    热门评论

    打开APP,查看全部评论,抢神评席位

    热门推荐

      下载界面APP 订阅更多品牌栏目
        界面新闻
        界面新闻
        只服务于独立思考的人群
        打开