腾讯公司申请模型训练专利,提升第一语言模型的自然语言处理能力
金融界2023年12月12日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“模型训练方法、自然语言处理方法、装置及存储介质“,公开号CN117216544A,申请日期为2023年5月。
专利摘要显示,本申请提供了一种模型训练方法、自然语言处理方法、装置及存储介质;方法包括:获取第一训练样本集,利用第一训练样本集对第一语言模型进行训练,得到初步训练好的第一语言模型;利用初步训练好的第一语言模型对各个第一测试样本数据进行多次预测处理,得到多个第一候选输出数据;利用第二语言模型对确定各个第一测试样本数据对应的多个第一候选输出数据各自的第一奖励分数,第二语言模型的自然语言处理能力高于第一语言模型的自然语言处理能力;利用各个第一测试样本数据、多个第一候选输出数据和第一奖励分数对初步训练好的第一语言模型进行强化学习,得到最终训练好的第一语言模型。通过本申请,能够提升第一语言模型的自然语言处理能力。
本文源自:金融界
作者:情报员