AI大时代下的创新,追一科技发布RoFormerV2模型

日期:2022-05-08 来源:手游巴士 作者:佚名

最近,追一科技发布了RoFormerV2模型,凭借追一独创的旋转位置编码技术(RoPE),全面超越了BERT、RoBERTa、Albert、Electra等当前的主流预训练模型。

在权威的中文NLP(自然语言处理)测试榜单CLUE上,RoFormerV2以仅3亿的参数量,超过了若干10亿+参数量的模型进入榜单前5名(截止2022年3月21日),同时它也是榜上前5名中参数量最少的模型,基本实现了同一尺度下的模型最优解。

RoFormerV2采用了追一独创的旋转位置编码(RoPE)技术,完全不同于主流的BERT、RoBERTa、Albert、Electra所使用的方法,这让RoFormerV2与这些模型在效果上拉开差距。

旋转位置编码(RoPE)技术是追一在2021年提出,利用向量之间的旋转角度来表示特征之间的相对关系,这一思路不同于此前所有的方法,知名的技术极客组织EleutherAI认为RoPE是“革命性”的,具有开创式意义。Google在今年提出的FLASH模型论文中则明确指出RoPE对模型的效果有明显的提升作用,并将其作为模型的默认方法。

同时,RoPE还被用在了许多最新的模型当中,例如EleutherAI新发布的60亿和200亿参数的GPT模型中就用了RoPE位置编码。

而Google最近大火的5400亿参数的PaLM模型中也采用了追一的RoPE技术,PaLM是一个支持多语种、多任务形式的超大型模型,它不仅可以理解人类语言,还可以理解机器代码。PaLM在上百个自然语言理解与自然语言生成任务上测试,并在大多数任务上取得了最优效果。这些最新方法都采用了RoPE的设计,进一步验证了它的优越性,使之有望成为预训练模型的标准方法。

随着“大模型”时代的来临,许多用户希望用优秀的模型来解决实际问题,但这些“庞然大物”所需要的硬件配置、高额投入,让人望而却步。同时, 利用“大模型”进行NLP技术实验研究,所需要的算力与时间成本越来越高。不管是NLP技术研究还是应用实践,追一科技都一直致力于开放、开源生态的参与、建设,助力用户和开发者创新研究。

RoFormerV2作为同体量效果最好的预训练模型,可以在有限的机器资源下进行训练与微调并获得超越体型更大的模型的效果,因此我们将其开源供大家进行研究使用,为推动中文NLP发展继续贡献一份力量。

【来源:松果财经】

上一篇:业内:自动化设备生产因芯片短缺遭遇瓶颈,交期延长达一年

下一篇:NASA:阿尔忒弥斯 1 号彩排不太理想,SLS 火箭首飞计划或推迟

相关推荐

三星Galaxy Z Fold 4/Flip 4有望搭载骁龙8 Plus芯片

根据新的消息,三星Galaxy Z Fold 4和Flip 4将搭载高通的骁龙8 Plus芯片。 爆料者Ice universe通过一条推文透露,三星即将推出的可折叠产品将采用骁龙8 Plu

又一台Apple-1电脑拍卖:有史蒂夫·乔布斯手写的序列号

最近,另一台罕见的Apple-1电脑正在拍卖,这台电脑的出价已经超过25万美元。Apple-1是史蒂夫·乔布斯和史蒂夫·沃兹尼亚克在苹果电脑成立时创造

苹果新专利惊呆众人 将平板连接到键盘秒变macOS

苹果的一项新专利表明,未来的iPad或iPadOS版本可能具备将平板电脑连接到外部键盘时,将其转变为类似macOS用户体验的能力。 这项专利描述了一种基本设备,它

苹果新专利曝光:让Apple Car自动寻找停车位置

据报道,苹果正在研究Apple Car如何通过Siri技术的发展来理解语音命令,并可执行更多关于停车位置的细节。 “使用意图信号在目的地附近引导自动驾驶车

SSD硬盘百倍性能提升 AMD将推全新游戏技术

AMD又要推出一种新的游戏加速技术了,名字叫做Smart Access Storage,很有可能在海盗船首款游戏本Voyager上亮相,后者将使用锐龙9 6900HX处理器,搭配RX 6800M显

查看更多