谷歌BERT遭遇对手,微软UniLM AI突破大量文本处理瓶颈

发布时间:2019-10-17 阅读量:1178 来源: 智东西 发布人: Jane

10月17日消息,去年10月谷歌发布的BERT模型已经在阅读理解测试中全面超越人类,今天微软的UniLM模型将这一领域的研究推向了新的高度。

 

据外媒报道,微软近日推出的UniLM AI训练模型通过改变传统AI系统学习方式,成功实现单向预测,突破了自然语言处理中大量文本修改的瓶颈。

 

一、改变双向预测方式

 

语言模型预训练(Language model pretraining)是一种机器语言处理技术,它通过依据文本预测词汇的方式,教会机器学习系统(machine learning systems)如何把文本情景化地表述出来。它代表了自然语言处理(natural language processing)领域的最新突破。

 

目前,像谷歌的BERT模型,是双向预测,也就是根据左右两侧的词汇来预测,因此不适合大量文本的处理。

 

谷歌BERT遭遇对手1.png 

▲谷歌BERT模型

 

为此,微软科学家们研究出了UniLM(UNIfied pre-trained Language Model)这种新模型。该模型可以完成单向、序列到序列(sequence-to-sequence)和双向预测任务,并且可以针对自然语言的理解和生成进行微调(fine-tuned)。

 

微软表示它在各类常见的基础测试中都要优于BERT,并且在自然语言处理的一些测试项目中取得了该领域的最新突破。

 

二、“变形金刚”的威力

 

谷歌BERT遭遇对手2.png 

▲UniLM模型概览

 

UniLM模型是一个多层网络,其核心是由Transformer AI模型组成的,这些模型针对大量文本进行了共同的预训练,并针对语言建模进行了优化。

 

跟其他AI系统学习预测方式不同的是,Transformer AI将每个输出元素都连接到每个输入元素。它们之间的权重是可以动态调整的。

 

微软研究人员认为,经过预训练的UniLM与BERT类似,可以进行微调以适应各种下游任务。但是与BERT不同,UniLM可以通过一种特殊方式(using different self-attention masks),汇总不同类型语言模型的上下文。

 

此外,Transformer网络可以共享从历史训练中学到的数据,不仅使学习到的文本表示更加通用,也降低了对单一任务的处理难度。

 

三、学海无涯

 

微软研究人表示,UniLM通过学习英语维基百科(English Wikipedia)和开源BookCorpus的文章后,已经拥有高达28996的词汇量。并且在预培训后,UniLM的跨语言任务表现也非常好。

 

团队人员表示,UniLM未来发展的空间还很大,例如在“网络规模(web-scale)”的文本语料库上训练较大的模型来突破当前方法的局限性。

 

他们还希望让UniLM在跨语言任务中取得更大突破。

 

结语:自然语言处理领域的重大突破

 

自然语言处理,是人工智能界、计算机科学和语言学界所共同关注的重要问题,它对于实现人机间的信息交流起着重要作用。

 

谷歌BERT和微软的UniLM是这一领域的开拓者,后者通过单向预测突破了大量文本处理的难题,进而提升了此类AI在实际应用中的价值。

 

此次谷歌霸主地位被动摇,也势必将在该领域引发更加精彩的AI大战。

 

原文来源:Venturebeat

相关资讯
SEMI-e 2025深圳半导体展9月启幕!全产业链覆盖,超千家龙头集结

SEMI-e深圳国际半导体展暨2025集成电路产业创新展将于2025年9月10日至12日在深圳国际会展中心(宝安新馆)隆重开幕。本届展会由CIOE中国光博会与集成电路创新联盟联合主办,中新材会展与爱集微共同承办,以“IC设计与应用”、“IC制造与供应链”及“化合物半导体”为核心主题,系统覆盖集成电路全产业链环节。

超11万人次观展,5723名海外买家到场!IOTE 2025深圳物联网展圆满落幕​

​在AIoT技术加速赋能全球数字化转型、中国持续引领物联网产业创新的大背景下,IOTE 2025第24届国际物联网展·深圳站于8月29日在深圳会展中心(宝安新馆)圆满落幕。本届展会以“生态智能·物联全球”为主题,联合AGIC人工智能展与ISVE智慧商显展,汇聚1001家产业链企业,覆盖8万平方米展区,三日内吸引观众超11万人次,其中海外专业买家达5723人,来自30多个国家和地区,充分彰显了展会的国际影响力与行业凝聚力。

IOTE 2025物联网展开启AIoT生态新纪元:千家展商齐聚,首日超5万观众!

​8月27日,IOTE 2025·第24届国际物联网展于深圳国际会展中心(宝安新馆)隆重开幕。本届展会以“生态智能·物联全球”为主题,联合AGIC人工智能展与ISVE智慧商显展,在8万平方米的展区内汇聚超1000家全球展商,涵盖人形机器人、边缘计算、高精度定位、无源物联网、电子纸等前沿领域。开展首日即吸引超5万名专业观众到场,展现出AIoT融合背景下物联网产业的蓬勃活力与无限潜力!

第106届中国电子展11月在沪开幕,聚焦“创新强基”助推产业协同生态

在创新驱动与供给侧改革的持续深化下,2024年中国电子元器件行业迎来强劲复苏与高质量发展,整体销售收入突破2.2万亿元人民币,进出口贸易额稳步增长,展现出显著的发展韧性。行业在移动终端、汽车电子、新能源等关键下游市场的驱动下,不仅产业配套能力实现跃升,一批骨干企业的全球竞争力也持续增强。在此蓬勃发展的产业背景中,第106届中国电子展将于2025年11月5-7日在上海新国际博览中心举行,以“创新强基 智造升级”为主题,搭建全产业链协同创新的重要平台。

寒武纪登顶A股“股王”!单日暴涨15.73%,市值破6600亿,公司紧急提示:股价已严重脱离基本面

寒武纪发布《股票交易风险提示公告》明确指出:当前股价已严重脱离基本面,存在较大投资风险,提醒投资者理性决策,谨慎参与交易。