您的位置首页  财经资讯  国际资讯

AI能看懂英文阿里巴巴夺实体发现测评全球第一

  • 来源:互联网
  • |
  • 2018-01-08
  • |
  • 0 条评论
  • |
  • |
  • T小字 T大字
AI能看懂英文阿里巴巴夺实体发现测评全球第一  KBP是由NIST(National Institute of Standards and Technology,美国国家标准与技术研究院)指导、美国协办的赛事,主要任务为从自然书写的非结构化文本中抽取实体,以及实体之间的关系…

原标题:AI能看懂英文阿里巴巴夺实体发现测评全球第一

  KBP是由NIST(National Institute of Standards and Technology,美国国家标准与技术研究院)指导、美国协办的赛事,主要任务为从自然书写的非结构化文本中抽取实体,以及实体之间的关系。

  这项测评要求AI算法在“读完”一篇英文文章后,构建一个物理世界的命名实体和实体之间关系的知识库,如“克林顿和希拉里之间是夫妻关系”、“克林顿毕业于耶鲁院”这样一个个实体的关系。

  阿里巴巴iDST自然语言处理首席科学家司罗介绍,他们的算法可以做到对文章上下文的理解。比如,文章出现了Apple,再出现Jobs,就可以辨别出这个Jobs指的是乔布斯,而不是工作。再比如,文章出现了Microsoft,那么Apple就更有可能是苹果公司,而不是一种水果。

  “另外,我们构建了一个算法去学习不同领域之间共同的部分,通过迁移学习提升我们学习的准确度。对于不同领域数据,我们取其精华,去其糟粕,进行智能学习”,司罗说。

  在这次测评中,iDST团队采用经过改良的深度神经网络架构对文本进行理解。改良的架构有三个主要特点:首先该模型可以自动阅读海量文章(如)并从中汲取经验;其次,该架构可以智能选择训练数据集以训练数据的准确性;最后,我们采用post regularization的办法模型结果的一致性。

  对于KBP2017的成绩,司罗表示:“很荣幸能够同全球的同行分享阿里巴巴的研究,人工智能在机器阅读理解和知识库构建上还处在起步阶段,我们正在积极和同行业顶尖机构学习交流,推动行业发展。比如我们内部建设的信息抽取平台AliIE项目就在同斯坦福大学展开积极合作”。

  阿里巴巴正在将这样的信息抽取技术广泛的应用到实际业务当中,并致力于让更多的中小开发者从中收益。他们搭建的信息抽取平台AliIE拥有最顶尖的AI技术,并从一开始的架构设计就考虑到平台的性和可扩展性。可以让更多的开发者、研究员共同开发,并将回馈给这个社区。

  司罗是全球权威机器智能学者,曾担任美国普渡大学计算机系终身教授,主持的20余个项目得到美国、工业界资助,先后获得美国国家科学基金会成就、雅虎、谷歌研究等。

  由他领导的自然语言处理团队目前支持了阿里巴巴大生态每天多达600亿次的自然语言处理需求,团队横跨杭州、、硅谷、西雅图(新加坡)多地,大多拥有10年以上的研发经验。检索招聘网站可以看到,他们依旧在不断扩充团队。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
友荐云推荐