当前位置:网站首页 > 科技网络 > 正文

微软的AI通过密切关注起点来提高文本摘要性能

作者:访客发布时间:2023-05-12分类:科技网络浏览:95评论:0

导读:导读给大家分享一篇关于互联网和手机的文章。相信很多朋友对互联网和手机还是不太了解,所以边肖也在网上搜集了一些关于手机和互联网的相关知识...
导读 给大家分享一篇关于互联网和手机的文章。相信很多朋友对互联网和手机还是不太了解,所以边肖也在网上搜集了一些关于手机和互联网的相关知识

给大家分享一篇关于互联网和手机的文章。相信很多朋友对互联网和手机还是不太了解,所以边肖也在网上搜集了一些关于手机和互联网的相关知识与大家分享。希望大家看完之后会喜欢。

《纽约时报》的新闻特刊肯定会和一般的Reddit帖子有不同的基调。事实上,写作风格和语法结构的多样性使得自动文本摘要的任务非常具有挑战性。这就是为什么匹兹堡的研究人员和微软研究人员的未来社会体验(FUSE)实验室专注于实时和丰富的媒体体验,并开发了一个AI系统,该系统密切关注摘要文档的开头。该团队表示,这种方法提高了实验性能,尤其是在Web论坛内容和文本数据以更一般的形式出现的情况下。

这项研究是在微软研究院发布后进行的,该研究院详细介绍了能够推理“弱结构”文本中关系的“灵活”人工智能系统。合著者声称,在一系列文本摘要任务中,它的性能可能优于传统的自然语言处理模型。

正如研究人员所指出的,论坛讨论线索通常以寻求知识或帮助的帖子或评论开始,后续评论往往会通过提供其他信息或意见来回应原始帖子。通常,这个初始文本包含重要的主题信息,这可能对总结有用。

提议的人工智能受益于原始帖子和回复之间的这种依赖性,但它也试图消除不相关或肤浅的回复,以确保它们不会降低摘要的质量。

研究人员根据两个摘要语料库准备和评估了他们的模型:一个来自猫途鹰论坛,包含700个线程(500个用于训练,另200个用于验证和测试),另一个包含532个交叉主题的微软Word文档(其中266个),分别有138个和128个用于训练、验证和测试。AI吸收从每个句子中提取的关键词和整个文档的句子级表示,从而可以知道文本文档中哪些句子是有意义的,并使用这些句子生成摘要。

本文就为大家讲解到这里了。