首页 资讯正文

识别代词对于人工智能来说却并不容易

识别代词对于人工智能来说却并不容易

具有代替和指示作用的代词,作为实词在句法和文本中具有重要作用。代词令语言简洁且更富有变化性。

对于人类来说,识别代词指代对象并不算困难,凭借对上下文和对句子的理解就可以找出代词的指代对象。然而,对于人工智能来说,却并不容易——机器对文本的理解通常需要核心性解析。换言之,能否准确搜索、追踪、分析代词与实体之间的关联,对于人工智能能否准确理解文本内容至关重要。

这种能力被称为共指消解(Conference Resolution),是自然语言处理(NLP)领域的重要研究方向,即通过追踪长句、段落、文章中的代词,找到其对应的指代对象或内容。

尽管目前有很多体量庞大的众包数据集,但它们主要考察模型理解局部语义以及谓词参数结构,涉及共指消解的问题很少见。

针对这一问题,艾伦人工智能研究所的研究团队最近公布了一个新的众包数据集,被称为为 QUOREF,里面包含超过 2400 个广度选择问题,旨在专门考察模型的共指消解能力。这些问题需要在维基百科的 4.7K 多个英文段落中分析并找到各个实体的指代对象。

作为专门测试共指消解能力的数据集,QUOREF 足以证明目前常见的机器阅读理解模型仍有很大的进步空间。通过分析错误答案背后的原因,NLP研究者才能更好地改进模型,实现在复杂、多元、大跨度的文本内容中准确对应实体与代词,做到真正意义上的的语义理解。

特别提示:以上观念仅为大财酉已资资讯传播分享学习心得与笔记,有关信息均摘自干流媒体,据此操作,危险自负。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

本文链接:https://www.chinaai.com/zixun/5368.html

评论