DrQA是Facebook开源的开放域(Open-Domain)问答系统,通过阅读理解维基百科,来回答用户的各种问题。
DrQA主要针对的“机器阅读规模”(MRS)的任务。在这种情况下,我们要在可能非常大的非结构化文档语料库(可能并不冗余)中搜索问题的答案。因此,系统必须将文档检索(查找相关文档)与文本的机器理解(识别这些文档的答案)相结合。
DrQA使用维基百科作为文档的唯一知识来源。为了回答一个问题,系统必须首先检索超过 500 万篇文章中的少数几篇可能相关的文章,然后再仔细地扫描它们以确认答案。
请注意,DrQA将维基百科视为文章的一般集合,但不依赖于其内部图形结构。因此,DrQA可以直接应用于任何文件集合。
评论