HotpotQA:用于多样化、可解释的多跳问答的数据集
HotpotQA:用于多样化、可解释的多跳问答的数据集 673.69
4 浏览 2 喜欢 6 下载
文本 1
HotpotQA是英文维基百科上收集的问答数据集,包含大约 113K 的众包问题,这些问题被构建为需要两篇维基百科文章的介绍段落来回答。数据集中的每个问题都带有两个黄金段落,以及这些段落中的句子列表,众包工作者认为这些句子是回答问题...
数据介绍
文件下载列表
相关论文
数据使用声明
README.md
HotpotQA是英文维基百科上收集的问答数据集,包含大约 113K 的众包问题,这些问题被构建为需要两篇维基百科文章的介绍段落来回答。数据集中的每个问题都带有两个黄金段落,以及这些段落中的句子列表,众包工作者认为这些句子是回答问题所必需的支持事实。
HotpotQA 具有多种推理策略,包括涉及问题中缺失实体的问题、交集问题(什么满足属性 A 和属性 B?)以及比较问题,其中两个实体通过共同属性进行比较等。在少文档干扰器设置中,QA 模型有十个段落,其中保证找到黄金段落;在开放域 fullwiki 设置中,模型只给出问题和整个维基百科。模型根据它们的答案准确性和可解释性进行评估,其中前者被测量为具有精确匹配 (EM) 和 unigram F1 的预测和黄金答案之间的重叠,后者关注预测的支持事实句子与人类注释的匹配程度(支持事实EM/F1)。
 
如果您在研究中使用 HotpotQA,请使用以下 BibTeX 条目引用我们的论文:
@inproceedings{yang2018hotpotqa, 
  title={{HotpotQA}: A Dataset for Diverse, Explainable Multi-hop Question Answering}, 
  author={Yang, Zhilin and Qi, Peng and Zhang, Saizheng and Bengio, Yoshua and Cohen, William W. and Salakhutdinov、Ruslan 和 Manning、Christopher D.},
  书名={自然语言处理经验方法会议 ({EMNLP})},
  年份={2018} 
}
 
官方网址:https://hotpotqa.github.io/
paperwithcode:https://paperswithcode.com/dataset/hotpotqa
附件列表
暂无可预览附件
暂无相关代码

数据使用声明:

一、数据来源与展示说明:

1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。

2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。

3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。

二、所有权说明:

1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。

三、数据转载说明:

1、如您需要转载本站数据,请保留原数据地址及相关版权声明。

四、侵权与处理说明:

1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。