SWAG:基于常识推理的大规模对抗性数据集
SWAG:基于常识推理的大规模对抗性数据集 18.92
3 浏览 2 喜欢 6 下载
文本 1
给出像“她打开汽车引擎盖”这样的部分描述,人类可以对情况进行推理并预测接下来会发生什么(“然后,她检查了发动机”)。SWAG(Situations With Adversarial G...
数据介绍
文件下载列表
相关论文
数据使用声明
README.md
给出像“她打开汽车引擎盖”这样的部分描述,人类可以对情况进行推理并预测接下来会发生什么(“然后,她检查了发动机”)。SWAG(Situations With Adversarial Generations)是一个大规模数据集,用于这项基于常识推理、统一自然语言推理和基于物理推理的任务。
该数据集由 113k 个关于接地情况的多项选择题组成。每个问题都是来自 LSMDC 或 ActivityNet Captions 的视频字幕,有四个关于场景中接下来可能发生的事情的答案选择。正确答案是视频中下一个事件的(真实)视频字幕;这三个错误的答案是对抗性生成并经过人工验证的,从而骗过机器而不是人。作者的目标是让 SWAG 成为评估扎根常识 NLI 和学习表征的基准。

在train_full.csvor 中val_full.csv:我们有结尾/上下文的文本,以及序数标签(可能的、不太可能的)、一些标识video-id、fold-ind、完整的上下文startphrase(也分为sent1、sent2)和结尾。有黄金结局gold-ending及其来源gold-source,要么生成要么来自找到的完成。黄金也有一个序数标签gold-type。我们还有 3-4 个干扰项distractor-N和一个序数标签。distractor-N-type.它是 3 或 4个的原因是有时有更多的答案被注释者过滤掉,作为胡言乱语。当有第 4 个干扰项时,它的质量通常低于其他项(排名最合理)。

官方网址:https://rowanzellers.com/swag/
paperswithcode:https://paperswithcode.com/dataset/swag
附件列表
暂无可预览附件
暂无相关代码

数据使用声明:

一、数据来源与展示说明:

1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。

2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。

3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。

二、所有权说明:

1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。

三、数据转载说明:

1、如您需要转载本站数据,请保留原数据地址及相关版权声明。

四、侵权与处理说明:

1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。