coco-caption数据集
484.29
3 浏览
2 喜欢
6 下载
* Bilingual Evaluation Understudy(BLEU)。2002年首次提出了BLEU,最早是用于在机器翻译中评估模型生成的译文与参考译文中N元组同时出现的程度。随后BLEU也被运用到了图像描述生成评估中,常使用...
数据介绍
文件下载列表
相关论文
数据使用声明
README.md
* Bilingual Evaluation Understudy(BLEU)。2002年首次提出了BLEU,最早是用于在机器翻译中评估模型生成的译文与参考译文中N元组同时出现的程度。随后BLEU也被运用到了图像描述生成评估中,常使用BLEU-1和 BLEU-4的性能指标,对应去1元组和4元组。
* Metric for Evaluation of Translation with Explicit Ordering(METEOR)。METEOR也是一种专门为机器翻译任务而设定的评价方法,利用WordNet计算词缀、释义等,同时考虑到同义词,在一定程度改进了BLEU的某些缺点。
* Recall-Onented Understudy for Gist1ng EvaIuation(ROUGE)。ROUGE是主要用于评估文本摘要任务质量的。ROUGE包括了四个子评价指标,分别是 ROUGE-N,ROUGE-L,ROUGE-W和ROUGE-S,其中ROUGE-L是根据最长共有子句的共现精度和召回率Fmeasure统计,在图像描述任务中普遍使用。
* Consensus-based Image Description Evaluation(CIDEr)。CIDEr是一个专为图像描述任务而制定的评估指标。根据文字描述中对每n元组的权重,计算得到的图像描述与图像标签信息相互之间的一致性。当图像描述中存在一些特殊情况时,CIDEr就需要对其进行修改以满足特定的要求。对于一幅图像,当一个元组非常频繁地出现在图像描述描述中,CIDEr会提高这些n元组的权重,但是如果单元组频繁地出现在所有图像描述中,CIDEr就会减少n元组的权重,因为这些n元组并不包括更多的视觉信息。
* Semantic Propositional Image Caption Evaluation(SPICE)。之前的指标都是通过n元组来评价的,而SPICE则是通过把文字说明转化为图来评价的。它按照现实图像的语义对图像描述中的目标、属性和关联信息加以编号,从而可以统计出真实图像描述和预期图像描述之间的目标、属性和关联的F-score。
附件列表
暂无可预览附件
暂无相关代码
数据使用声明:
一、数据来源与展示说明:
1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
二、所有权说明:
1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
三、数据转载说明:
1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
四、侵权与处理说明:
1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。