数据集列表
分类筛选
Common Voice汉语闽南话语音数据集
来自Mozilla开源语音收集计划Common Voice的汉语(台湾)数据,由1584位志愿者的语音数据组成,总综合时长为85小时。
通用
1
文本
2.17
2
6
5 积分
查看详情
Common Voice粤语(香港口音)语音数据集
来自Mozilla开源语音收集计划Common Voice的汉语(香港)语音数据,由2656位志愿者的语音数据组成,总综合时长为113小时。
通用
1
文本
2.84
2
6
5 积分
查看详情
DOTA数据集
为了促进“Earth Vision”中的目标检测研究,Xia等提出了用于航空图像中目标检测的大型数据集DOTA。该数据集包含从不同传感器和平台上收集的2 806幅航拍图像。每幅图像的大小约为4 000像素×4 000像素,包含了...
通用
1
文本
2.18
2
6
5 积分
查看详情
Common Voice汉语普通话语音数据集
来自Mozilla开源语音收集计划Common Voice的汉语普通话语音数据,由3792位志愿者的语音数据组成,总综合时长为86小时。
通用
1
文本
2.21
2
6
5 积分
查看详情
千言-中文短文本实体链指数据集
面向中文短文本的实体链指,简称 EL(Entity Linking),是NLP领域的基础任务之一,即对于给定的一个中文短文本(如搜索 Query、微博、对话内容、文章/视频/图片的标题等),EL将其中的实体与给定知识库中对应的实体进行关联。
通用
1
文本
249.73
2
6
5 积分
查看详情
果蔬识别数据集
**数据说明:**
* fruits: banana, apple, pear, grapes, orange, kiwi, watermelon, pomegranate, pineapple, mango
* vegetables...
通用
1
文本
2.19
2
6
5 积分
查看详情