ZhihuRec:知乎推荐数据集
1.51
4 浏览
2 喜欢
6 下载
知乎Rec数据集由清华大学(THUIR)信息检索组和知乎公司共同构建,仅供研究使用。
知乎Rec数据集来自知识共享平台(知乎),由10天内收集的约1亿次互动、798K用户、165K问题、554K答案、240K作者、70K主题和超过5...
数据介绍
文件下载列表
相关论文
数据使用声明
README.md
知乎Rec数据集由清华大学(THUIR)信息检索组和知乎公司共同构建,仅供研究使用。
知乎Rec数据集来自知识共享平台(知乎),由10天内收集的约1亿次互动、798K用户、165K问题、554K答案、240K作者、70K主题和超过501K用户查询日志组成。还有用户、答案、问题、作者和主题的描述,这些都是匿名的。据我们所知,这是用于个性化推荐的最大的现实世界交互数据集。
数据集中的文件
zhihu100M.txt (2.58G)---用户交互
zhihu20M.txt (529M)---用户交互
zhihu1M.txt (26.4M)---用户交互
user_infos.txt (689M)---用户在数据集中出现的特征
answer_infos.txt (1.32G)---答案出现在数据集中的特征
question_infos.txt (30.7M)---出现在数据集中的问题的特征
author_infos.txt (11.2M)---作者的特征出现在数据集中
topic_infos.txt (6.11M)--- 数据集中出现的主题的特征
readme.txt --- 以上文件的详细说明
readme_Chinese.txt ---以上文件的详细说明(中文)
zhihu100M.txt (2.58G)---用户交互
zhihu20M.txt (529M)---用户交互
zhihu1M.txt (26.4M)---用户交互
user_infos.txt (689M)---用户在数据集中出现的特征
answer_infos.txt (1.32G)---答案出现在数据集中的特征
question_infos.txt (30.7M)---出现在数据集中的问题的特征
author_infos.txt (11.2M)---作者的特征出现在数据集中
topic_infos.txt (6.11M)--- 数据集中出现的主题的特征
readme.txt --- 以上文件的详细说明
readme_Chinese.txt ---以上文件的详细说明(中文)
如果您使用此数据集,请引用论文:
@misc{hao2021largescale, title={A Large-Scale Rich Context Query and Recommendation Dataset in Online Knowledge-Sharing}, author={Bin Hao and Min Zhang and Weizhi Ma and Shaoyun Shi and Xinxing Yu and Houzhi Shan and Yiqun Liu and Shaoping Ma}, year={2021}, eprint={2106.06467}, archivePrefix={arXiv}, primaryClass={cs.IR} }
官方链接:https://github.com/THUIR/ZhihuRec-Dataset
附件列表
暂无可预览附件
暂无相关代码
数据使用声明:
一、数据来源与展示说明:
1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
二、所有权说明:
1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
三、数据转载说明:
1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
四、侵权与处理说明:
1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。