数据介绍 / Introduce
MIcrosoft News Dataset (MIND)是新闻推荐研究大规模数据集。它是从微软新闻网站的匿名行为日志中收集的。MIND 的使命是作为新闻推荐的基准数据集,促进新闻推荐和推荐系统领域的研究。MIND 包含大约 16 万篇英文新闻文章和由 100 万用户生成的超过 1500 万条印象日志。每篇新闻文章都包含丰富的文本内容,包括标题、摘要、正文、类别和实体。每个展示日志都包含该用户在本次展示之前的点击事件、未点击事件和历史新闻点击行为。为了保护用户隐私,当安全地散列到匿名 ID 中时,每个用户都与生产系统断开链接。关于 MIND 数据集的更多详细信息,可以参考以下论文:Fangzhao Wu, Ying Qiao, Jiun-Hung Chen, Chuhan Wu, Tao Qi, Jianxun Lian, Danyang Liu, Xing Xie, Jianfeng Gao, Winnie Wu and Ming Zhou. MIND: A Large-scale Dataset for News Recommendation. ACL 2020. 官方网址:https://msnews.github.io/paperwithcode:https://paperswithcode.com/dataset/mindpaper:https://msnews.github.io/assets/doc/ACL2020_MIND.pdf
数据列表 / List
发布时间 |
数据包名称 |
数据格式 |
数据量 |
数据大小 |
下载 |
2024-03-06 10:11:10 |
MINDlarge:微软新闻数据集 |
zip |
-- |
530.19MB |
下载 |
登录下载 |
2024-03-06 10:11:10 |
MINDlarge:微软新闻数据集 |
zip |
-- |
605.02MB |
下载 |
登录下载 |
2024-03-06 10:11:10 |
MINDlarge:微软新闻数据集 |
zip |
-- |
103.45MB |
下载 |
登录下载 |
发布时间 |
数据包名称 |
数据格式 |
数据量 |
数据大小 |
下载 |
2024-03-06 10:11:10 |
MINDlarge:微软新闻数据集 |
zip |
-- |
530.19MB |
下载 |
登录下载 |
2024-03-06 10:11:10 |
MINDlarge:微软新闻数据集 |
zip |
-- |
605.02MB |
下载 |
登录下载 |
2024-03-06 10:11:10 |
MINDlarge:微软新闻数据集 |
zip |
-- |
103.45MB |
下载 |
登录下载 |