BoolQ是一个包含15942个示例的是/否问题的问题回答数据集。
免费
NBA球员数据分析
免费
NLP机器翻译数据集,中文-->俄文
免费
MIcrosoft 新闻数据集(MIND)是用于新闻推荐研究的大规模数据集
免费
这个匿名数据集是从 Tagged.com 社交网络网站收集。
免费
DocRED 是一个比较新的大规模的众包数据集。其原始语料主要基于维基百科,包含了 3053 份文章,其中大约存在 7% 的实体,**DocRED** 还提供了公开的 leaderboard,用户可将模型预测的结果上传,评估文档级关系抽取的各种性能。160MB 2019
免费
该数据集是代码注释自动生成任务的相关数据集,含有448512条Java程序片段以及相应的注释。
免费
英语-西班牙语翻译语料库,该数据集共含有118964对(english,spanish)语句对,可用于神经机器翻译任务。
免费
包括train、dev、test、infer,其中train分为pointwise和pairwise两种训练模式。 包含4份自建测试集,分别为zhidao、unicom、ecom、qqsim
免费
该数据集用于汽车大师问答摘要与推理常规赛;该数据集内含训练集和测试集两个文件. 文件均为CSV格式. 验证集稍后会补充.
免费
从 Wikipedia 文章中提取出的问题和答案对,从 500 多篇文章中摘取出的 10 万多个问题和答案。
免费
美国知识问答网站 Quora 上的问题答案数据集,可用以进行重复问题检测。
免费
Structured Web Data Extraction 数据集
免费
BoolQ是一个包含15942个示例的是/否问题的问题回答数据集。
免费
NBA球员数据分析
免费
NLP机器翻译数据集,中文-->俄文
免费
MIcrosoft 新闻数据集(MIND)是用于新闻推荐研究的大规模数据集
免费
这个匿名数据集是从 Tagged.com 社交网络网站收集。
免费
DocRED 是一个比较新的大规模的众包数据集。其原始语料主要基于维基百科,包含了 3053 份文章,其中大约存在 7% 的实体,**DocRED** 还提供了公开的 leaderboard,用户可将模型预测的结果上传,评估文档级关系抽取的各种性能。160MB 2019
免费
该数据集是代码注释自动生成任务的相关数据集,含有448512条Java程序片段以及相应的注释。
免费
英语-西班牙语翻译语料库,该数据集共含有118964对(english,spanish)语句对,可用于神经机器翻译任务。
免费
包括train、dev、test、infer,其中train分为pointwise和pairwise两种训练模式。 包含4份自建测试集,分别为zhidao、unicom、ecom、qqsim
免费
该数据集用于汽车大师问答摘要与推理常规赛;该数据集内含训练集和测试集两个文件. 文件均为CSV格式. 验证集稍后会补充.
免费
从 Wikipedia 文章中提取出的问题和答案对,从 500 多篇文章中摘取出的 10 万多个问题和答案。
免费
美国知识问答网站 Quora 上的问题答案数据集,可用以进行重复问题检测。
免费
Structured Web Data Extraction 数据集
免费