cs224u 自然语言推理:任务和数据集-2
程序员文章站
2022-06-21 22:58:49
cs224u 自然语言推理:任务和数据集-2 nli_01_task_and_data.ipynb__author__ = "Christopher Potts"__version__ = "CS224u, Stanford, Fall 2020"目录MultiNLI 属性SNLI 和 MultiNLIMultiNLI 属性五种类型的训练:小说:创作于1912-2010年,跨越多种体裁*:来自*网站的报告、信件、演讲等The Slate website电话:总机语料库旅游:...
cs224u 自然语言推理:任务和数据集-2 nli_01_task_and_data.ipynb
__author__ = "Christopher Potts"
__version__ = "CS224u, Stanford, Fall 2020"
MultiNLI 属性
-
五种类型的训练:
- 小说:创作于1912-2010年,跨越多种体裁
- *:来自*网站的报告、信件、演讲等
- The Slate website
- 电话:总机语料库
- 旅游:Berlitz旅游指南
-
额外的类型只是为了开发和测试(不匹配的条件):
- 9/11的报告
- 《面对面:夏洛特叙事与对话集》
- 筹款信
- 非小说,牛津大学出版社
- 关于语言学的逐字逐句的文章
-
392702个训练集数据;20K验证集;20K测试集
-
19,647个示例由另外四个注释器验证
- 58.2% exampl
本文地址:https://blog.csdn.net/duan_zhihua/article/details/107674539
上一篇: C++追根究底(持续更新)