欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

cs224u 自然语言推理:任务和数据集-2

程序员文章站 2022-03-11 22:59:55
cs224u 自然语言推理:任务和数据集-2 nli_01_task_and_data.ipynb__author__ = "Christopher Potts"__version__ = "CS224u, Stanford, Fall 2020"目录MultiNLI 属性SNLI 和 MultiNLIMultiNLI 属性五种类型的训练:小说:创作于1912-2010年,跨越多种体裁*:来自*网站的报告、信件、演讲等The Slate website电话:总机语料库旅游:...

cs224u 自然语言推理:任务和数据集-2 nli_01_task_and_data.ipynb

__author__ = "Christopher Potts"
__version__ = "CS224u, Stanford, Fall 2020"

MultiNLI 属性

  • 五种类型的训练:

    • 小说:创作于1912-2010年,跨越多种体裁
    • *:来自*网站的报告、信件、演讲等
    • The Slate website
    • 电话:总机语料库
    • 旅游:Berlitz旅游指南
  • 额外的类型只是为了开发和测试(不匹配的条件):

    • 9/11的报告
    • 《面对面:夏洛特叙事与对话集》
    • 筹款信
    • 非小说,牛津大学出版社
    • 关于语言学的逐字逐句的文章
  • 392702个训练集数据;20K验证集;20K测试集

  • 19,647个示例由另外四个注释器验证

    • 58.2% exampl

本文地址:https://blog.csdn.net/duan_zhihua/article/details/107674539