• 1
  • 2
联系我们
  • 电话:021-88888888
    手机:13988888888
    传真:021-88888888
    邮编:201822
    邮箱:[email protected]
    主页:www.shcjb.com
    地址:上海嘉定区嘉戬公路200号
哈工大讯飞联合实验室(HFL) 全球首次发布填空型中文阅读理解数据集
  •     7月18日,哈工大讯飞联合实验室(HFL)在全球首次发布填空型中文阅读理解数据集,其中包括《人民日报》新闻数据集和“儿童读物”数据集(HFL-RC:PeopleDailyandChildren’sFairyTale(CFT)dataset)。

        

    1

        “阅读理解”是当下国际人工智能最热门的研究领域,也是人工智能竞争最激烈的领域之一。阅读理解是衡量人们如何掌握并理解篇章的技术,其中GoogleDeepMind、FacebookAILab、微软研究院等研究机构纷纷投入人员启动此类研究。在英文阅读理解方面,目前已有GoogleDeepMindCNN/DailyMail数据集,FacebookCBTest数据集,但一直缺少中文阅读理解数据集。

        早在2015年5月,哈工大讯飞联合实验室就已经开展面向阅读理解方面的研究,联合实验室仅用一年多的时间即取得了重要的技术进展,并且在全球首次公开发布了中文阅读理解数据集。此次,哈工大讯飞联合实验室发布的数据集不但填补了中文阅读理解的空白,而且与上述两个英文数据集不同的是,HFL发布的“儿童读物”数据集中还包含了人工问题(人工筛选出来的填空题),此类问题比自动构造的填空题更难回答,这也为阅读理解的研究提出了新的挑战。在不久的将来,机器或许可以像人一样理解文本。理解人类语言作为人机交互的一个重要环节,该研究方向有着广阔的市场前景,其应用场景可以遍布各个角落。

        哈工大讯飞联合实验室(HFL),是科大讯飞针对“讯飞超脑”项目计划,重点引进和布局的核心研发团队之一。根据联合实验室建设规划,双方将在语言认知计算领域进行长期、深入的合作,具体开展类人答题、自动阅卷、语音情报分析、社会舆情计算等前瞻课题的研究,重点突破深层语义理解、逻辑推理决策、自主学习进化等认知智能关键技术,支撑科大讯飞实现从“能听会说”到“能理解会思考”的技术跨越,并围绕教育学习、人机语音交互、信息安全等领域实现科研成果的规模化应用。

上海嘉宝实业有限公司 Copyright(C)2014 沪ICP备12026233号