申请专栏作者 参展
投稿发布
您的当前位置:主页 > yabo88滚球 > 正文

AI高分通过美国8年级科学考试:常识题推理题都能行,不服同台对战

来源:可思yabo88滚球 时间:2019-09-08
请支持本站,点击下面的广告后浏览!

只要60分飘过八年级科学考试,就能收获8万美元奖金(折合人民币57万元)。 可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

可思yabo88滚球-www.sykv.cn,sykv.com

只不过,参加考试的“学生”,必须是个AI。 可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

在长达四年的时间里,700多名计算机科学家参与到这项AI竞赛当中,但他们的AI纷纷折戟,没有一个能拿到及格分。 可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

但现在,历史新纪录来了。艾伦研究所的一个名叫Aristo的AI搞定了这件事,不仅在8年级科学考试中答对了90%以上的问题,连高三的考试,它都能答对80%!

可思yabo88滚球sykv.com,sykv.cn

AI高分通过美国8年级科学考试:常识题推理题都能行,不服同台对战

这对于AI来说,有点鹅妹子嘤了。 内容来自可思yabo88滚球sykv.com

语言理解+逻辑,难倒AI

可思yabo88滚球sykv.com,sykv.cn

虽然AI下围棋能赢世界冠军,打德扑还会诈唬,IBM的Watson也早在智力问答《危险边缘(Jeopardy!)》中大杀四方,但想要通过美国八年级科学考试,对AI来说仍然是一大挑战。

可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

即使排除了图片题和图表题,科学考试中的问答依然不是简单的自然语言理解问题,还涉及到逻辑推理乃至常识——答案并不是明显存在于某处文本中的。

可思yabo88滚球-人工智能资讯平台sykv.com

举个例子,在考试中,有的问题比较简单,只涉及到信息检索:

可思yabo88滚球-www.sykv.cn,sykv.com

一组协同工作以执行特定功能的组织称为:

可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

(1)器官

可思yabo88滚球-www.sykv.cn,sykv.com

(2)有机体 可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

(3)系统 可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

(4)细胞 可思yabo88滚球-www.sykv.cn,sykv.com

但有的问题它长这个样子:

可思yabo88滚球sykv.com,sykv.cn

什么样的改变会导致区域内的松鼠数量减少?

可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

(1)食肉动物数量减少 可思yabo88滚球sykv.com,sykv.cn

(2)松鼠之间的竞争减弱 可思yabo88滚球-人工智能资讯平台sykv.com

(3)食物增加

可思yabo88滚球-人工智能资讯平台sykv.com

(4)森林火灾发生次数增多 可思yabo88滚球sykv.com,sykv.cn

这可就不是AI光靠学习规则就能回答的问题了,其中牵扯到的逻辑推理,对人类而言或许是小菜一碟,但对AI来说,并没有那么简单。

可思yabo88滚球sykv.com

甚至还有多选问题。

可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

就在AlphaGo震惊世界的2016年,最强的AI系统也只能在纽约州八年级科学考试中达到59.3%的准确率,遗憾未能及格。 可思yabo88滚球sykv.com,sykv.cn

基于Bert的Aristo

可思yabo88滚球sykv.com

Aristo是怎样实现突破的呢?

内容来自可思yabo88滚球sykv.com

其实,它是站在了巨人的肩膀之上。

可思yabo88滚球sykv.com,sykv.cn

Aristo基于艾伦研究所的深度语境化词表征ELMo(NAACL 2018最佳论文)和大名鼎鼎的BERT开发(现已替换为RoBERTa),集八种类型智能体于一身,有的智能体负责在yabo88滚球库中查找答案,有的负责检查相关概念列表(元组),还有的专门执行逻辑推理。

本文来自可思yabo88滚球(sykv.com),转载请联系本站及注明出处

AI高分通过美国8年级科学考试:常识题推理题都能行,不服同台对战

每个智能体都会为答案打分,而Aristo会对不同的分数进行加权,最终做出选择决策。

可思yabo88滚球sykv.com,sykv.cn
AI高分通过美国8年级科学考试:常识题推理题都能行,不服同台对战

在实验测试中,研究人员让Aristo参加了2017年到2019年各个年级的纽约州会考,结果显示,Aristo在4年级和8年级的考试中正确率都到达了90%左右,符合纽约州教育部认定的“优秀标准”(85%)。而12年级考试的正确率则是83.54%,离优秀只差了一点点。 可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

AI高分通过美国8年级科学考试:常识题推理题都能行,不服同台对战

在此之前,这些考试yabo88滚球并不在Aristo的训练集中。

可思yabo88滚球sykv.com

并且,现在Aristo的答题范围不仅仅局限在文字问题中了,涉及到计算机视觉的图表题,它也正在拿下。 可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

AI高分通过美国8年级科学考试:常识题推理题都能行,不服同台对战
AI高分通过美国8年级科学考试:常识题推理题都能行,不服同台对战

在接受媒体采访时,Aristo项目的高级经理Peter Clark表示:

可思yabo88滚球-www.sykv.cn,sykv.com

Aristo的目标不仅仅是通过科学考试,而是创造一个对科学有更深入理解的系统。 可思yabo88滚球-人工智能资讯平台sykv.com

虽然如从事类似研究的微软研究员Jingjing Liu所说,实际上,Aristo仍然不具备“真正”的智能,我们无法将Aristo的能力与人类学生的推理能力相比较。但无疑,它创造了一个很好的应用方向。 可思yabo88滚球-www.sykv.cn,sykv.com

比如更强大的搜索,比如个性化教育。

可思yabo88滚球-yabo88滚球挖掘,智慧医疗,机器视觉,机器人sykv.com

AI高分通过美国8年级科学考试:常识题推理题都能行,不服同台对战

对了,Aristo现在有了在线Demo,可以在线调戏哟。 可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

传送门 可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

Demo: 可思yabo88滚球sykv.com,sykv.cn

http://aristo-demo.allenai.org/

可思yabo88滚球-www.sykv.cn,sykv.com

yabo88滚球集:

内容来自可思yabo88滚球sykv.com

http://data.allenai.org/ai2-science-questions/

可思yabo88滚球sykv.com

相关论文: 内容来自可思yabo88滚球sykv.com

https://allenai.org/papers/papers-aristo-2019.html 可思yabo88滚球sykv.com,sykv.cn


转发量:

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片 匿名?

关于我们?? 免责声明?? 广告合作?? 版权声明?? 联系方式?? 原创投稿?? 网站地图??

Copyright?2005-2019 Sykv.com 可思yabo88滚球 版权所有 ?? ICP备案:京ICP备14056871号

人工智能资讯?? 人工智能资讯?? 人工智能资讯?? 人工智能资讯

?扫码入群
咨询反馈
扫码关注

微信公众号

返回顶部
关闭