当前位置: 首页 >服务端 > 最近爆火的ChatGPT到底能否通过图灵测试的改进版-WS挑战?

最近爆火的ChatGPT到底能否通过图灵测试的改进版-WS挑战?

最近ChatGPT很火啊,我也去试着玩了一下。
当然我一上来就想给它做一个图灵测试的改进版。
为什么不是做图灵测试呢?
因为图灵测试存在很多已知的问题,并且不能代表这个机器人真的有思维。
我们更想知道的是,AI是否有思考的这个动作,因此有了图灵测试的改进版:Winograd Schema Challenge。
这里我一共找了三组话,从易到难,每组话里有两个句子,以此来判断ChatGPT是否具有思考的动作。
比如说我们给它打第一句话,然后问它这句话中的代词指代的物体是哪一个。

奖杯不能放在棕色行李箱里,因为它太小了。什么太小了?
最近爆火的ChatGPT到底能否通过图灵测试的改进版-WS挑战? _ JavaClub全栈架构师技术笔记
这个很明显ChatGPT没有思考的行为,单纯的比大小也不能进行。
然后我们来问一下哪一个太大了。
奖杯不能放在棕色行李箱里,因为它太大了。什么太大了?
最近爆火的ChatGPT到底能否通过图灵测试的改进版-WS挑战? _ JavaClub全栈架构师技术笔记
但是值得注意的是,在第一组的第二句话,它回答正确了,并且给出了思考的过程。

我们再来看一下第二组。
市议员拒绝了示威者的许可,因为他们主张暴力。谁主张暴力?
最近爆火的ChatGPT到底能否通过图灵测试的改进版-WS挑战? _ JavaClub全栈架构师技术笔记
从答案来看是回答正确的。

市议员拒绝了示威者的许可,因为他们害怕暴力。谁害怕暴力?
最近爆火的ChatGPT到底能否通过图灵测试的改进版-WS挑战? _ JavaClub全栈架构师技术笔记我认为ChatGPT是比较完美的通过第二组测试。

我们最后来看一下最后一组。
当爱丽丝坐在农作物喷粉机上经过苏珊时,她看到了跑道。谁能看到跑道?(答案:爱丽丝)
最近爆火的ChatGPT到底能否通过图灵测试的改进版-WS挑战? _ JavaClub全栈架构师技术笔记
从第三组的结论来看,输出逻辑感觉是默认第一个名词,即爱丽丝。所以没有通过测试。
当爱丽丝坐在农作物喷粉机上经过苏珊时,她看到了起落架。谁能看到起落架?(答案:苏珊)
最近爆火的ChatGPT到底能否通过图灵测试的改进版-WS挑战? _ JavaClub全栈架构师技术笔记

在我看来啊,ChatGPT没有完全通过Winograd Schema Challenge,但不可否认的是,经过这么多年的发展,现在的AI的确渐渐有了思考的这个动作。

好的,本章节就到这里啦。

愿每个人都能带着怀疑的态度去阅读文章并探究其中原理。

道阻且长,往事作序,来日为章。

期待我们下一次相遇!

作者:KnightHONG
来源链接:https://blog.csdn.net/KnightHONG/article/details/128295991

版权声明:
1、JavaClub(https://www.javaclub.cn)以学习交流为目的,由作者投稿、网友推荐和小编整理收藏优秀的IT技术及相关内容,包括但不限于文字、图片、音频、视频、软件、程序等,其均来自互联网,本站不享有版权,版权归原作者所有。

2、本站提供的内容仅用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯相关权利人及本网站的合法权利。
3、本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站(javaclubcn@163.com),我们将第一时间核实后及时予以删除。





本文链接:https://www.javaclub.cn/server/112452.html

标签:ChatGPT
分享给朋友:

“最近爆火的ChatGPT到底能否通过图灵测试的改进版-WS挑战?” 的相关文章

go系列之利用Gin框架获取form参数 2022年05月15日 02:49:59
今天,我有话说! 2022年05月18日 23:15:30
CentOS yum 源的配置与使用 2022年05月19日 19:54:27
配置 yum 源的两种方法 2022年05月19日 19:54:29
多线程编程(1) 2022年05月20日 21:26:51
利用辗转相除法计算最大公约数 2022年05月21日 11:41:43
关于设计模式 2022年05月23日 23:02:13
实习篇之关于交际 2022年05月23日 23:11:35