欢迎来到极品财经网!

[ai会取代人类吗]对AI来说人类知识反而有害是真的吗?

个人网银 时间:2019-02-05

【www.jpmy1688.com--个人网银】

    初看是AlphaGoZero强于Master,Master被人类知识拖累。但这个问题没这么简单,背后有不少有趣的细节,研发者们已经开始深入讨论了。       2017年10月18日Deepmind的《自然》论文介绍了AlphaGoZero,最大的看点就是Zero从零开始自学习,完全脱离人类影响。论文中的等级分,AlphaGoZero高达5185分,比Master的4858分高出300多分。双方对战100局,AlphaGoZero以89胜11负高达近90%的胜率压倒性胜出。双方架构都差不多,最大区别是Master学了人类棋谱,而AlphaGoZero是从零开始,完全脱离人类棋谱影响。因此,很多人都得出了结论,AI从零开始学习,会比向人类学习知识更强,人类知识反而有害。       这其实是一个围棋AI的细节问题,先不要上升到哲学高度,先要把细节搞清楚:AlphaGoZero和Master的区别到底是什么?       之前Master只是出来在上和人类高手下棋,也和柯洁下了三局正式比赛,但没有论文介绍。Deepmind新论文中是这样介绍Master的:       也就是说,Master和AlphaGoZero有一样的络架构、强化学习方法、搜索模块。从这里我们已经可以知道,AlphaGoZero作出的突破,其实主要是研发Master时实现的。Master和Zero不一样的是,神经网络输入的不是原始盘面,而是有一些人为总结的特征,如气、征子。Zero更加自然,有什么知识让机器自己学出来,人不去指导。另外Master有一个rollout模拟至终局数子,而Zero取消了,程序更简单。看上去最重大的区别就是初始策略,Master向人类棋谱学了棋。       但是这里有一个容易被忽视的问题:networkarchitecture指的是什么?是说Master和Zero都是40blocks的resnet(这是完全一样),还是说都是resnet,但blocks的数目可以不一样?实际上Zero就有两个版本,一个20blocks,一个是40blocks。       这是20blocks的AlphaGoZero的棋力上升曲线。学习三天训练490万局后,它以100:0战胜了AlphaGolee。等级分应该是有4000多分,但看上去曲线已经开始走平,不象能超过5000分的样子,应该是到不了Master的4858分。       似乎是为了说明Zero的实力可以强于Master,Deepmind又做了40个blocks的版本。这个版本训练时间要40天,训练了2900万局。最终等级分超过了Master,上了5000分。可以看出,40blocks的实力显然要强于20blocks的Zero。把网络规模从20个blocks扩大到40blocks,显然对最终棋力影响很大。

本文来源:http://www.jpmy1688.com/yh/27200.html

推荐内容