周剑铭 柳渝:智能哲学:AlphaGo Zero与围棋文化

  • 时间:
  • 浏览:2
  • 来源:首页 大发棋牌中心_大发棋牌会封号_大发棋牌新版

   *法国儒勒·凡尔纳公立综合大学(Université de Picardie Jules Verne, France),计算机系

   摘要:继AlphaGo完胜人类棋手后AlphaGo Zero完胜AlphaGo,恰恰表明了作为人工智能的围棋机器的技术性本质。中国古围棋在日本的职业化也是围棋的技术化,这是今日围棋机器完胜人类的必然。中国围棋的文化本质饱含于棋艺和棋道之中。围棋的棋理只能在科学与人文和联 、西文化的交叉视域中不要再 得到真正的阐释。

   AlphaGo以学习人类经验棋谱而战胜了人类棋手,成为了人工智能的时代标志,而AlphaGo Zero则以“白板”(tabular rasa)学习而再次成为头号新闻,英国经验主义哲学家洛克(John Locke,1632-1704)著名的“白板”说(theory of tabula rasa)认为,人出生时心灵像白板一样空白,通过人的经验心灵中才有了观念和知识,洛克认为经验是观念、知识的惟一来源。AlphaGo Zero的“白板”是指与人类经验棋谱相对的空棋盘,即从0现在开始的“学习”,但洛克的心灵“白板”是人从现实经验中认知或学习,两者的区别就在于AlphaGo Zero不要再要再 人类的棋谱经验可是个人与个人在棋盘上对战的“经验”,这一 区别的微妙之处就在于人类的经验与机器的“经验”有何本质的不同,这与AlphaGo对人类的伦理挑战不同,AlphaGo Zero的“白板”是对人类哲学问题的有一两个 挑战,哪几个问题都深刻地与我们我们我们 歌词 对人工智能的本质的理解和定义有关,实际上导致 成为了今天我们我们我们 歌词 对人的智能的基本认知理论的更新,其意义远超过AlphaGo Zero的成功。

   就AlphaGo Zero的具体具体情况来说,本文讨论1。AlphaGo Zero的“白板”与人类的心灵“白板”有何不同?2。AlphaGo Zero自我对弈的经验与人类的经验有何本质的不同?我们我们我们 歌词 可不要再要再 在智能哲学的论域中研究哪几个问题的深刻意义。

   一、AlphaGo Zero的“白板”学习与人工智能的“先天”性赋予

   DeepMind团队在“自然”杂志上发表的论文,推出了人工智能围棋应用多多线程 的最新版本的更强大的“学习”能力, AlphaGo Zero:Mastering the game of Go without human knowledge (不要再人类知识的围棋大师),据称,AlphaGo Zero以3000 : 0的成绩击败李世乭版本的AlphaGo。(http://nature.com/articles/doi:10.1038/nature24270,中文介绍可见:http://mp.weixin.qq.com/s/68GTn-BaiRPmzi9F-0sCyw)最引人注意的地方是,“我们我们我们 歌词 介绍四种 单独基于强化学习措施 的算法,不要再人类数据、人类的指导,或超越围棋规则的领域知识。AlphaGo成为了它个人的老师,”(we introduce an algorithm based solely on reinforcement learning, without human data, guidance, or domain knowledge beyond game rules. AlphaGo becomes its own teacher)。

   这篇论文的第一作者、AlphaGo项目负责人DeepMind的David Silver在采访中那末 解释说:

   ——AlphaGo Zero删改从“乱打”(随机)现在开始,不要再要再 任何人类数据从最初原理现在开始而取得最高的综合棋艺水平。AlphaGo Zero最重要的理念可是它删改从无知具体情况现在开始学习,也可是从白板(tabular rasa)上现在开始,从自我对弈中领悟,不要再要再 任何人类知识或人类数据,不要再要再 任何人类经验、价值形式或人类的干预。它去发现何如从基本原理现在开始下围棋。否则白板学习对我们我们我们 歌词 DeepMind的目标和雄心非常重要,导致 导致 你能得到白板学习,你就得到了有一两个 代理,它可不要再要再 从围棋移植到任何其它领域。你就从你所在的专业领域解放了出来,你得到了有一两个 算法,它具有普遍性可不要再要再 应用到任何地方。对于我们我们我们 歌词 来说AlphaGo的意义没哟于下棋战胜人类,可是去发现从事科学工作的意义,从应用多多线程 的自我学习能力中了解知识是哪几个。我们我们我们 歌词 现在开始发现,AlphaGo Zero不仅重新发现了人类下棋时的常用模式和开局,以及人类下在棋角上的定式,不仅是学习、发现哪几个否则最终放弃它们而采用个人的模式,其中其他甚至是人类告诉我的或现在还那末用过的。否则我们我们我们 歌词 可不要再要再 说,事实上在短时间内AlphaGo Zero学到了人类上千年积累的围棋实战知识。AlphaGo Zero下棋中分析,靠个人发现更多的知识。有后来 它的选泽甚至超过哪几个,得到其他人类在这一 后来 尚未发现的东西,在不同的措施 上发展出具有创意的新的知识点。

   (AlphaGo Zero which has learned completely from scratch, from first principles without using any human data and has achieved the highest level of performance overall. The most important idea in AlphaGo Zero is that it learns completely tabular rasa. That means it starts completely from a blank slate and figures out for itself only from self-play, without any human knowledge, without any human date, without any human examples or features or intervention from humans. It discovers how to play the game of Go completely from fist principles. So tabular rasa learning is extremely important to our goals and ambitions at DeepMind. And the reason is that if you can achieve tabula rasa leaning, you really have an agent that can be transplanted from the game of Go to any other domain. You untie yourself from the specifics of the domain you’re in and you come up with an algorithm which is so general that it can be applied anywhere. For us the idea of AlphaGo is not to go out and defeat humans, but actually to discover what it means to do science, and for a program to be able to lean for itself what knowledge is. So, what we start to see was that AlphaGo Zero not only rediscovered the common patterns and openings that human tend to play, these joseki patterns that human play in the corners. It also leaned them, discovered them and ultimately discarded them in preference for its own variants which humans don’t even know about or play at the moment. And so we can say that really what’s happened is that in a short space of time, AlphaGo Zero has understood all of the Go knowledge that has been accumulated by humans over thousands of years of playing. And it’s analyzed it and started to look at it and discover much of this knowledge for itself. And sometimes it’s chosen to actually to beyond that and come up with something which the human hadn’t even discovered in this time period. And developed new pieces of knowledge which were creative and novel in many ways. )

DeepMind强调AlphaGo Zero从白板上现在开始自我学习,这是指机器进入包括训练或实战具体情况时不从学习巨量的人类数据现在开始(People tend to assume that machine learning is all about big data massive amounts of computation),但这时的AlphaGo Zero四种 从不白板(裸机),也从不只饱含了“操作系统”的纯净机器,可是具有了强大的机器学习能力的机器,David Silver说 “但实际上我们我们我们 歌词 从AlphaGo Zero中发现,算法比所谓计算或可用数据更重要,事实上我们我们我们 歌词 在AlphaGo Zero上使用的计算(量)比过去在AlphaGo上要少有一两个 数量级,这是导致 我们我们我们 歌词 使用了更多原理和算法。“(But actually what we saw in AlphaGo Zero is that algorithms matter much more than either compute or data availability. In fact in AlphaGo Zero, we use more than an order of magnitudes less computation than we used in previous versions of AlphaGo. And yet it was able to perform much higher level due to using much more principled algorithms than we had before.(点击此处阅读下一页)

本文责编:川先生 发信站:爱思想(http://www.aisixiang.com),栏目:天益学术 > 哲学 > 科学哲学 本文链接:http://www.aisixiang.com/data/106762.html 文章来源:爱思想首发,转载请注明出处(http://www.aisixiang.com)。

猜你喜欢

美国名厨主持人骂中餐厅口味如屎,自称代表正宗中国味道...

平时看美剧也常常能捕捉到“中餐外卖盒”的身影。都说美国人爱中餐,在美国的中餐厅数量早已突破4800家......你这个 ,你这个 外卖盒里装的,人太好全部都是在

2019-12-13

果敢资讯网文艺天地“中国昆明——缅甸作家文学交流座谈会”在昆明举办

  云南网讯;为促进中缅两国人民友谊,增进中缅文明相互之间的交流与理解,加强文化对话和互学互鉴,受中国政府邀请,16位缅甸著名作家于今年10月到中国进行交流访问。  10月28

2019-12-13

喀麦隆总统选举结果出炉 85岁总统比亚再度成功连任

据报道,排名第二的反对党候选人坎托(MauriceKamto),得票率还不可以 14.2%。中新网10月23日电据外媒报道,喀麦隆宪法委员会22日正式发表声明10月7日总统

2019-12-13

沈登苗:双重断裂的代价

Warning:array_unshift()expectsparameter1tobearray,nullgivenin/home/webwww/aisixiang/www/

2019-12-13

黄素娟:乡村基层权力与城市扩张——以民国时期广州河南开发为例

【内容提要】本文试图以民国时期广州河南的开发为例,探讨乡村基层权力何如应对代表着国家政权的城市扩张。在清代的开发历程中,河南形成了街市与乡村两套不同的乡村权力体系。民国时期,

2019-12-13