徽标
联盟百科
通讯
下载应用,请到 Google Play
新! 在您的Android™设备上下载联盟百科!
下载
比浏览器更快的访问!
 

蒙特卡洛树搜索

指数 蒙特卡洛树搜索

蒙特卡洛树搜索(Monte Carlo tree search;简称:MCTS)是一种用于某些决策过程的启发式搜索算法,最引人注目的是在游戏中的使用。一个主要例子是电脑围棋程序,它也用于其他棋盘游戏、即时电子游戏以及不确定性游戏。.

24 关系: AlphaGo博弈树卡坦岛印度鬥獸棋启发式搜索万智牌三寶棋亞馬遜棋井字棋圖版遊戲國際象棋六貫棋羅馬II:全軍破敵电脑围棋遊戲樹馬可夫決策過程黑白棋阿爾伯塔大學蒙地卡羅方法搜索算法段级位制深度学习斯卡特撲克

AlphaGo

-- -- -- AlphaGo(“Go”为日文“碁”字发音转写,是围棋的西方名称),直译为阿法围棋,亦被音译为阿尔法狗、阿法狗、阿发狗等,是於2014年开始由英国伦敦Google DeepMind开发的人工智能圍棋軟體,以及對應的電影紀錄片《AlphaGo世紀對決》。 專業術語上來說,AlphaGo的做法是使用了蒙特卡洛树搜索與兩個深度神經網路相結合的方法,其中一個是以估值网络來評估大量的選點,而以走棋网络來選擇落子。在這種設計下,電腦可以結合樹狀圖的長遠推斷,又可像人類的大腦一樣自發學習進行直覺訓練,以提高下棋實力。.

新!!: 蒙特卡洛树搜索和AlphaGo · 查看更多 »

博弈树

#重定向 競賽樹.

新!!: 蒙特卡洛树搜索和博弈树 · 查看更多 »

卡坦岛

卡坦岛(Catan)是由德国人发明的一种多人玩的图板游戏,最初由以卡坦岛拓荒者(Die Siedler von Catan)的名字在德国出版。托伊伯原創設計了基础版跟第一个擴充集。 卡坦岛拓荒者也許是第一款在歐陸以外大受歡迎的德式桌上遊戲,獲得了1995年的德国年度游戏奖,1995年的的第一名和1996年的。截至2015年,这款游戏被翻譯成30多种語言,销售量超过2200万,还被拍成了电影和电视。游戏的基础版和四個擴充版本可在美國的,日本的卡普空以及歐盟的科仕謀思公司購買。.

新!!: 蒙特卡洛树搜索和卡坦岛 · 查看更多 »

印度鬥獸棋

印度鬥獸棋(Arimaa),是美國印度裔Omar Syed在2002年推出的兩人棋類,每年有舉辦比賽。它和鬥獸棋類似,但是也有很大的差距。比如說,它有一個不同的吃子法,沒有河,而且加了推拉和冰凍的規則。 2009年夏季,美國Z-Man Games公司推出其商業產品。.

新!!: 蒙特卡洛树搜索和印度鬥獸棋 · 查看更多 »

启发式搜索

计算机科学中所謂的heuristic,除了有經驗法則的意思外(見啟發式),它還有另外兩個技術上的意義。.

新!!: 蒙特卡洛树搜索和启发式搜索 · 查看更多 »

万智牌

法風雲會(,簡稱:MTG)是一種交換卡片遊戲,设计者为李察·加菲(),由威世智公司()出品,第一个系列出版于1993年。在进行游戏时,双方各用一套卡牌进行,也可以三人或四人以上进行游戏。根据統計,已經有超過200億張的卡牌在2008年至2016年間印製完成。 魔法風雲會在台湾2005年以前由尖端出版代理,2005年後則由威世智公司直營。 2002年推出線上版魔法風雲會Online(MTGO),只支援Windows平台並只有英文版。威世智內部工作室「Magic Digital Studio」在2017年9月推出魔法風雲會:競技場,目前在封閉測試階段,已知正式推出時會支援Windows與macOS。但由於遊戲是以Unity引擎開發,故日後支援其他平台的可能性也相當高。.

新!!: 蒙特卡洛树搜索和万智牌 · 查看更多 »

三寶棋

三寶棋(Havannah),是由荷蘭人克里斯蒂安·費林在1981年推出的兩人棋類,為六貫棋的變體,是奧林匹亞電腦遊戲程式競賽的比賽指定棋類。.

新!!: 蒙特卡洛树搜索和三寶棋 · 查看更多 »

亞馬遜棋

亞馬遜棋(Game of the Amazons),是由阿根廷人Walter Zamkauska在1988年推出的兩人棋類,是奧林匹亞電腦遊戲程式競賽的比賽指定棋類。.

新!!: 蒙特卡洛树搜索和亞馬遜棋 · 查看更多 »

井字棋

井字棋,大陸、臺灣又稱為井字游戏、圈圈叉叉;另外也有打井遊戲、○×棋的稱呼,香港多稱井字過三關、过三关,是種纸笔游戏,另有多種衍生變化玩法。.

新!!: 蒙特卡洛树搜索和井字棋 · 查看更多 »

圖版遊戲

西洋棋 版圖遊戲(Board Game),是桌上遊戲的一類,指將圖文符號畫在一塊硬板上作為記錄工具的遊戲。除了必備的圖版外,也可能用及棋子、骰子、籌碼、卡片、小板塊、資料欄等種類繁多的配件。歷史最早可追溯到古埃及前王朝時期的塞尼特、盤蛇圖,範圍涵蓋古代傳統的棋類到當代的桌遊。 圖版遊戲英文原文为Board Game。常见的翻译还有版圖遊戲、紙盤遊戲、棋盤遊戲、紙上遊戲等。Board Game有时也被翻譯為桌面遊戲,但桌面遊戲亦可指电脑桌面游戏。另外,Board Game此詞有時被錯譯為桌上遊戲。 部分人習慣把棋類當成圖版遊戲的同義詞,同好在圖版遊戲聚會時會稱為『棋聚』。但圖版遊戲較類似華人說的局戲,而不是棋類。.

新!!: 蒙特卡洛树搜索和圖版遊戲 · 查看更多 »

國際象棋

國際象棋(chess),又稱歐洲象棋或--,是一種二人對弈的戰略棋盘遊戲,也是世界上最流行的遊戲之一。世界各地數以百萬計的人在家中、中、網路上以或比賽形式对弈。 國際象棋的棋盤由64個黑白相間的八乘八網格組成。每位玩家开局时各有16個棋子:一王、一-后-、兩车、兩马、兩象和八兵,各具不同功能与走法。棋手行棋目标是將對方的王處在不可避免的威脅之下以將死對方,也可以通过對方自知无望、主动认输而獲勝,另有相当多的情况可导致和局。遊戲過程分三個階段:开局、中局、,共有1043至1050種棋局變化。 国际象棋棋子多用木或塑膠製成,也有用石材制作;较为精美的石頭、玻璃(水晶)或金屬製棋子常用作裝飾擺設。.

新!!: 蒙特卡洛树搜索和國際象棋 · 查看更多 »

六貫棋

六貫棋(Hex)是在六邊形格的棋盤上玩的圖版遊戲,亦是數學遊戲,通常使用10乘10或11乘11的菱形棋盤(約翰·納什則採用14×14的棋盤)。 在計算複雜性理論,六貫棋的複雜性已證明了是PSPACE完全的。(注意不少抽象策略遊戲如國際跳棋、象棋和圍棋都是EXPTIME完全。).

新!!: 蒙特卡洛树搜索和六貫棋 · 查看更多 »

羅馬II:全軍破敵

#重定向 全軍破敵:羅馬II.

新!!: 蒙特卡洛树搜索和羅馬II:全軍破敵 · 查看更多 »

电脑围棋

#重定向 计算机围棋.

新!!: 蒙特卡洛树搜索和电脑围棋 · 查看更多 »

遊戲樹

#重定向 競賽樹.

新!!: 蒙特卡洛树搜索和遊戲樹 · 查看更多 »

馬可夫決策過程

在概率论和统计学中,馬可夫決策過程(Markov Decision Processes,縮寫為 MDPs)提供了一個數學架構模型,用於面對部份隨機,部份可由決策者控制的狀態下,如何進行決策,以俄罗斯数学家安德雷·马尔可夫的名字命名。在經由動態規劃與強化學習以解決最佳化問題的研究領域中,馬可夫決策過程是一個有用的工具。 马尔可夫过程在概率论和统计学方面皆有影响。一个通过不相关的自变量定义的随机过程,并(从数学上)体现出马尔可夫性质,以具有此性质为依据可推断出任何马尔可夫过程。实际应用中更为重要的是,使用具有马尔可夫性质这个假设来建立模型。在建模领域,具有马尔可夫性质的假设是向随机过程模型中引入统计相关性的同时,当分支增多时,允许相关性下降的少有几种简单的方式。.

新!!: 蒙特卡洛树搜索和馬可夫決策過程 · 查看更多 »

黑白棋

黑白棋,又叫翻轉棋(Reversi)、蘋果棋或奧賽羅棋(Othello)。據日本棋類遊戲專家長谷川五郎在2005年的統計數據,在日本,黑白棋愛好者的數目約為六千萬人(日本將棋愛好者約一千五百萬人;圍棋之愛好者約五百萬人;國際象棋愛好者約三百萬人).

新!!: 蒙特卡洛树搜索和黑白棋 · 查看更多 »

阿爾伯塔大學

阿尔伯塔大学(University of Alberta),始建于1908年,位于加拿大艾伯塔省省会埃德蒙顿市中心,北萨斯喀彻温河南岸,是加拿大的一所综合研究性大学。.

新!!: 蒙特卡洛树搜索和阿爾伯塔大學 · 查看更多 »

蒙地卡羅方法

蒙特卡罗方法(Monte Carlo method),也称统计模拟方法,是1940年代中期由于科学技术的发展和电子计算机的发明,而提出的一种以概率统计理论为指导的数值计算方法。是指使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。 20世纪40年代,在冯·诺伊曼,斯塔尼斯拉夫·烏拉姆和尼古拉斯·梅特罗波利斯在洛斯阿拉莫斯国家实验室为核武器计划工作时,发明了蒙特卡罗方法。因为烏拉姆的叔叔经常在摩納哥的蒙特卡洛赌场输钱得名,而蒙特卡罗方法正是以概率为基础的方法。 与它对应的是确定性算法。 蒙特卡罗方法在金融工程学、宏观经济学、生物医学、计算物理学(如粒子输运计算、量子热力学计算、空气动力学计算)机器学习等领域应用广泛。.

新!!: 蒙特卡洛树搜索和蒙地卡羅方法 · 查看更多 »

搜索算法

在计算机科学中,搜索算法是解决搜索问题的任何算法,即检索存储在某个数据结构中的信息,或者在问题域的搜索空间中计算的信息。这种结构的例子包括但不限于链表,数组数据结构或搜索树。合适的搜索算法通常取决于正在搜索的数据结构,并且还可能包括有关数据的先前知识。搜索还包含查询数据结构的算法,例如SQL SELECT命令。 搜索算法可以根据搜索机制进行分类。线性搜索算法以线性方式检查每个与目标关键字关联的记录。二进制或半间隔搜索,重复定位搜索结构的中心,并将搜索空间分成两半。比较搜索算法通过基于键的比较相继地消除记录来改进线性搜索,直到找到目标记录为止,并且可以按照定义的顺序应用于数据结构。数字搜索算法基于使用数字键的数据结构中的数字属性工作。最后,哈希根据散列函数直接将键映射到记录。在线性搜索之外进行搜索需要以某种方式对数据进行排序。 搜索功能也根据其复杂性或最大理论运行时间进行评估。例如,二进制搜索函数的最大复杂度为O(log n)或对数时间。这意味着查找搜索目标所需的最大操作次数是搜索空间大小的对数函数。.

新!!: 蒙特卡洛树搜索和搜索算法 · 查看更多 »

段级位制

段级位制是日本的一种等级划分系统,由古代围棋手本因坊道策所创,在江户时代的围棋学校启用,后来被引进到其他传统艺术和武术项目,其他东亚国家也有使用。 段级位制在武术项目和一些传统艺术项目如围棋、将棋、连珠、花道、茶道等都被广泛采用。现代武道拥有段位者通常会系上黑带,但居合道、剑道、杖道等项目并没有特别标记识别段位所有者。.

新!!: 蒙特卡洛树搜索和段级位制 · 查看更多 »

深度学习

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是用非监督式或的特征学习和分层特征提取高效算法来替代手工获取。 表征学习的目标是寻求更好的表示方法并建立更好的模型来从大规模未标记数据中学习这些表示方法。表示方法来自神经科学,并松散地建立在類似神经系统中的信息处理和对通信模式的理解上,如神经编码,试图定义拉動神经元的反应之间的关系以及大脑中的神经元的电活动之间的关系。 至今已有數种深度学习框架,如深度神经网络、卷积神经网络和和递归神经网络已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并取得了极好的效果。 另外,「深度学习」已成為類似術語,或者说是神经网络的品牌重塑。.

新!!: 蒙特卡洛树搜索和深度学习 · 查看更多 »

斯卡特

斯卡特是一种流行于德国和西里西亚地区的牌类游戏,适合3人或者更多人.

新!!: 蒙特卡洛树搜索和斯卡特 · 查看更多 »

撲克

撲克,是一類使用撲克牌的賭博遊戲。撲克亦可以當成是撲克牌的簡稱,比方可以用打撲克泛指玩任何一種以撲克牌進行的牌類遊戲。.

新!!: 蒙特卡洛树搜索和撲克 · 查看更多 »

传出传入
嘿!我们在Facebook上吧! »