目录
21 关系: AlphaGo,卷积神经网络,吳毅成,平行運算,强化学习,張凱馨,俞俐均,圍棋軟體,圍棋棋士列表,國立交通大學,國際電腦對局協會,分布式计算,周平強,周俊勳,CGOS,綽號,監督式學習,讓子 (圍棋),蒙特卡洛树搜索,递归缩写,UEC杯世界電腦圍棋大會。
AlphaGo
-- -- -- AlphaGo(“Go”为日文“碁”字发音转写,是围棋的西方名称),直译为阿法围棋,亦被音译为阿尔法狗、阿法狗、阿发狗等,是於2014年开始由英国伦敦Google DeepMind开发的人工智能圍棋軟體,以及對應的電影紀錄片《AlphaGo世紀對決》。 專業術語上來說,AlphaGo的做法是使用了蒙特卡洛树搜索與兩個深度神經網路相結合的方法,其中一個是以估值网络來評估大量的選點,而以走棋网络來選擇落子。在這種設計下,電腦可以結合樹狀圖的長遠推斷,又可像人類的大腦一樣自發學習進行直覺訓練,以提高下棋實力。.
卷积神经网络
卷积神经网络(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。 卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网络能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网络在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网络,卷积神经网络需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。.
吳毅成
吳毅成(I-Chen Wu),資訊學者,現任國立交通大學資訊工程學系教授。.
平行運算
#重定向 并行计算.
强化学习
强化学习(Reinforcement learning,簡稱RL)是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。这个方法具有普适性,因此在其他许多领域都有研究,例如博弈论、控制论、运筹学、信息论、仿真优化、多主体系统学习、群体智能、统计学以及遗传算法。在运筹学和控制理论研究的语境下,强化学习被称作“近似动态规划”(approximate dynamic programming,ADP)。在最优控制理论中也有研究这个问题,虽然大部分的研究是关于最优解的存在和特性,并非是学习或者近似方面。在经济学和博弈论中,强化学习被用来解释在有限理性的条件下如何出现平衡。 在机器学习问题中,环境通常被规范为马可夫决策过程(MDP),所以许多强化学习算法在这种情况下使用动态规划技巧。传统的技术和强化学习算法的主要区别是,后者不需要关于MDP的知识,而且针对无法找到确切方法的大规模MDP。 强化学习和标准的监督式学习之间的区别在于,它并不需要出现正确的输入/输出对,也不需要精确校正次优化的行为。强化学习更加专注于在线规划,需要在探索(在未知的领域)和遵从(现有知识)之间找到平衡。强化学习中的“探索-遵从”的交换,在问题和有限MDP中研究得最多。.
張凱馨
張凱馨,台灣人,台灣棋院五段職業圍棋棋士。.
俞俐均
俞俐均(),台灣人,二段職業棋士。.
圍棋軟體
圍棋軟體有幾種不同的分類,一種是單純以電腦為工具,透過網路下圍棋,另外一種是電腦可以透過邏輯與人類(或是另外一台電腦)下棋。.
圍棋棋士列表
曹宏宇 陳德龍 代穎輝 董亦沛 黃明磊 姜國嚴 蒋天棋 李嘉麒 梁春晨 牛歌 王程 王驥 魏子翔 夏銜譽 熊雨沛 徐東華 許莽 楊碩 殷鑒 于飛 張旻 張閔 張祺 張啟 朱仁坤 劉彤 王碩 金磊 李樂 王裕子 张一鸣 邱金波 陳陽 單子騰 崔博東 .
國立交通大學
國立交通大學,簡稱交大,原建於上海,後復校於新竹市,為高教深耕計畫遴選出參與全球鏈結全校型計畫的四所大學之一。該校主要目的為培育工程(engineering)、科學(science)及管理(administration)方面的人才,此宗旨現於交大校徽上的E、S、A。 国立交通大學前身為1896年由盛宣懷創立於上海市徐家汇的南洋公學,在中國抗日戰爭中經歷多次遷校及改組,於國共內戰後,上海原址改組為上海交通大學,並於1958年由教育部選定新竹市為交通大學復校後校址,復校後校址與新竹科學工業園區及國立清華大學相鄰。今日的國立交通大學,主要發展領域為電子、資通訊及光電等,為臺灣知名院校之一,曾一度與國立清華大學洽談合併事宜,但因新校名稱問題而破局。 位於新竹市的交通大學也同上海交通大學、西安交通大學、西南交通大學、北京交通大學並稱「飲水思源 五校一家」,代表五校皆系出於同源。饮水思源紀念碑也為各校的精神團結的象徵之一。.
國際電腦對局協會
國際電腦對局協會 (International Computer Games Association,簡稱ICGA),前身為於1977年由一群電腦西洋棋程式設計師所成立之國際電腦西洋棋協會 (International Computer Chess Association,簡稱ICCA),旨在舉辦以電腦程式為對象的錦標賽,並透過ICCA期刊來促進技術知識的分享。 於2002年更名為現稱,現藉由舉辦奧林匹亞電腦遊戲程式競賽、世界電腦國際象棋錦標賽以及國際電腦遊戲會議(International Conference on Computers and Games),來更廣泛的促進電腦遊戲及遊戲人工智慧社群的發展。ICGA同時也發行季刊,即ICGA期刊,並與世界各地的電腦科學、商業及遊戲組織保持良好的關係。ICGA現由大衛.李維(David Levy)所領導。.
分布式计算
在計算機科學中,分布式计算(Distributed computing),又譯為--。這個研究領域,主要研究分散式系統(Distributed system)如何進行計算。分散式系統是一組電腦,透過網路相互连接傳遞訊息與通訊後并协调它们的行为而形成的系統。组件之间彼此进行交互以实现一个共同的目标。把需要进行大量计算的工程数据分割成小块,由多台计算机分别计算,再上传运算结果後,將結果统一合并得出数据结论的科学。分布式系统的例子来自有所不同的面向服务的架构,大型多人線上遊戲,对等网络应用。 目前常见的分布式计算项目通常使用世界各地上千万志愿者计算机的闲置计算能力,通过互联网进行数据传输(志愿计算)。如分析计算蛋白质的内部结构和相关药物的Folding@home项目,該项目結構庞大,需要惊人的计算量,由一台电脑计算是不可能完成的。虽然现在有了计算能力超强的超级計算機,但這些設備造價高昂,而一些科研机构的经费却又十分有限,藉助分佈式計算可以花費較小的成本來達到目標。.
周平強
周平強,台灣人,台灣棋院六段職業圍棋棋士。其兄為職業棋士周俊勳九段。.
周俊勳
周俊勳(),臺灣嘉義縣人,中國圍棋會一品,臺灣棋院九段、中國圍棋協會三段、職業圍棋棋士,是臺灣1979年成立職業圍棋制度以來第一位職業九段棋手,也是台灣棋院至今唯一拿過大型世界圍棋賽冠軍的棋士。因右臉有大片紅色胎記,號紅面棋王。 他是世界圍棋棋壇上唯一擁有三個職業圍棋組織(中國圍棋會,中國圍棋協會(中國棋院),臺灣棋院)棋籍的棋手。七歲時,父親在業餘比賽中敗給當時也是七歲的張栩,故起念培養周俊勳。2008年曾退出臺灣棋院,現又復歸。.
CGOS
CGOS(Computer Go Server)是圍棋的對弈網站,僅提供給電腦圍棋程式互相對弈。.
綽號
綽號是人的一種非正式的名字,是別名的一種。表示親密或喜愛的綽號也叫暱稱;表示幽默感或嘲弄的綽號也叫諢號(渾號)、諢名(渾名)。 在某些場合下,人們習慣不使用本名,而是用綽號來代替,表示關係親密、喜愛之情、幽默感或嘲弄等意味。從綽號產生、獲得(對於本人來說)的角度來說也稱作外號,意思是其他人所取的名字,儘管綽號可能並不被本人所接受。 在粵語地區,綽號亦被稱作為“花名”。.
監督式學習
監督式學習(Supervised learning),是一個機器學習中的方法,可以由訓練資料中學到或建立一個模式(函數 / learning model),並依此模式推測新的实例。訓練資料是由輸入物件(通常是向量)和預期輸出所組成。函數的輸出可以是一個連續的值(稱為迴歸分析),或是預測一個分類標籤(稱作分類)。 一個監督式學習者的任務在觀察完一些訓練範例(輸入和預期輸出)後,去預測這個函數對任何可能出現的輸入的值的输出。要達到此目的,學習者必須以"合理"(見歸納偏向)的方式從現有的資料中一般化到非觀察到的情況。在人類和動物感知中,則通常被稱為概念學習(concept learning)。.
讓子 (圍棋)
讓子是圍棋的一種對弈制度,指持黑子的一方先在棋盤上擺上一定數目的子之後,再由執白子的一方開始下,這種制度在於使原本棋力有差距的兩個對弈者,能拉近彼此距離,以增加趣味並有助磨練棋力,棋力好的一方因為對手先放子已在盤勢上領先,因此必須儘量採取猛烈攻勢,而棋力較差的一方則可以試圖守住盤勢,以學習於正確的應對攻守方式。讓子的數目,大都直接從九子開始,主要是因為近年發明了九路、十三路棋盤,能下到十九路已有20級以上實力,故大多從九子遞減,偶爾則從讓十三子(中四目法)開始。若是只有十三路底子,可能就得讓十三子甚至十六子了,至於初學的九路,甚至可以讓到25子。 放子順序(以白棋方向看):.
蒙特卡洛树搜索
蒙特卡洛树搜索(Monte Carlo tree search;简称:MCTS)是一种用于某些决策过程的启发式搜索算法,最引人注目的是在游戏中的使用。一个主要例子是电脑围棋程序,它也用于其他棋盘游戏、即时电子游戏以及不确定性游戏。.
递归缩写
一个递归缩写(偶尔写成递归首字缩写)是一种在全称中递归引用它自己的缩写。这个词最先在1986年在纸质出版物中出现。.
UEC杯世界電腦圍棋大會
UEC杯世界電腦圍棋大會()日本東京電氣通信大學(UEC)舉办的世界電腦圍棋錦標賽,自2007年起每年舉辦。冠亚軍可以與職業圍棋選手進行比賽。 UEC杯世界電腦圍棋大會首日進行預賽,積分前16位的圍棋程--入圍第2天的單敗淘汰賽。.
亦称为 CGI Go Intelligence。