人工智慧AlphaGo與韓國棋王的圍棋過招
上週最受矚目的科技新聞,莫過於Google DeepMind 團隊打造的人工智慧系統 AlphaGo,與韓國棋王李世乭的圍棋大戰,最後 AlphaGo 以4:1打敗李世乭。AlphaGo 在世界職業圍棋排名網站晉升到第2名,還得到名譽九段棋士的榮譽。人工智慧電腦,真的比人類聰明嗎?研發者是如何設計出贏過人類的AlphaGo呢?
想了解 AlphaGo 的一般讀者,建議由台大資訊工程系林守德教授的導讀文章看起──「戰勝自己」不只是口號──《Nature》AlphaGo論文讀後感,了解運用 Deep Neural Nets(DNN深度神經網絡)、Reinforcement Learning(RL增強式學習)、演算法的方法,如何打造這個人工智慧(AI)。資工領域的學生及研究者,請直接由台大圖書館的電子期刊系統,進入《Nature》網站,下載這篇2016年1月發表的論文──〈Mastering the game of Go with deep neural networks and tree search〉。如果在《Nature》網站搜尋”AlphaGo“,也能找到幾篇相關的入門文章、新聞報導。──〈Google AI algorithm masters ancient game of Go〉、〈The Go Files: AI computer clinches victory against Go champion〉、〈What Google’s winning Go algorithm will do next〉
此外,在台大圖書館整合查詢系統搜尋”AlphaGo”,能找到一篇Cornell University Library剛收錄的2016年ICLR(International Conference on Learning Representations)的會議論文──〈Better Computer Go Player with Neural Network and Long-term Prediction〉。若想進一步了解類似的技術,亦可搜尋 “Artificial Intelligence”、”Reinforcement Learning”、”Deep Neural Nets”、”Convolutional Neural Network” (卷積神經網路)等名詞。
書名 / 文章篇名 | 作者 | 年代 |
Artificial intelligence : a modern approach | Stuart J. Russell, Peter Norvig | 2003 |
Artificial intelligence | Blay Whitby | 2009 |
Artificial intelligence: approaches, tools and applications | Brent M. Gordon | 2011 |
Probabilistic machine learning and artificial intelligence | Zoubin Ghahramani | 2015 |
Multi-Agent Machine Learning : A Reinforcement Approach | H.M. Schwartz | 2014 |
Reinforcement and Systemic Machine Learning for Decision Making | P. Kulkarni | 2012 |
Reinforcement Learning: State-of-the-Art | Marco Wiering, Martijn van Otterlo | 2012 |
Multi-task deep neural network for multi-label learning | Yan Huang, Wei Wang, Liang Wang, Tieniu Tan | 2013 |
Direct Loss Minimization for Training Deep Neural Nets | Yang Song, Alexander G. Schwing, Richard S. Zemel,Raquel Urtasun | 2015 |
A convolutional neural network approach for face verification | Khalil-Hani, Mohamed ; Liew Shan Sung, Mohamed | 2014 |
A comparison between a neural network and a SVM and Zernike moments based blob recognition modules | Lucian-Ovidiu Fedorovici, Florin Dragan | 2011 |
※電子書平台使用教學:ebrary。
如果覺得看英文書太苦悶,我們換個比較有趣的主題,在台大圖書館整合查詢系統輸入尋”棋 AND 電腦”,看看台灣和中國大陸的研究者,曾經嘗試開發電腦程式玩哪一種棋藝──圍棋、六子棋、象棋、軍棋……等不勝枚舉。
最後,我們回歸現實世界,好好下一盤圍棋,打發休閒時光之餘也訓練腦力、磨練心智,到台大圖書館研讀棋譜、閱讀圍棋名人的傳記,效法日本棋聖本因坊秀策的精神。關於台大圖書館收藏的棋譜、學習書籍、棋聖/棋王傳記,請參見本部落格在2014年6月6日的文章──跟棋聖本因坊秀策一起下圍棋。
參考資料
- 呂紹玉(2016/3/16)。AlphaGo 排名晉升到世界第 2 名,更獲頒名譽九段棋士榮譽。TechNews科技新報。
- 林守德(2016/3/14)。戰勝自己」不只是口號──《Nature》AlphaGo論文讀後感。數位時代。
- 尹相志(2016/3/14)。淺談Alpha Go所涉及的深度學習技術。數位時代。
by Chih-Lo Chen