When you enroll through our links, we may earn a small commission—at no extra cost to you. This helps keep our platform free and inspires us to add more value.

AlphaZeroの意外な構造 またはAlphaGoは如何にして棋譜データの利用をやめて自分の経験に頼るようになったか
囲碁AIの強化学習アルゴリズム:AlphaGoから人の知識なしでゼロから学習に成功した強化学習モデル のゲームAI「AlphaZero」の学習モデルとモンテカルロ木探索を数式とイラストで解説していきます。将棋AIとしても成果を出しています。
₹519

This Course Includes
udemy
4.1 (17 reviews )
4h 56m
english
Online - Self Paced
professional certificate
Udemy
About AlphaZeroの意外な構造 またはAlphaGoは如何にして棋譜データの利用をやめて自分の経験に頼るようになったか
AlphaGoは大量のプロの棋譜データを集めて教師あり学習をさせていましたが、その後発表されたAlphaGoZeroは、プロの棋譜データなしで、まるで赤ちゃんのような状態から学習を始めてAlphaGoに勝つようになりました。さらに、AlphaGoZeroをより汎用的に改良したAlphaZero は大変シンプルな構造となっていて、強化学習初心者でも学びやすくなっています。モンテカルロ木探索 (Monte Carlo Tree Search) と、マルチヘッドのディープニューラルネットワークを中心に学んでいきます。 AlphaZeroは、Googleの巨大なネットワークの中で学習されたゲームAIですので、1台のマシンでは学習できませんが、論文に基づくコードを動かしながら、人の知識なしでゼロから学習を始めるAlphaZeroの構造を、強化学習の観点から、豊富な図とPythonプログラミングで楽しく学んでいきましょう。 前半には、チェス・マシン「Deep Blue」についての解説もあります。
What You Will Learn?
- AlphaGo ZeroとAlphaZero の仕組みを強化学習を通して説明できるようになります。 .
- AlphaZeroに至るまでの歴史的経緯をたどることができます。 .
- AlphaZeroを通して、ニューラルネットワークやディープラーニングの概要を理解します。 .
- Pythonコードに触れることができます。(初心者向け).