以前のバージョンのAlphaGoは、最初に何千もの人間のアマチュアとプロのゲームを練習して、Goのプレイ方法を学びました。
AlphaGo Zeroはこのステップをスキップし、完全にランダムなプレイから始めて、ゲームをプレイするだけで簡単にプレイすることを学びます。
そうすることで、それはすぐに人間のプレーレベルを上回り、以前に公開されたAlphaGoのチャンピオンを破ったバージョンを100試合差して0で負かした.
DeepMind
https://deepmind.com/blog/alphago-zero-learning-scratch/
This AI Taught Itself to Play Go and Beat the Reigning AI Champion – Motherboard
https://motherboard.vice.com/amp/en_us/article/8x8wy4/this-ai-taught-itself-to-play-go-and-beat-the-reigning-ai-champion
Nature : Nature Research
https://www.nature.com/nature/journal/v550/n7676/full/nature24270.html