初心者の学生が将棋の授業で新しい頭の使い方を習得
2013年から2023年まで、駒場では初心者を対象にした将棋を学ぶゼミナールが毎年開催されてきました。
当初からこの授業を担当してきた金子知適先生が、その内容や目的、そして、2013年にトッププロ棋士に勝利し注目を集めたコンピュータ将棋ソフトの研究について紹介します。
相性が合えば強くなる
総合文化研究科教授
KANEKO Tomoyuki
2013年に始まった教養学部の全学体験ゼミナール「将棋で磨く知性と感性」を担当していました。日本将棋連盟
のプロ棋士が講義と指導を行う初心者対象の授業です。目的は東大生に新鮮な体験や頭の使い方をしてもらうこと、そして文化の継承や将棋の普及です。当時は対局解説のネット配信が増え始めた頃で、将棋に関心を持つ学生が多かったということもあり、先行していた囲碁の全学体験ゼミに倣った構成で始めました。
授業の前半は講義、後半は学生同士で対局するというカリキュラムです。5×6マスの小さな将棋盤から始め、その後は歩をすべて取り払って行う「青空将棋」など、基本ルールを学び将棋の感覚を摑んでから、指し方や駒の利きを把握していきます。古代インドのチャトランガというゲームから始まったとされる将棋の歴史や、駒や盤の作り方などの文化面も学んでもらいます。かっこいい駒の指し方などもありました。全13回の授業は毎年好評でした。
2~3週目になると急に指す手が変わって強くなる学生もいます。スマホアプリなどで将棋を特訓したとのことでした。相性が合えば強くなるゲームです。最終回は学生の代表者が堀口弘治八段と対局します。「居飛車」対「振り飛車」など、どんな局面から始めたいか学生の希望を聞き、そこまで約束通りに進めてから、棋士の本気の強さを発揮してもらう。当然歯が立ちません。将棋ゼミは2023年度を最後に現在は休止中です。


iMac 666台などで2.7億局面/秒を読む
私はゲームをテーマに人工知能(AI)を研究してきました。その成果の一つが、2013年の第2回電王戦でA級棋士の三浦弘行八段に勝利したコンピュータ将棋ソフト「GPS将棋」の開発です。「GPS」はプロジェクトメンバーが所属していた田中哲朗先生率いる総合文化研究科の「ゲームプログラミングセミナー」の略。事前に過去の棋譜を機械学習させ、形勢判断力を向上させました。最大の特徴は多数の計算機を使ったことです。駒場キャンパスの情報教育棟に設置したiMac端末 666台とその他の計算機13台の大規模クラスタで将棋プログラムを動かすことで、1秒間に約2.7億の局面を読むことを可能にしました。
その後ゲームAIの作り方は大きく変わりました。現在は、囲碁AI「AlphaGo」や汎用ボードゲームAI「AlphaZero」などで広く知られるようになった、ニューラルネットワークベースの「強化学習」が共通基盤になっています。AIがゲームなどの環境の中で、自律的に、試行錯誤しながら振る舞いを学習していく技術です。私はポーカーのような隠された情報がある「不完全情報ゲーム」や、3人以上で行うゲームを題材に強化学習技術を研究しています。ゲームから現実社会への応用を見据えて、複雑さを持つゲームをテーマにしました。
ゲームはAIの到達度を測る試金石としても注目されてきました。例えば、近年急速に発達しているLLM(大規模言語モデル)ですが、非常に賢い一方で世界の常識をどこまで知っているのかというとまだ怪しいところがあります。将棋の棋譜を渡してLLMに解説させてみても、そこまでうまくいきません。今後は、強いだけでなくゲームの法則をしっかり分かった、LLMのように自然言語で話すAIの実現につながるような研究もしたいと考えています。


- 金子先生の推しゲー
- 『PowerWash Simulator
』(スクウェア・エニックス)
「高圧洗浄機でひたすら汚れを落とすゲーム。頭を空にして気分転換できます」


