記事閲覧
質問掲示板
TOP > 過去ログ > 記事閲覧
fld_nor.gif katagoの探索速度について
投稿日 : 2020/03/19(Thu) 06:23
投稿者 saosyuyant
参照先
lizzieでkatagoを動かしてみると、自分のPCの場合、visits/secondの数値が20bで3000前後、30bと40bだと1000前後です。

これに対して、lzの40bだと10000前後です。katagoがだいぶ遅いようです。

タスクマネージャーでGPU使用率を見てみると、lzの時は17%くらいですが、katagoだと2%しか使っていませんでした。

katagoでgpu使用率を上げる方法をご存じの方いらっしゃれば、教えて頂けないでしょうか?
件名 Re: katagoの探索速度について
投稿日 : 2020/03/20(Fri) 00:54
投稿者 odagaki0621
参照先
情報掲示板においてヲー氏が次のように書き込んでおられました

最新のメガパックのおかげ(多分configの自動セットアップ)でkatagoの探索速度が40bのleelazeroと同じくらいになりました。対局させてもkatago側のみ20bなのにも関わらず同等以上の力を見せているので、もうkatagoの時代なのかもしれませんね
件名 Re: katagoの探索速度について
投稿日 : 2020/03/20(Fri) 06:42
投稿者 saosyuyant
参照先
返信有難うございます。

私の質問内容はメガパックに同梱されているLizzieのものなのですが・・・

PCのスペックによって違ったりとかそういうことでしょうか。

ちなみに、Lizzieだけでなく、sabakiで試した場合でもlzの40bはGPU使用率が14%なのに対して、katagoの20bだとGPU使用率2%です。
件名 Re: katagoの探索速度について
投稿日 : 2020/03/20(Fri) 09:08
投稿者 Eba
参照先
専門的なことは分かりませんが、NVIDIA GPUはtensorコアに依存するので、タスクマネージャーはあてにならず、nvidia-smi.exeを使うと真の使用率が計測できると聞きました。NVIDIA製品以外でも同様のコマンドがあるのかは知りません。
探索速度に限らず、KataGoを最適化するならmegapackでKataGoのチューンアップをすればよく、GPU使用率をあまり気にすることはないかもしれません。
件名 Re: katagoの探索速度について
投稿日 : 2020/03/20(Fri) 11:40
投稿者 saosyuyant
参照先
nvidia-smi.exeを試してみたのですが、リアルタイムでの変化を観察できるような感じではないようです。

GPU-Zというフリーソフトを見つけて、これでGPUの負荷を調べてみました。そしたら、lzもkatagoも同様にGPU負荷率が90%を超えていました。

タスクマネージャーだと2%だったので、GPUがほとんどはたらいてないと思っていたのですが、そうではなかったようです。

katagoのチューンアップについて、少し数値をいじってみたのですが、探索速度はほとんど変わらないようでした。

あまり気にしても仕方がないのかなと思いました。
件名 Re: katagoの探索速度について
投稿日 : 2020/04/01(Wed) 01:39
投稿者 saosyuyant
参照先
最初の質問内容に、lzの40bで10000visits/sとありますが、lzの場合、最初の1手目は回転、対称、で同一の局面でNNの結果を流用するので見かけ上8倍の速度が出るようです。

完全に非対称な局面になったときの数値が実際の数値になるということで、自分の環境(i7-9700 3.0GHz RTX2060)だと、lizzie0.7.2のlz40bで約650visits/s、lizzie0.7.2のkatago(20b?)で約350visits/s。

同じことをメガパック同梱のlizzieで試すと、lz40bで約750visits/s、katago20bで約1100visits/sでした。

メガパックのkatagoが0.7.2のkatagoよりだいぶ速いですが、これはメガパックのkatagoがCUDAバージョンで、0.7.2のkatagoがOpenclバージョンであることが理由のようです。

試しにメガパックのkatagoをOpenclバージョンに置き換えて速度計測してみたら半分くらいに落ちました。

GPU使用率に関しては、タスクマネージャーのGPU使用率の一覧で、デフォルトで「3D」となっているところを「CUDA」にすると、katago稼働時に98~100%を示しました。

つまりkatagoに関しては、CUDAバージョンを使えばCUDAがほぼフル稼働し、lzに見劣りしない速度を出してくれるようです。
TOP > 記事閲覧

- WEB PATIO , Modified by Eba -