WSL2のcudaで対流方程式を解いてCPUとGPUを比べた

 昨日の日記のは一次精度風上だと思っていたら色々と間違っていて、中心差分だった。ZabuskiがKdVを超適当に解いたときの開放で到底使い物になる代物ではない。一次精度風上も発散しないというメリットはあるが、という程度。
 ともあれ、CPUとGPUの結果を比べると多分あまり変わらない。
f:id:S-ili:20210309014125p:plain

 性能はというと、CPUで1秒以下、GPUで7秒。
 なんでだ?
 WSL上で動かすと遅い?
 メッシュの数が少なすぎ?
 GPUのスレッド間の同期とらないといけないからそこがオーバーヘッドになってる?もう少し高精度なスキームを使うと速くなるのか?一応O3の最適かかけてるが、よくわからん。
 まあ手段を目的にするためにこうして遊んでいるので、まあ明日は3次精度風上でやってみるかな。