無料で使える画像生成AIを試してみようとインストールしましたが、CPU内蔵グラフィック(UHD 770)では1枚生成するのに時間がかかりすぎる(数分かかる)のでグラフィックボードを装着することにしました。
今回購入したのはASUSのGeForce RTX 4060 Ti 16GBのグラフィックボードです。お財布にやさしいRTX 3060 12GBやRTX 2060 12GBと悩みましたが、SDXLだとさすがに厳しくなりそうなこと、画像生成AIの世界は日進月歩で成長しているのですぐに性能要件に追いつけなくなるのではということもあり、RTX 4060 Ti 16GBにしました(RTX 4090は手が出ません…)。
すでに世代は古くなってしまいましたが、Core i7の12700Kに、64GBのメモリを積んで、いわゆるハイスペックに属するようなパソコンを組んでますが、パソコンでゲームはほとんどしていないのでグラボは使っておらず、描画性能は今の時代の最下層でした。
基本的にブラウザを大量に立ち上げてPyCharmやIntelliJのIDEを使うような形で、グラフィックボードの出番になるような画像や動画系処理を全く必要としていなかったのでCPU内蔵のUHD 770で十分でした。
が、動画編集をするようになって、さらにその流れで画像生成AIを試したくなったこともあってグラボを新調しました。
幸い拡張ボードにはなにも載せていなかったので、ATXケースとはいえパソコン筐体内のスペースには余裕があります。
届いたグラフィックボードを取り出して準備します。といってもこのアングルだと単なる2連ファンにしか見えません(笑)
ぐっと差し込んで装着完了。ストッパーにはめるのに結構押し込んでやらないといかず、こんなに力入れていいのかと不安になったところでカチッと音がなって装着できました。自転車パーツみたいに最大トルクが指定されてればいいんですが…。
無事起動してGPUが動いてくれました。ブラウザとIDEとBlueStacks、そしてStable Diffusion(AUTOMATIC1111)とSDXL(Fooocus)を立ち上げたところ既にメモリは36GB越え…。先週のうちに64GBに戻せてよかったです。
とりあえずいろいろ試してみますが、AUTOMATIC1111を使っていてもStable Diffusionだとまだまだ学習が必要なようで、初心者の自分でも簡単にできたのはFooocus。
「Hamster standing on top of Lion Rock mountain and looking down Hong Kong buildings」と指示したらけっこうちゃんとした画像を自動生成してくれました。急速に発展しているAIの世界ですが、このように発信者の意図を汲んで解釈をする力も各AIの性能評価として重要になってくるのかと思います。
漫画風にするとこんな感じになりました。
そう、すでにお気づきの方もいると思いますが、このハムスターを女性にして夜にしたのが冒頭のイラストになります。
そして前々からやりたいと思っていた「ハムスターを自転車に乗せる」を実行に移します🐹
手始めに「hamster is riding bicycle and competing with other hamsters on bicycle in road bike racing」と指示したところ一匹のソロライドに😅
次に、「Each of 20 hamsters is riding bicycle and competing with each other in road bike race」と20匹指定してみましたが、さすがに無謀だったのか3匹のみで、さらにレースしてる風でもないサイクリング光景になりました🤣
指示(プロンプトとか呪文と呼ばれている)によってかなり品質が変わってくることもあり、AI時代は指示の出し方が人間の腕の見せ所になりそうな感じです。
プロンプトエンジニアという高給取りが生まれるくらい熱い分野らしく、これはハマってしまいそうな予感がしました…。
0 件のコメント :
コメントを投稿