420.画像生成AI
初回:2025/6/4
昔を懐かしむコラムを書いていたら、ほんとに懐かしくなってしまいました。
P子「部屋の片づけしていたら、昔のアルバムを見つけたみたいな感じね」※1
『SEの格言・迷言・ことわざ集』を書いていたころ、登場人物に商用利用可能なフリー素材の画像を使っていました。個人的にはイメージに近い画像を仕えていたのですが、表情やスタイルなどはあくまでフリー素材の作者さんが用意されていた素材から選ぶだけで、ネタにぴったり合わせることができませんでした。ところが、現在のAIによる画像生成は、非常にきれいな画像を(ある程度のイメージ通りに)生成してくれるので、これが使えないかと考えていたところでした。
P子「今どきの画像生成の技術進化はすごいもんね」
1.画像生成AI
ここでは、数ある画像生成AIの中から、google の gemini を使ってみたいと思います。
P子「それしか使ったことがないんでしょ」
生成系AIの特徴などは、検索すれば色々と見つかると思いますので、ここでは使ってみた感想だけにとどめておきたいと思います。というか、私もAI利用はまだまだ初心者なので、説明できるほどの知識も持っていません。
まず最初に言っておくと、google の gemini の無料版には、画像生成回数などの制限があります。
本人(gemini)に聞いてみました。
『gemini の無料版での画像生成の制限について教えてください。』
・生成回数: 1日の生成回数に制限があります。 具体的な回数は明示されていませんが、「1日数回程度まで」「1日に15回」
「50回まで」といった情報が見られます。
上限に達すると、「今日はこれ以上画像を生成できません」といった
メッセージが表示され、翌日まで待つ必要があります。
・画像サイズと解像度: 生成される画像のサイズは最大2048x2048ピクセルに
制限されています。高画質には対応していません。 ・人物画像の生成: ・以前は人物画像の生成が制限されていましたが、2025年2月頃からは無料版
でも人物画像を生成できるようになったという情報があります。 ・しかし、特定の人物を模した画像や、実在の人物の肖像権を侵害する可能性
のある画像、不適切なコンテンツ(暴力的、性的、未成年を含む表現など)は、
ポリシーに基づいて生成が制限される場合があります。 ・商用利用: 基本的に商用利用は認められておらず、個人での非営利目的での
利用に限定されます。 商用利用を検討する場合は、利用規約を必ず確認する必要があります。 ・アスペクト比: 生成される画像のアスペクト比は固定されており、正方形の
画像が生成されることが多いようです。
商用利用はできないので、『SEの格言・迷言・ことわざ集』の書籍出版時には気を付ける必要がありそうです。
P子「なに、訳のわからないことを言ってるの?」
2.登場人物の相関図
登場人物の相関図で比較してみることにしましょう。生成された画像自体は上半身と背景も含めて生成されましたが、昔の相関図に合わせた大きさに加工しています。
当時の相関図
生成AIで生成した画像の相関図
個人的には、なかなかいい感じの画像が生成できたと思います。
3.まとめ
まだ、お遊び程度にしか使っていませんが、この画像生成AIはすごいです。今のところ、gemini には生成した画像に名前を付けて管理する機能はないので、後から色々な表情を作ったりするのにはひと工夫必要みたいですが、他の生成AIでは、すでにそういう機能があるようです。生成時のキーワードや特徴を残しておいて、再作成するとか、作成した画像を元にするとかもできますし、今後の機能アップで組み込まれる可能性は高いと思います。
P子「初音ミクのように、同一人物をベースに色々とシチュエーションを変えたりする使い方って需要があるものね」
これからも生成系AIに期待したいと思います。
ほな、さいなら
======= <<注釈>>=======
※1 P子「部屋の片づけしていたら、昔のアルバムを見つけたみたいな感じね」
P子とは、私があこがれているツンデレPythonの仮想女性の心の声です。