自撮り写真をアニメ調に変換して気づいた、“プロンプト”と“感性”のズレと楽しさ(ChatGPT&DALL·Eとのやり取りで学んだ、生成AI時代の写真表現)

目次

はじめに:プロンプト通りに出ないから面白い

最近、ChatGPTと会話しながら自撮り写真を「アニメ調に変換する」というのをよくやってます。
ただのAI画像加工に見えるかもしれないけれど、やってみると意外と深い。

「もう少し若く見せたい」

とか

「表情は穏やかだけど目はちゃんと開けていてほしい」

そんなちょっとした“わがまま”が、AIにどう伝わってどう表現されるかを見ていくと、自分の感覚や理想の輪郭が見えてくる気がするのよ。
この記事では、ChatGPTとDALL·Eを使って自撮り写真をアニメ調に変換するまでの会話と、その中で得た気づきについて、アタシの実体験としてまとめてみました。

きっかけは一枚の自撮り写真から

ChatGPTとSNS運用の相談をしていたとき、会話の流れで「なつきさんの理想としている姿」という話題になったの。

そのときふと思い出したのが、ある一枚の自撮り写真。

おうちスタジオで、オパライト+グリッドを組んだクラムシェルライティングで撮ったもので、自分としてはちょっとクールで気に入っていた一枚。

この写真を「アニメ調に変換してみたい」と思ったのが、すべての始まり。

おうちスタジオで、オパライト+グリッド+クラムシェルライティング
自分としてはちょっとクールで気に入っていた一枚。おうちスタジオで、オパライト+グリッドを組んだクラムシェルライティングで撮影

アニメ調への変換、思ったよりスムーズじゃなかった

1st Try:おまかせでお願いしてみたら…

最初はこんな感じでお願いしてみたの

添付の画像を以下の点を考慮してアニメ調にしてください。
・背景は原画から変更しない
・人物のポーズ、服装は原画から変更しない


仕上がったのがこちら。。

写真をアニメ調に変換。ちょっとおばあさん。。。
ちょっと…年配?目も閉じてるし…


見た瞬間、ちょっとショック。
まるで“上品なおばあさま”のような印象で…。しかもお目目閉じてるし。
リアル年齢を考えたら、正直アリなのかもしれないけど、自撮り写真としての雰囲気とはギャップがあるわよねぇ(と思いたいわ)。。。

2nd Try:「もう少し若く見せて」とお願い

もうちょっと空気読みなさいよ、ってことで、ここはアタシの要求を素直にリクエストしました:

もう少し若く見えるようにしてください。

かなりストレートに言っちゃたわ。すると今度は…

写真をアニメ調に変換。急に若くなって、てか、若すぎよ、可愛いからいいんだけど。。
いきなり可愛くなりすぎじゃない!?

まさかの急ハイティーン化。でも正直これはこれでちょっと嬉しかった(笑)
ただ、やっぱり目を閉じたまま。
うーん、アタシの目、小さいのかしら…と軽く凹んだりして。

3rd Try:「目を開けてください」と伝えたら…

そこで次は目にフォーカスしてお願い。

目をあけてください。

ほぼ、そのままの要求。結果は…

写真をアニメ調に変換。おっきなお目目で可愛いからいいんだけどさ。。
これぞアニメ風って感じ。ぱっちりお目目で元気な表情に✨

これまでと一気に雰囲気が変わった印象。
これはこれでアリ。でもちょっと若くなりすぎた感も…。

4th Try:2ndと3rdの“中間の表情”をお願いしてみた

ここまで3回tryして、どんなプロンプトで書いたの?とかいろいろ聞いてみると、2枚目と3枚目の中間の表情みたいなのもできるよって提案してくれたので、それをお願いすることにしたの。

この2つを組み合わせた中間の表情にしてください。

その結果がこちら。

写真をアニメ調に変換。原画からはちょっと離れてるけど、年齢感はイイ感じになった気がするわ。
確かに中間っぽいちょうどいい感じ。年齢感と表情のバランスが好き。

4度目にして、やっと、自分が「これかも」と思えるアニメ調表現になりました。

プロンプトって実際どうなってるの?

途中から気になってきたのが、ChatGPTが実際どんなプロンプトを使って画像生成AI(DALL·E)に依頼してるのかということ。
聞いてみたら、かなり丁寧に教えてくれました。

たとえば「目を閉じた若い女性」のときは:

“This 2D anime-inspired illustration portrays a serene young woman…”

「目を開けたバージョン」では:

“This anime-style illustration depicts a young woman with long, chestnut brown hair…”

しかもプロンプトは毎回一から作り直されてるの。
だから同じようなリクエストでも、少しずつ違う画像が生成されるわけ。

生成AIとChatGPT、それぞれの役割と限界

私が理解したのは、次のような構造になっていること:

機能担当AI備考
会話理解・プロンプト作成ChatGPT(会話AI)会話の文脈をくみ取るのが得意
画像生成DALL·Eなどの生成AI指示されたプロンプトに従って絵を描く

つまり、ChatGPTは“翻訳者”であり、“橋渡し役”なのね。
そして、画像生成AIは“その場限りの反応”をするから、過去の会話を覚えていない。
だからこそ、画像生成AIに渡すプロンプトって毎回ちゃんと構成し直してもらう必要があるのね。

“ちょっと若く見える”って、どう伝えるの?

今回特に印象深かったのは、“若く見せたいけど若くなりすぎたくない”という感覚(てか、ワガママ。。。)がなかなかうまく伝わらなかったこと。

「middle-aged woman」っていう表現は、ChatGPTにとっては40〜50代の女性という意味だけど、DALL·Eには“シワの描写”や“老け感”として強く出てしまう傾向があるみたいなの。
つまり、「会話AIの論理的な理解(middle-aged = 40〜50代)」と「画像生成AIのビジュアル解釈(middle-aged = シワ・老け感強調)」にズレがあるのよ。

ChatGPTは、そういった(AIと人の感覚の)ズレに丁寧に応えてくれたっていうのが、今回の1st~4th Tryだったってわけね。

「大人の落ち着き」と「若々しさ」を両立させるようなプロンプト表現の例を教えてもらったわ。

印象を調整するプロンプトの工夫:
• “a graceful woman with a warm, youthful glow” (上品で若々しい輝きを持った女性)
• “natural smile, gentle expression, subtle makeup” (ナチュラルな笑顔・やさしい表情・控えめなメイク
• “elegant and approachable”(エレガントかつ親しみやすい)
• “healthy skin, soft features, smooth complexion”(肌ツヤがよく、柔らかな顔立ち)

こういう雰囲気でバランスを取る表現を使うと、いい感じに“アラカンだけどキレイ”が出せるよ、ってストレートに教えてくれました。

なんか、思ってることを見透かされてちょっと恥ずかしかったわ。。。。

まとめ:「お願いする」から「一緒につくる」へ

これまでは、ChatGPTに「~して」と一方的に頼む感覚だったけど、このやり取りを通じて、「相談しながら表現を育てる感覚」になったの。

年齢の見え方、目の開き方、表情のニュアンス…

どれも「こういうふうに見られたい」っていう、ちょっとした願いがある。
そして、それをAIと対話しながら探っていけるって、なんだかすごくクリエイティブだなと思えたの。

自撮りしているときと感覚としては同じね。

最後に
アタシのやり取りが、誰かの“自分らしさ”を見つけるヒントになればうれしいです。
ChatGPTや生成AI、気になるけどちょっと難しそう…という方に、少しでも親しみを感じてもらえたら何よりです。

なつき。

にほんブログ村に参加しています。

PVアクセスランキング にほんブログ村 にほんブログ村 写真ブログへ
自撮り写真をアニメ調に変換して気づいた、“プロンプト”と“感性”のズレと楽しさ ChatGPT&DALL·Eとのやり取りで学んだ、生成AI時代の写真表現

この記事が気に入ったら
フォローしてね!

コメント

コメントする

CAPTCHA


目次