본문 바로가기
AI

57. ChatGPT와 DALL-E로 AI 이미지 생성 도전기: 1

by 구구 구구 2024. 3. 18.
반응형

 

힘들지만 차근차근 하면

 


이전에 업로드 한 AI 이미지 생성 방법에 관한 글을 먼저 읽고 오시는 것을 추천드립니다

 

2024.03.16 - [AI] - 55. ChatGPT와 DALL-E로 전문가 수준의 이미지 만들기 1: 기초

 

55. ChatGPT와 DALL-E로 전문가 수준의 이미지 만들기 1: 기초

ChatGPT와 DALL-E로 전문가 수준의 이미지 만들기 1: 기초 ChatGPT와 DALL-E의 결합이 이미지 생성을 어떻게 변화시켰는지 알아보세요. 이미지 생성의 기초, 스타일과 구성, 맞춤형 이미지 만들기까지,

guguuu.com


 

이번에도 직접 AI 이미지 생성을 좀 더 구체적으로 알아보기 위해 직접 도전했습니다

 

무엇을 참고하여 무엇을 만들지? 고민 해본 결과,

저번에 ChatGPT를 통해 소설 쓰기에 직접 도전하여 얻은 결과물이 생각났습니다

 

2024.03.14 - [AI] - 53. ChatGPT로 소설 쓰기 (예시) 1: 기본 구조 만들기

 

53. ChatGPT로 소설 쓰기 (예시) 1: 기본 구조 만들기

이번 글과 다음 번 글은, 제가 이전에 쓴 2024.03.13 - [AI] - 52. AI와 함께하는 창작 여정: ChatGPT로 소설 쓰기 52. AI와 함께하는 창작 여정: ChatGPT로 소설 쓰기 ChatGPT로 소설 쓰기: AI로 창의적인 이야기

guguuu.com


 

당시에 ChatGPT와 논의해본 결과 총 네 명의 주요 캐릭터를 만들 수 있었습니다.

 

등장인물:

1) 황치즈러스크: 호기심 많고 용감한 주인공. 모험을 떠나는 데 주저함이 없습니다.

2) 초코칩 쿠키: 황치즈러스크의 첫 번째 동료. 달콤한 말로 모두를 격려하지만, 겁이 많습니다.

3) 매콤한 프레첼: 두 번째 동료로, 언제나 자신감이 넘치지만 가끔은 너무 직설적입니다.

4) 소금빵 크래커: 지혜롭고 침착한 세 번째 동료. 그들이 길을 잃었을 때 항상 해결책을 제시합니다.

 

이전 글을 보시면 아시겠지만, 이 일의 시작은 당시 모 편의점의 과자를 키워드로 입력한 것 이었습니다.

ChatGPT에서 DALL-E로 들어가, 다음 그대로 입력했습니다.

 

일단 과자의 실물 사진을 보여주고, 제가 상상하는 스타일(동화같은)에 맞춰 부탁했습니다.

 

-

You:

[style: 손으로 그린 느낌, 부드러운 색상, 단순화된 형태, 크레용이나 연필 효과]

이 과자는 '황치즈러스크'야. 황치즈러스크 한 개를 그려줘.

 

DALL-E:

-

 

맘에 들지 않습니다. 이건 러스크 과자보다는 수세미나 스펀지 같아요.

이걸 고치기 위해서 일단 DALL-E에게, 네가 생성한 이미지의 Seed와 Prompt가 무엇인지, 물어봅니다.

 

-

You:

이미지의 Seed와 Prompt를 알려줘.

 

DALL-E:

Seed:3919956741

Prompt: This image depicts a 'Yellow Cheese Rusk'. The snack appears in a hand-drawn style with soft colors, simplified shapes, and effects reminiscent of crayons or pencils. The cheese rusk is characterized by its vibrant yellow color, cubed shape, and a texture that suggests a crispy yet slightly airy feel. The overall aesthetic is warm and inviting, with a playful touch that comes from the hand-drawn effect, evoking a sense of homemade comfort and simplicity. The background is minimalistic, focusing the viewer's attention on the single piece of cheese rusk, which seems to almost float in space, highlighted by the soft, diffused lighting.

-

 

Prompt가 중요합니다. 이를 파파고의 힘을 빌려 제가 원하는 바에 맞게 수정해보았습니다:

제가 영어를 잘 못 하거든요. 아예 ChatGPT에게 이건 어떻게 고쳐? 이거 수정한 글 써줘! 하는 것도 좋습니다.

 

This image depicts a 'Yellow Cheese Rusk'. The snack appears in a more hand-drawn style with soft colors, more simplified shapes, and effects reminiscent of crayons or pencils. It's like a child drawn it. It's not realistic texture. The yellow cheese rusk is characterized by its soft yellow color, cubed shape, and a texture that suggests a crispy yet slightly airy feel. The overall aesthetic is warm and inviting, with a playful touch that comes from the hand-drawn effect, evoking a sense of homemade comfort and simplicity. The background is minimalistic, focusing the viewer's attention on the single piece of cheese rusk, which seems to almost float in space, highlighted by the soft, diffused lighting.

 

배경은 당장 신경쓰지 않아도 될 것 같아서 그냥 Prompt에서 삭제했습니다.

이제 다시 DALL-E에게 부탁해봅니다. DALL-E의 Prompt에서 약간의 수정만 하여 다시 사용했습니다.

 

-

You:

Seed 번호 3919956741 사용해줘.

아래 프롬프트 임의로 변경하지 말고 그대로 사용해서 이미지 생성해줘.

This image depicts a 'Yellow Cheese Rusk'. The snack appears in a more hand-drawn style with soft colors, more simplified shapes, and effects reminiscent of crayons or pencils. It's like a child drawn it. It's not realistic texture. The yellow cheese rusk is characterized by its soft yellow color, cubed shape, and a texture that suggests a crispy. The overall aesthetic is warm and inviting, with a playful touch that comes from the hand-drawn effect, evoking a sense of homemade comfort and simplicity.

 

DALL-E:

Seed: 3919956741

Prompt: This image depicts a 'Yellow Cheese Rusk'. The snack appears in a more hand-drawn style with soft colors, more simplified shapes, and effects reminiscent of crayons or pencils, as if a child drew it. It lacks realistic texture. The yellow cheese rusk is characterized by its soft yellow color, cubed shape, and a texture that suggests crispiness. The overall aesthetic is warm and inviting, with a playful touch that comes from the hand-drawn effect, evoking a sense of homemade comfort and simplicity. The cheese rusk is designed to convey a sense of whimsy and charm, with an emphasis on the joy of simple pleasures. The background is minimalistic, drawing the viewer's attention directly to the cheese rusk.

-

 

Seed 번호를 지정하여 사용해 달라고 하면, 비슷한 화풍으로 나올 확률이 높아집니다.

프롬프트를 임의로 변경하지 말라고 하면, ChatGPT가 본인의 상상력을 더할 확률이 낮아집니다.

 

아까보다는 확실히 더 수세미보다 황치즈러스크가 되었긴 한데, 아무래도 동화에 넣을 그림치고 너무 사실적인 것 같습니다. 아이가 크레용으로 그린 것 처럼 그려달라고 했는데, 아이가 너무 잘 그렸네요. 다른 방법을 생각해봤습니다. 저는 제가 원하는 그림을 인터넷으로 찾아봤습니다.

당고 가족

 

어릴 때 유튜브 영상으로 봤던 어떤 애니메이션의 OST 영상입니다. 이정도로 단순한 그림이면 좋겠다 싶었습니다. 아이같은 그림을 원하는데, 현재는 너무 미술 좀 하시는 분이 그린 사실주의 그림 같아요. Prompt에 It lacks realistic texture가 들어가도 이정도라니. 일단 다시 DALL-E에게 부탁해봅니다.

 

-

You:

Redraw the yellow cheese rusk in this style.

 

DALL-E:

Seed: 715993647

Prompt: Redraw the yellow cheese rusk in the style of the uploaded image, which features a simplistic, calming, and heartwarming aesthetic reminiscent of a children's book. The cheese rusk should appear as a cute, rounded character in soft pastel colors, with simplified features such as two small eyes and a gentle smile. The background should be a warm, softly textured gradient from tender yellow to delicate cream, evoking a sense of gentle calmness and simplicity. The overall mood is serene and inviting, with the cheese rusk character placed in a minimalistic setting, possibly sitting or standing in a content and peaceful pose, sharing the same space as a tiny, symbolic plant or object that adds to the narrative of growth, new beginnings, or comfort.

-

 

뭔가 의도와 다른 그림이 한 장 그려지더니, 다시 황치즈러스크로 보이는 것을 그려줬습니다.

귀여워지긴 했는데 더이상 정육면체가 아니라는 점이 아쉽습니다. 이정도면 러스크가 아니라 아예 치즈 조각 아닌가요?

 

Seed 번호도 바뀌었습니다. 아무래도 그림체가 굉장히 달라지다 보니 그런 것 같습니다. 이럴 때는 바뀐 Seed 번호를 사용하는 게 나을 수 있습니다. 다시 DALL-E의 Prompt를 확인해봅니다.

 

Redraw the yellow cheese rusk in the style of the uploaded image, which features a simplistic, calming, and heartwarming aesthetic reminiscent of a children's book. The cheese rusk should appear as a cute, rounded character in soft pastel colors, with simplified features such as two small eyes and a gentle smile.

 

뒷배경은 중요하지 않으니 그냥 써도 될 것 같습니다.

The background should be a warm, softly textured gradient from tender yellow to delicate cream, evoking a sense of gentle calmness and simplicity. The overall mood is serene and inviting, with the cheese rusk character placed in a minimalistic setting, possibly sitting or standing in a content and peaceful pose, sharing the same space as a tiny, symbolic plant or object that adds to the narrative of growth, new beginnings, or comfort.

 

개인적으로 뭔가 찜찜한 부분이 있어, 이 부분을 다시 파파고의 힘을 빌려 다시 작성했습니다.

 

적어도 바삭한 정육면체는 되어야 원래 과자 형태와 비슷할 것 같은데, 영 못 알아들어서 재생성 버튼만 10번 눌렀습니다. 그 과자의 형태는 cube도 해보고 3-cube도 해보고 regular hexahedron도 해 봤는데 영 감을 못 잡더군요. 운에 맡기고 재생성 눌렀습니다. 10번째 만에 뭔가 나오더군요.

 

가끔 이상할정도로 못 알아듣는 경우가 있습니다.

나중에 들은 바로는, DALL-E에게 참고할 이미지를 다시 업로드해주는게 좋다고 합니다.

 

겸사겸사 초코칩 쿠키도 추가해 봤습니다.

 

-

You:

Seed 번호 715993647 사용해줘.

This image seems to have been drawn by a child in a sketchbook with crayon. The cheese rusk should appear as a cute, crispy, cube snack character in soft pastel colors, with simplified features such as two small eyes and a gentle smile. And the chocolate chip cookie should appear as a cute, rounded character in soft pastel colors, with simplified features such as two small eyes and a gentle smile, similar to the cheese rusk. The background remains a warm, softly textured gradient from tender yellow to delicate cream, evoking a sense of gentle calmness and simplicity. The overall mood is serene and inviting, with both characters placed in a minimalistic setting, sharing the same space and adding to the narrative of friendship, growth, new beginnings, or comfort.

 

DALL-E:

Seed: 715993647

Prompt: This image seems to have been drawn by a child in a sketchbook with crayon. The scene features two cute characters: a cheese rusk and a chocolate chip cookie. Both characters are designed with soft pastel colors and simplified features, including two small eyes and a gentle smile, embodying a sense of innocence and joy. The cheese rusk is a cute, crispy, cube snack character, while the chocolate chip cookie is a cute, rounded character, similar in style to the cheese rusk. They are placed against a warm, softly textured gradient background that transitions from tender yellow to delicate cream, contributing to a gentle, calming, and simplistic atmosphere. The overall mood is serene and inviting, with both characters in a minimalistic setting that emphasizes their friendship, growth, new beginnings, or comfort.

-

 

그나마 맘에 드는게 나왔습니다.

결국 맘에 드는 결과가 나올 때까지 Prompt를 고치거나, 참고 이미지를 업로드하거나, 재생성을 눌러야 합니다.

 

맘같아서는 redraw를 부탁할 때 업로드 한 '당고 대가족' 그림만큼 더 단순하게 그리면 좋겠지만, 어째선지 계속 3D 애니메이션 캐릭터처럼 바뀌거나 과장스러운 미국 애니메이션 캐릭터처럼 되어서 멈췄습니다. 이럴 때는 스타일에 대해 설명하는 적당한 단어를 찾으면 좋습니다. 아예 2D 애니메이션이라 입력도 해봤는데 그러면 눈만 그렇게 변하더라구요..

 

계속 찾아보면 좋겠지만 개인적인 시간 소모도 굉장하고 GPT4의 메시지 갯수 제한과 DALL-E 이미지 생성 갯수 제한이 마음에 걸려서 이쯤에서 멈췄습니다. 대체 아이들 그림처럼 그려달라고 부탁하는데 아이들이 너무 잘 그리는 거 같아요.

 

겸사겸사 이제 세 번째 캐릭터 '소금빵 크래커'를 추가해보기로 합니다. 그 이전에 '소금빵' + '크래커'라는 것을 ChatGPT가 소설 창작 과정에서 혼자 설정해주긴 했는데, 아무리 생각을 해도 제품명으로는 좋지만 실물로는 그게 어떤 것인지 상상이 잘 안 가서 그냥 '소금 크래커', '솔티드 크래커', '짠 크래커'로 바꿔주었습니다. 와중에 크래커라고 말을 해도 두 겹짜리 샌드 과자가 되기도 해서 한 겹이라는 걸 강조해 봤습니다.

 

-

You:

Seed 번호 715993647 사용해줘.

Painted with the charm of a children's crayon sketch, the image now includes three cute characters: a cheese rusk, a cube, a circular chocolate chip cookie, and a layer of rectangular 'salty cracker.' All the characters are designed with simplified features, including two tiny eyes and a soft smile, such as a soft pastel color and a dot, to promote harmony and enjoyment among snack friends. They are placed against a warm, soft textured gradient background that transitions from a soft yellow to a delicate cream, contributing to a gentle, calm, and simple atmosphere. The overall atmosphere is quiet and charming, and all the characters are in a minimalist environment that emphasizes friendship, growth, new beginnings, or comfort.

 

DALL-E:

Seed: 715993647

Prompt: Painted with the charm of a children's crayon sketch, this image includes three cute characters: a cheese rusk, a chocolate chip cookie, and a salty cracker. Each character, designed in soft pastel colors, embodies the essence of snack friends in harmony. The cheese rusk is a cute, crispy cube, the chocolate chip cookie a joyful circle, and the salty cracker a content rectangular shape. All characters have simplified features, such as tiny eyes and soft smiles, to accentuate their cheerful camaraderie. They are set against a warm, softly textured gradient background, transitioning from soft yellow to delicate cream, which enhances the gentle, calming, and simplistic atmosphere. The scene is quiet and charming, with all characters placed in a minimalist setting that highlights themes of friendship, growth, new beginnings, or comfort.

-

 

다행히 재생성 3번만에 나왔습니다.

 

이제 네 번째 친구인 '매콤한 프레첼'을 추가해봅니다. 근데 '매콤한'과 '프레첼'에서 문제가 생깁니다.

'매콤한'을 소설에서 Spicy라고 글자로 쓸 수는 있어도, 이미지로 보여줄 방법이 뭘까 하다가, 색이 빨간 색인 과자라고 써 주는게 낫겠다, 싶었습니다.

 

'프레첼'은 아주 못알아듣는 것은 아닌데 자잘하게 형태가 계속 바뀌거나 수가 많아지거나 빵이 되었다가 과자가 되었다가 하거나... 이미지 업로드를 몇 번 해 봤는데도 맘에 드는 결과가 나오지 않아 답답했는데, 의외의 해결책이 있었습니다. 프레첼 이모티콘 🥨 을 넣으니 해결이 되더라구요. 똑똑하네요..

 

-

You:

Seed 번호 715993647 사용해줘.

Painted with the charm of a children's crayon sketch, this image includes four cute characters: a cheese rusk, a chocolate chip cookie, a salty cracker and a spicy pretzel. Each character, designed in soft pastel colors, embodies the essence of snack friends in harmony. The cheese rusk is a cute, crispy cube, the chocolate chip cookie a joyful circle, the salty cracker a content rectangular shape, and the spicy pretzel a playful red colored 🥨 shape. All characters have simplified features, such as tiny eyes and soft smiles, to accentuate their cheerful camaraderie. They are set against a warm, softly textured gradient background, transitioning from soft yellow to delicate cream, which enhances the gentle, calming, and simplistic atmosphere. The scene is quiet and charming, with all characters placed in a minimalist setting that highlights themes of friendship, growth, new beginnings, or comfort.

 

DALL-E:

Seed: 715993647

Prompt: Painted with the charm of a children's crayon sketch, this image includes four cute characters: a cheese rusk, a chocolate chip cookie, a salty cracker, and a spicy pretzel. Each character, designed in soft pastel colors, embodies the essence of snack friends in harmony. The cheese rusk is a cute, crispy cube, the chocolate chip cookie a joyful circle, the salty cracker a content rectangular shape, and the spicy pretzel a playful, red-colored pretzel shape. All characters have simplified features, such as tiny eyes and soft smiles, to accentuate their cheerful camaraderie. They are set against a warm, softly textured gradient background, transitioning from soft yellow to delicate cream, which enhances the gentle, calming, and simplistic atmosphere. The scene is quiet and charming, with all characters placed in a minimalist setting that highlights themes of friendship, growth, new beginnings, or comfort.

-

 

그렇게 겨우 네 친구들의 기본 형태를 만드는 데 성공했습니다.

 

여기까지 해 본 결과, 중요한 점을 몇 가지 정리하자면:

1) Seed 번호를 고정하면 비슷한 분위기의 그림으로 고정이 됩니다. 가끔 엇나가기도 합니다.

2) 맘에 들 때까지 합니다 재생성도 계속 누르고, 설명도 이리저리 바꿔보고, 한국어로 설명해보고 영어로 설명해보고, 참고 이미지를 계속 업로드 해보며 이렇게 그려줘 부탁을 해보고..

3) 구체적인 설명도 좋은데, 의외로 DALL-E의 Prompt에는 주관적인 묘사가 많은 것 같습니다.

4) 아예 반대로 New Chat을 켜서 DALL-E가 그린 그림을 업로드하고 이게 맘에 안들고, 저게 맘에 안든다, 식으로 수정 스크립트를 짜 달라고 부탁해도 됩니다. 또는 New Chat을 켜고 이런저런 그림을 업로드하며 평가해달라고 하여 그 평가들을 보는 것도 Prompt 개선에 도움이 됩니다.

5) 미술 용어를 많이 알면 좋을 것 같은데, 초보자에겐 단어 찾는 일도 쉽지가 않습니다. ChatGPT나 주변 사람들에게 계속 물어보고 수정합시다.

 

맘 같아서는 아예 동화를 한 화씩 그려보고 싶은데,

그 작업은 캐릭터에 배경까지 신경쓰다보니 시간이 많이 소모가 되네요 :)...

언젠가 해보는 걸로 하겠습니다..

 

 


관련된 다른 글도 읽어보시길 추천합니다

 

2024.02.05 - [AI] - 10. Midjourney: 다들 한 번 정도 봤을 '그 그림'을 그린 AI

 

10. Midjourney: 다들 한 번 정도 봤을 '그 그림'을 그린 AI

이 그림을 본 적이 있으신가요? 여기 보이는 Théâtre D'opéra Spatial (French for 'Space Opera Theater')는 마치 먼 우주의 이야기를 담은 고전 영화의 한 장면처럼 보입니다. 하지만 이 환상적인 장면은 인간

guguuu.com


읽어주셔서 감사합니다

공감은 힘이 됩니다

 

:)

 

반응형

TOP

Designed by 티스토리