AI 그림 그릴 때 ‘하이힐’ 프롬프트가 바디샷에 영향을 주는 이유
AI 이미지 생성기를 사용하다 보면, 흥미로운 경험을 하게 됩니다. 특히 인물 그림을 생성할 때, 상반신만 보고 싶었는데도 프롬프트에 특정 단어를 넣는 바람에 예상보다 더 넓은 구도를 보여주는 결과가 나올 때가 있습니다.
대표적인 예로, 상반신 이미지를 원해서 "a woman, upper body portrait, realistic"과 같은 프롬프트를 입력했는데, 여기에 "high heels"라는 단어를 추가하는 순간 AI가 갑자기 전신(풀바디샷)을 출력하는 경우가 있습니다.
왜 이런 일이 생길까?
이 현상은 단순한 오류가 아니라, AI 모델이 "주어진 프롬프트를 가능한 한 모두 보여주려는 경향"을 가지고 있기 때문입니다. 쉽게 말해, AI는 "하이힐"이라는 단어를 이해하고 나면, 그것이 신체의 하단에 위치한 패션 아이템이라는 것을 인식합니다. 그러면 AI는 그것을 그림 안에 표현하려면 발과 다리, 즉 전신이 나와야 한다고 판단합니다.
AI는 전체적인 맥락을 고려하지만, "무엇을 반드시 보여줘야 한다"는 식의 해석을 하기도 합니다. 그래서 ‘하이힐’이란 단어 하나가 그림의 구도 자체를 바꿔버리는 결과로 이어지는 겁니다.
예시 입니다 / 처음 프롬프트는 위 사진이었으나 하이힐을 넣어 버리자 / 인물과 신발을 동시에 표현하기 위해 이런 어려운 동작을 만들어 내기도 합니다.
비슷한 예시들
이와 같은 사례는 하이힐에만 국한되지 않습니다. 다음과 같은 프롬프트 단어도 결과에 큰 영향을 줄 수 있습니다.
- “hat”: 모자를 명확하게 보이게 하기 위해 얼굴 전체와 상반신이 작게 나오는 구도로 변경됨
- “boots”: 하이힐과 마찬가지로 하체가 반드시 필요하므로 풀샷으로 구도가 바뀜
- “long dress”: 드레스의 길이를 보여주기 위해 인물 전체가 작게 그려짐
- “holding a bag”: 가방의 위치나 손의 제스처를 위해 팔과 허리 라인까지 묘사되는 경우 많음
이처럼 어떤 단어를 프롬프트에 넣느냐에 따라, AI는 "그 요소가 제대로 보일 수 있도록 구도를 바꿔서" 이미지를 생성합니다.
AI에게 디테일은 ‘보여줘야 할 대상’
사람은 사진을 찍을 때 일부 요소를 가려도 상상으로 채워넣을 수 있지만, AI는 프롬프트에서 주어진 단어를 “가능하면 시각적으로 전부 포함해야 한다”고 해석합니다. 그래서 어떤 요소를 넣었을 때 그것이 잘 안 보이면, AI는 전체 인물을 작게 그려서라도 다 보여주려고 합니다.
이러한 특성은 특히 스타일 디테일(패션 아이템, 액세서리, 신체 부위, 손동작 등)에 민감하게 작동합니다. 결과적으로 프롬프트에 포함된 단어에 따라 이미지의 구도가 무의식적으로 바뀌는 것입니다.
효과적으로 프롬프트를 조절하려면?
원하는 구도와 구성에 따라, 프롬프트를 세심하게 조절하는 것이 중요합니다. 다음과 같은 방식으로 대응할 수 있습니다.
- 전신이 나오지 않도록 하려면, 하체나 하단부와 관련된 단어는 프롬프트에서 제외한다
- 상반신만 원할 경우에는 “upper body only”, “portrait view”, “shoulder-up” 등을 명확히 넣는다
- 하이힐을 넣고도 전신이 안 나오길 원한다면, “high heels (cropped view)” 또는 “zoomed in view of face with reference to heels”처럼 세부 조건을 추가한다
마무리하며
AI는 아주 똑똑하지만, 여전히 인간처럼 직관적으로 생략하거나 추상적으로 판단하지는 못합니다. 우리가 프롬프트에 넣는 단어 하나하나가, AI에겐 “반드시 시각적으로 보여줘야 하는 지시”가 됩니다.
하이힐, 부츠, 모자, 가방처럼 시각적 위치가 정해진 요소는, AI가 “전체 몸을 보여주지 않으면 표현할 수 없다”고 판단하게 만듭니다. 따라서 AI와 소통할 땐 원하는 결과에 따라 프롬프트 단어의 조합을 신중히 고려해야 합니다.
AI를 다룬다는 건 결국 ‘지시문을 잘 쓰는 기술’입니다. AI의 해석 습관을 이해하면, 더 정밀하고 원하는 이미지를 뽑아낼 수 있습니다.