본문 바로가기

IT

GPT와 DALL-E 통합 텍스트로 이미지를 생성하는 새로운 기능 추가!

728x90
반응형
728x170

DALL-E는 GPT-3의 120억 파라미터 버전으로, 텍스트 설명을 사용하여 이미지를 생성하도록 훈련되었습니다. 이는 텍스트-이미지 쌍의 데이터셋을 사용하여 이루어졌으며, 동물과 물체의 인간화된 버전을 생성하고, 관련 없는 개념을 합리적인 방식으로 결합하며, 텍스트를 렌더링하고 기존 이미지에 변형을 적용하는 등 다양한 기능을 제공합니다

 

최근에는 DALL-E 3이 ChatGPT에 통합되어 GPT-4를 사용하여 텍스트를 생성하게 되었습니다. 이를 통해 사용자는 원하는 주제를 확장하거나 이미지에서 까다로운 것을 설명하도록 요청할 수 있습니다. 이는 세세한 세부 사항으로 들어갈 수 있으며, 이러한 세부 사항을 사용하여 이야기를 생성할 수 있습니다. 또한 이미지 설명을 사용하여 더 정확한 변형을 생성할 수 있습니다.

 

ChatGPT에 프롬프트를 제공하면, ChatGPT는 DALL-E 3에 대한 맞춤형, 상세한 프롬프트를 자동으로 생성하여 사용자의 아이디어를 생동감 있게 만듭니다. 사용자가 특정 이미지를 좋아하지만 완전하지 않다고 생각하면, 몇 마디만으로 ChatGPT에게 조정을 요청할 수 있습니다.

 

DALL-E 3는 OpenAI의 DALL-E 2의 발전된 버전으로, DALL-E 2는 더 현실적이고 정확한 이미지를 4배 높은 해상도로 생성합니다. DALL-E 2는 DALL-E 1과 비교했을 때 평가자들에게 선호되는 모델로, 71.7%의 평가자들이 DALL-E 2를 선호했습니다.

 

또한, DALL-E 3는 ChatGPT Plus와 기본적으로 통합되어 있어, 이를 통해 사용자들은 강력한 AI 이미지 생성 기능을 체험할 수 있습니다.

 

이러한 정보를 바탕으로, DALL-E와 GPT의 통합은 사용자가 텍스트 기반의 프롬프트를 제공함으로써 원하는 이미지를 생성하고 조정할 수 있는 높은 수준의 유연성을 제공합니다.

 

 

이제 실제 사진을 GPT-4에 첨부한 이후에, 해당 이미지를 그리기 위한 프롬프트를 생성해달라고 요청하면 해당 그림을 이용하여 프롬프트를 작성해줍니다.

 

이후에 해당 프롬프트를 달리 엔진으로 변경 후 요청하면 GPT가 이제 그림도 그려줍니다!

 

저 같은 경우 저희 집 강아지 사진을 첨부한 이후에 해당 사진을 읽어서 달리에 사용할 프롬프트를 생성해달라고 GPT에게 요청한 이후에, 해당하는 프롬프트를 받아서 달리를 연결하여 바로 아래와 같이 다양한 우리집 강아지 사진을 GPT와 DALL-E를 이용하여 그려보았습니다!

 

GPT가 그려준 강아지 사진
달리로 그린 강아지 사진
AI가 그린 강아지 사진
진돗개 사진
귀여운 진돗개 사진
AI가 그린 강아지 그림
AI로 생성한 강아지 사진
GPT가 그린 강아지 사진

728x90
반응형
그리드형