DALL-E는 GPT-3의 120억 파라미터 버전으로, 텍스트 설명을 사용하여 이미지를 생성하도록 훈련되었습니다. 이는 텍스트-이미지 쌍의 데이터셋을 사용하여 이루어졌으며, 동물과 물체의 인간화된 버전을 생성하고, 관련 없는 개념을 합리적인 방식으로 결합하며, 텍스트를 렌더링하고 기존 이미지에 변형을 적용하는 등 다양한 기능을 제공합니다
최근에는 DALL-E 3이 ChatGPT에 통합되어 GPT-4를 사용하여 텍스트를 생성하게 되었습니다. 이를 통해 사용자는 원하는 주제를 확장하거나 이미지에서 까다로운 것을 설명하도록 요청할 수 있습니다. 이는 세세한 세부 사항으로 들어갈 수 있으며, 이러한 세부 사항을 사용하여 이야기를 생성할 수 있습니다. 또한 이미지 설명을 사용하여 더 정확한 변형을 생성할 수 있습니다.
ChatGPT에 프롬프트를 제공하면, ChatGPT는 DALL-E 3에 대한 맞춤형, 상세한 프롬프트를 자동으로 생성하여 사용자의 아이디어를 생동감 있게 만듭니다. 사용자가 특정 이미지를 좋아하지만 완전하지 않다고 생각하면, 몇 마디만으로 ChatGPT에게 조정을 요청할 수 있습니다.
DALL-E 3는 OpenAI의 DALL-E 2의 발전된 버전으로, DALL-E 2는 더 현실적이고 정확한 이미지를 4배 높은 해상도로 생성합니다. DALL-E 2는 DALL-E 1과 비교했을 때 평가자들에게 선호되는 모델로, 71.7%의 평가자들이 DALL-E 2를 선호했습니다.
또한, DALL-E 3는 ChatGPT Plus와 기본적으로 통합되어 있어, 이를 통해 사용자들은 강력한 AI 이미지 생성 기능을 체험할 수 있습니다.
이러한 정보를 바탕으로, DALL-E와 GPT의 통합은 사용자가 텍스트 기반의 프롬프트를 제공함으로써 원하는 이미지를 생성하고 조정할 수 있는 높은 수준의 유연성을 제공합니다.
이제 실제 사진을 GPT-4에 첨부한 이후에, 해당 이미지를 그리기 위한 프롬프트를 생성해달라고 요청하면 해당 그림을 이용하여 프롬프트를 작성해줍니다.
이후에 해당 프롬프트를 달리 엔진으로 변경 후 요청하면 GPT가 이제 그림도 그려줍니다!
저 같은 경우 저희 집 강아지 사진을 첨부한 이후에 해당 사진을 읽어서 달리에 사용할 프롬프트를 생성해달라고 GPT에게 요청한 이후에, 해당하는 프롬프트를 받아서 달리를 연결하여 바로 아래와 같이 다양한 우리집 강아지 사진을 GPT와 DALL-E를 이용하여 그려보았습니다!
'IT' 카테고리의 다른 글
논리학 관점에서 필수조건과 충분조건의 이해 (2) | 2023.12.19 |
---|---|
MySQL 데이터 삭제 명령어 비교(DROP, TRUNCATE, DELETE의 차이점) (0) | 2023.12.12 |
Springdoc vs. Springfox: 자동 문서화 도구 비교 및 개발 생산성 향상 (0) | 2023.08.22 |
스태프 엔지니어란 무엇인가? (0) | 2023.08.17 |
자바의 원시 타입과 참조 타입: 기능과 성능 비교 (0) | 2023.08.16 |