구글에서 새로운 생성형 이미지 AI 도구를 공개했습니다. 지난달에 출시한 이매진 2(Imagen 2)를 기반으로 만들었습니다. 생성형 이미지 AI인 달리(DALL-E), 미드저니(Midjourney), 스테이블 디퓨전(Stable Diffusion) 등과 비슷하고, 사용방법도 비슷합니다. 최신의 구글의 생성형 이미지 AI를 알아보도록 하겠습니다.
사용 방법
기존에 출시되어 있는 생성형 이미지 AI들과 비슷하게 만들어졌습니다. 사용자가 원하는 그림을 프롬프트(명령어) 입력 창에 글로 묘사를 하면 이미지를 만들어 줍니다.
시드(Seed) 입력 가능
시드는 AI로 만든 이미지에 부여되는 고유번호인데, 프롬프트에 입력할 때 시드를 함께 입력하면 고유번호와 일치하는 이미지의 그림체를 따라 하거나 이미지에 포함된 개체의 특징을 유지하면서 새로운 이미지를 만들어 냅니다. 시드 기능은 가상 인물 이미지를 생성할 경우 자주 사용이 되는데, 인물의 외형과 그림체를 유지하면서 포즈와 배경, 패션 등의 요소를 바꾸는 것이 가능하기 때문입니다.
계속 진화시키는 중
이미지 FX는 이매진 2를 기반으로 만들어졌는데, 이매진은 구글 딥마인드가 개발한 텍스트-이미지 변환 모델입니다. 이때가 2022년이었는데, 초기 버전인 만큼 문제점이 있었고, 2023년 기능을 개선한 이매진 2를 공개했습니다. 정확도와 품질을 향상해 사실적인 이미지를 만들어 내게 됩니다.
표현 칩(Expressive Chips)
이미지 FX의 프롬프트에 표현 칩을 도입해 사용자에게 다양한 아이디어에 도움을 줄 수 있을 것으로 기대하고 있습니다. 표현 칩은 기존에 출시한 음악 생성 AI인 뮤직 FX(MusicFX)에 도입돼 있는 기능으로 사용자가 입력한 프롬프트에서 중요하다고 판단되는 단어를 강조 표시하고, 강조 표시를 클릭하면 대체할 수 있는 단어를 추천해 줍니다.
프롬프트 창에 실제 사진 같은 인물화(Photoreal Portrait)라는 명령어에서 실제 사진(Photoreal)이 손으로 그린(Hand drawn)으로 대체될 수 있도록 도움을 줍니다. 변형하면 다른 이미지를 생성하게 됩니다.
사용 가능 국가
이미지 FX는 미국, 호주, 뉴질랜드, 케냐에서만 사용이 가능하고, 영어만 지원하고 있습니다. 구글의 AI 챗봇 바드(BARD)에 이미지 생성 기능을 추가했는데, 바드의 이미지 생성 기능도 이매진 2를 기반으로 작동하도록 되어서 이미지 FX와 같은 결과물을 만들어 낼 수 있지만 국내에는 아직 적용되지 않고 있습니다.
이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.
댓글