요약
- Gemini 앱에 DeepMind가 개발한 새 이미지 편집 모델이 도입됐다. 이 업데이트는 사람이나 반려동물의 정체성을 유지하면서 옷을 바꾸거나 배경을 바꾸는 편집을 가능하게 한다.
- 이미지 블렌딩 기능이 강화되어, 여러 이미지를 조합하거나 여러 단계의 편집을 자연스럽게 이어갈 수 있다. 예를 들어, 방에 가구를 추가하거나 스타일을 오브젝트에 적용하는 “multi-turn editing”과 “mix-up design”도 가능하다.
- 해당 모델은 내부 코드명 ‘Nano Banana’, 공식 명칭으로는 Gemini 2.5 Flash Image라 불리며, AI Studio 및 API에서 이용 가능하다. 합리적인 가격(약 $0.039/이미지)으로 제공된다.
- Google은 LMArena 벤치마크에서 최고 성능을 기록했다고 강조하며, 업계 최고 수준의 이미지 편집 모델임을 내세우고 있다.
- 합성 이미지에는 눈에 보이는 워터마크와 숨겨진 SynthID 디지털 워터마크가 적용되어, “AI로 생성된 이미지”라는 사실을 명확히 알린다.
AI 의견
AI의 시각에서 정리해보면, 이번 업데이트는 AI 이미지 편집의 실용성과 정밀함을 한 단계 끌어올린 시도라 볼 수 있다.
- 정체성 유지 기능은 사용자 경험에서 미묘한 감정까지 고려한 디테일, 즉 실사용에서 발생하는 ‘낯설지 않음’을 충족시키는 기능이다.
- 멀티턴 편집과 스타일 믹스업은 단순 보정이 아니라 창작적 상호작용을 가능하게 함으로써, 개발자뿐 아니라 일반 사용자 입장에서도 직관적인 활용이 기대된다.
- LMArena 최고 성능 달성은 벤치마크 뿐 아니라 실전에서 경쟁력이 있다는 신호로 읽힌다.
- 그럼에도 심각한 딥페이크 대응 방안이나 오용 가능성에 대한 보완은 여전히 중요한 숙제로 남아 있다—워터마크 외의 추가적인 책임감 체계가 필요해 보인다.
원문 링크
Image editing in Gemini just got a major upgrade – Google 공식 블로그
추가 참고 자료
'AI 뉴스' 카테고리의 다른 글
| Collective Alignment: 모델 사양에 반영된 '공동 가치' 반영 (0) | 2025.08.29 |
|---|---|
| Genie 3: 텍스트로 ‘걸어 다니는 가상 세계’를 만드는 AI (1) | 2025.08.28 |
| RepoMirror: AI로 강화된 자동 코드 리포지토리 미러링 도구 (1) | 2025.08.28 |
| Advanced Gemini Deep Think, IMO에서 금메달 급 성능 달성 (2) | 2025.08.26 |
| 대규모 언어 모델(LLM), 과연 현실을 이해할 수 있을까? (1) | 2025.08.26 |