요약
- DeepMind의 Gemini 2.5 Deep Think가 2025년 ICPC World Finals에서 골드 메달 수준 성능을 보여줬다.
- 대회는 아제르바이잔 바쿠에서, 5시간 동안 12문제를 푸는 조건. 참가한 대학 팀은 139개.
- Gemini는 첫 45분 안에 8문제를 풀고, 총 5시간 안에 10문제를 맞추었으며, 문제 하나는 인간 참가자들이 전혀 풀지 못한 C번 문제.
- 만약 인간 팀들과 순위 비교했을 때, Gemini는 전체 2위에 해당하는 성적.
AI 의견
AI 관점에서 보면, 이번 성과는 꽤 의미 있는 진전이다:
- 경쟁 프로그래밍 대회는 난이도, 시간제한, 추론력, 창의성, 알고리즘 이해 등이 모두 요구되는데, Gemini가 이런 복합 요소들을 잘 다룬다는 증거가 된다.
- ‘문제 하나를 인간이 못 푼 걸 AI가 풀었다’는 점은 단순 반복 학습 아니고, 새로운 해결 방안(exploration)이나 전략적 사고(strategic reasoning)가 포함됐다는 가능성을 보여준다.
- 다만 “실제 소프트웨어 개발” 환경에서는 이런 대회 문제가 현실 조건(디버깅, 코드 유지보수, 협업, 외부 라이브러리 제약 등)과는 꽤 다르기 때문에, 여기서 얻은 기술을 바로 프로덕션에 적용 가능한지는 추가 검증이 필요하다.
- 또한 이런 AI 시스템이 얼마나 자원(계산량, 메모리, 비용)을 쓰는지, 그리고 실패하는 문제 유형은 어떤 것들이었는지 파악하는 게 다음 과제다.
원문 링크
- DeepMind 공식 블로그: https://deepmind.google/discover/blog/gemini-achieves-gold-level-performance-at-the-international-collegiate-programming-contest-world-finals/
추가 참고 자료
- FT: “Google DeepMind and OpenAI achieve gold at ‘coding Olympics’ in AI milestone” — 인간 팀과 비교한 세부 성과 및 의미 분석 Financial Times
- The Guardian: “Google DeepMind claims ‘historic’ AI breakthrough …” — Gemini의 문제 해결 전략 및 반응 중심 보도 가디언
'AI 뉴스' 카테고리의 다른 글
| Codex 업그레이드 발표 — GPT-5-Codex 등장 (0) | 2025.09.20 |
|---|---|
| 사람들이 ChatGPT를 어떻게 쓰고 있는가 (0) | 2025.09.20 |
| AI로 경제 기회를 넓힌다 — OpenAI의 새로운 전략 (1) | 2025.09.08 |
| 왜 언어 모델은 ‘환각(hallucination)’을 일으키는 걸까? (0) | 2025.09.07 |
| 생성 AI로 화학 반응 예측 정밀도 높인다 (0) | 2025.09.07 |