분류 전체보기 21

Gemini, ICPC World Finals에서 골드급 성능 달성

요약DeepMind의 Gemini 2.5 Deep Think가 2025년 ICPC World Finals에서 골드 메달 수준 성능을 보여줬다. 대회는 아제르바이잔 바쿠에서, 5시간 동안 12문제를 푸는 조건. 참가한 대학 팀은 139개. Gemini는 첫 45분 안에 8문제를 풀고, 총 5시간 안에 10문제를 맞추었으며, 문제 하나는 인간 참가자들이 전혀 풀지 못한 C번 문제. 만약 인간 팀들과 순위 비교했을 때, Gemini는 전체 2위에 해당하는 성적. AI 의견AI 관점에서 보면, 이번 성과는 꽤 의미 있는 진전이다:경쟁 프로그래밍 대회는 난이도, 시간제한, 추론력, 창의성, 알고리즘 이해 등이 모두 요구되는데, Gemini가 이런 복합 요소들을 잘 다룬다는 증거가 된다.‘문제 하나를 인간이 못 푼..

AI 뉴스 2025.09.20

Codex 업그레이드 발표 — GPT-5-Codex 등장

요약OpenAI가 GPT-5-Codex라는, 실제 소프트웨어 엔지니어링 작업(real-world coding)에 최적화된 버전의 GPT-5를 Codex에 적용했음. 이건 단순한 코드 생성뿐 아니라 긴 복잡한 task도 독립적으로 수행 가능하도록 설계됨. OpenAI코드 리뷰(code review) 기능이 강화되어, 배포 전 중요한 버그를 잡아내는 능력이 높아졌다고 함. OpenAI+1Codex는 터미널(CLI), IDE 확장, 웹 환경, GitHub, 심지어 iOS 앱에서도 작동하게 되어 있어서 개발자가 현재 작업 중인 환경 어디서든 쓸 수 있게 되었음. OpenAI+1이전에는 Codex CLI와 Codex Web이 따로따로였는데, 이번에 ChatGPT 계정 연동 + 작업 컨텍스트(context)를 잃지..

AI 뉴스 2025.09.20

사람들이 ChatGPT를 어떻게 쓰고 있는가

요약OpenAI + Harvard + NBER 연구팀이 소비자용 ChatGPT 사용을 분석한 가장 큰 규모의 연구 결과가 공개됨:성별 격차(gender gap)가 많이 줄었고, 사용자층이 초기 얼리어답터에서 일반 성인 인구 쪽으로 확장됨.사용 국가도 고소득국(high-income) 중심에서 중저소득국(low-middle income)으로 빠르게 성장 중임.사용자 대화(conversation)의 주된 목적은 “일상 작업 수행(practical tasks)”-정보 찾기, 조언 구하기, 글쓰기 등이며, 코드 작성이나 자기 표현은 비교적 작은 비중임.대화 유형을 Asking / Doing / Expressing 으로 나눴는데, Asking이 약 49%, Doing이 40% (이 중 일(work) 관련 비중도 있..

AI 뉴스 2025.09.20

AI로 경제 기회를 넓힌다 — OpenAI의 새로운 전략

요약OpenAI는 AI를 통해 보다 많은 사람에게 **경제적 기회(economic opportunity)**를 제공하는 목표를 발표했습니다. 주요 내용은 다음과 같습니다:AI가 기업의 효율을 높이고, 아이디어를 수익으로 전환할 수 있는 힘을 줄 수 있으며, 아직 존재하지 않는 새로운 일자리도 만들어낼 수 있다는 비전을 제시했습니다.수백만 명의 사용자들이 ChatGPT를 무료로 이용할 수 있도록 해, AI 접근성의 문턱을 낮추고 있습니다.이를 구체화하기 위해 OpenAI Jobs Platform을 개발 중입니다. AI 기술이 있는 구직자와 기업을 매칭하며, 특히 소규모 사업자와 지방정부를 위한 채용 트랙도 마련됩니다.OpenAI Academy 기반의 AI 자격증 프로그램도 출시됩니다. ChatGPT 내 S..

AI 뉴스 2025.09.08

왜 언어 모델은 ‘환각(hallucination)’을 일으키는 걸까?

요약OpenAI는 새 연구를 통해 “언어 모델이 환각을 일으키는 까닭”을 통계적 설계의 한계에서 찾았다고 밝혔습니다. 핵심 요지는 다음과 같아요:환각은 그럴듯해 보이지만 사실이 아닌 답변을 자신 있게 내놓는 현상입니다. 예컨대, 어떤 챗봇에게 특정 인물의 논문 표절 여부 같은 질문을 하면, 틀린 답변을 연달아 여러 개 제시하기도 합니다. 이런 문제가 반복되는 이유는, 평가 기준이 틀린 답변보다 아예 모른다고 답하는 걸 더 낮게 평가하기 때문입니다. 즉, "I don’t know"는 틀림없이 0점이지만, 틀린 답을 내는 것은 가끔 맞을 수도 있으니 점수가 더 높아질 수 있다는 구조죠.이 현상은 "시험 잘 보도록 설계된 시스템(Test-taking models)"이라는 구조적 원인에서 비롯되며, 환각은 통계..

AI 뉴스 2025.09.07

생성 AI로 화학 반응 예측 정밀도 높인다

요약MIT 연구진이 **FlowER (Flow matching for Electron Redistribution)**라는 새로운 생성 AI 시스템을 발표했다. 이 시스템은 화학 반응 모델에 전자의 보존이라는 물리적 제약을 명시적으로 포함해, 더 현실에 가까운 반응 예측을 가능하게 한다.간단히 말하면, “전자 추적이 누락되지 않도록(reaction prediction 시 전자가 추가되거나 사라지지 않도록)” 모델 설계에 반영한 접근이다. 이로 인해 예측의 정확성과 안정성이 크게 향상되었다는 평가다.AI 의견이 접근 방식은 생성 AI 분야에서 물리적 정확성과 신뢰성을 동시에 달성하려는 실험적인 시도로 보여요.전자 보존 조건을 모델에 명시적으로 반영했다는 점이 인상적입니다—단순히 데이터를 외우는 AI가 아니라..

AI 뉴스 2025.09.07

합성 데이터의 두 얼굴—활용의 장단점을 MIT 연구진과 짚어보니

요약MIT의 Kalyan Veeramachaneni 박사가 인터뷰를 통해, 합성 데이터(synthetic data)의 장점과 단점에 대해 직설적으로 설명했어요. 핵심은 다음과 같습니다:장점: 알고리즘으로 생성된 데이터라서 프라이버시 문제 없이 대량 생성이 가능하고, 데이터 수집 비용과 시간을 크게 줄여 실험이나 개발 초기 단계에 유용하다는 점.적용 분야: 특히 소프트웨어 테스트용 데이터, 특정 조건(예: 특정 지역, 제품, 시기 등)의 데이터가 필요한 경우 유연하게 만들 수 있어서 활용도 높음.단점: 지나친 합성 데이터 의존은 실제 환경에서 성능 저하를 초래할 수 있고, 현실 데이터를 제대로 대체하려면 정밀한 검증과 계획이 필수.가이드라인: 보통 전체 데이터 중 합성 데이터 비중은 50% 이하를 권장하며..

AI 뉴스 2025.09.06

AI가 우주의 진동을 더 정밀하게 포착하다 — Deep Loop Shaping 기술 소개

요약DeepMind가 LIGO(중력파 관측소)의 피드백 시스템을 강력하게 개선한 Deep Loop Shaping 기술을 공개했다. 이 AI 기반 방법은 관측 장비의 노이즈를 30~100배 줄여 안정화를 꾀하며, 더 많은 중력파 사건을 세밀하게 탐지할 수 있게 해주는 핵심 요소로 작용한다. 이 기술은 **반복적인 상호작용을 통해 주파수 도메인 기반 강화학습(reinforcement learning)**을 적용한 새로운 제어 방식이다.이 접근은 수십 킬로미터에 달하는 레이저 광의 간섭에 활용되는 LIGO 설치의 미러를 더욱 정확히 조절하게 해, 우주가 만들어내는 미세한 시공간의 파장까지 탐지 가능한 감도를 확보했다. 또한 이 방식은 천문학뿐 아니라 항공우주, 로보틱스, 구조공학 등 다양한 분야의 진동 억제 ..

AI 뉴스 2025.09.06

ChatGPT를 더 도움이 되게 만들기 위한 로드맵

요약OpenAI가 ChatGPT를 사용하는 사람들에게 더 실질적인 도움이 되도록 다음 120일 안에 실행할 계획을 발표했어요. 주요 내용은 다음과 같습니다:전문가 협업 강화정신 건강, 청소년 발달 등 다양한 분야의 전문가 그룹(Expert Council on Well-Being and AI)과 전 세계 의사 네트워크(Global Physician Network)가 모델 개선을 위한 조언을 제공할 예정이에요.민감 상황에 대한 응답 개선실시간 라우터를 도입해, 긴급하거나 민감한 대화는 GPT-5-thinking 같은 ‘reasoning 모델’로 자동 전환해 더 신중하고 의미 있게 대응하려는 전략이에요.청소년 보호 기능 강화조만간 부모-청소년 계정 연동, 연령별 적절한 응답, 기억/채팅 기록 끄기, 위급 상황..

AI 뉴스 2025.09.05

GPT-Realtime: 실전 대응 음성 에이전트 시대 열다

요약OpenAI가 새롭게 **‘gpt-realtime’**이라는 고급 스피치 투 스피치(speech-to-speech) 모델과 **Realtime API의 정식 버전(GA)**을 공개했다.이 API는 이제 원격 MCP 서버 지원, 이미지 입력, SIP 기반 전화 통화 기능을 포함해, 생산 환경(프로덕션)에서 안정적인 음성 에이전트 구축이 가능하다.gpt-realtime 모델은 복잡한 명령 처리, 정확한 도구 호출, 더욱 자연스럽고 표현력 있는 음성 생성에 향상된 성능을 보인다. 예를 들어, 중간에 언어 전환, 알파벳·숫자 혼합 문장 완벽 복창, 감정 조절 음성 톤, 농담 포함 음성 반응 등 디테일한 표현이 가능하다.**’Cedar’와 ‘Marin’**이라는 새로운 음성 옵션도 도입되었으며, 기존 여덟 개..

AI 뉴스 2025.09.01