구글이 AI 분야의 혁신을 이어가며 실험적인 AI 추론 모델인 "Gemini 2.0 Flash Thinking Experimental"을 선보였다. 이 모델은 구글의 AI Studio 플랫폼에서 사용할 수 있으며, 프로그래밍, 수학, 물리학 등 다양한 모달을 아우르는 작업들을 처리할 수 있도록 설계되었다.
"Gemini 2.0 Flash Thinking Experimental"은 복잡한 문제에 대한 추론 능력과 사고 과정을 설명하는 기능을 갖춘 것이 특징이다. 이는 기존 Gemini 2.0 Flash 모델을 기반으로 하며, OpenAI의 o1과 같은 유사한 모델들과 비슷한 성능을 보인다.
이 모델의 핵심은 프롬프트를 작은 작업들로 세분화하여 처리하는 구조화된 접근 방식에 있다. 관련 맥락을 분석하고 가장 정확한 응답을 합성함으로써, 사용자의 질문에 대한 논리적인 추론 과정을 거친다.
하지만, 단순한 글자 수 세기 같은 작업에서 오류가 발생할 수 있어, 추론의 일관성에 대한 개선점은 남아있다. 모델은 최대 32,000개의 토큰까지 입력을 받을 수 있으며, 텍스트와 이미지 모두 지원한다. 출력은 텍스트 전용 형식으로 최대 8,000개의 토큰까지 제공된다.
추론 시 계산 시간이 증가함에 따라, 응답 시간은 몇 초에서 몇 분까지 소요될 수 있다. 검색, 코드 실행과 같은 기능은 내장되어 있지 않아 별도의 도구 통합이 필요하며, 응답의 정확도와 완성도는 상황에 따라 다를 수 있다.
구글 딥마인드의 제프 딘 수석 과학자는 이 모델의 설계에 대해 "추론 시 확장된 계산을 활용하여 추론 결과를 향상하는 데 중점을 두었다"라고 설명했다. AI Studio의 로건 킬패트릭 제품 리드는 "이번 출시는 구글이 추론에 초점을 맞춘 AI를 탐구하는 중요한 첫걸음"이라고 언급했다.
AI 분야에서 추론 모델의 중요성이 대두됨에 따라, DeepSeek-R1과 알리바바의 Qwen 등 경쟁사들도 이 분야에 뛰어들고 있다. 이러한 추론 모델들은 생성적 AI 시스템의 정확성과 신뢰성을 향상하기 위한 목적이지만, 높은 계산 비용과 성능 이슈라는 과제를 안고 있다.
개발자들은 Gemini API (v1alpha) 또는 Google GenAI SDK를 통해 이 모델을 활용할 수 있다. 텍스트와 이미지 입력을 지원하며, 투명한 추론 작업 흐름에 초점을 맞추어 다양한 애플리케이션에 통합될 수 있다. 연구 목적으로 출시된 이 모델은 토큰 제한과 내장 도구 부재 등 특정 제약 사항이 있으므로, 개발 시 유의해야 한다.