High-Flyer Capital Management가 지원하는 중국 AI 연구소인 DeepSeek은 최신 추론 모델인 DeepSeek-R1과 DeepSeek-R1-Zero를 공개하며 업계에 새로운 바람을 일으키고 있다.
DeepSeek-R1은 플래그십 모델로서, 완전히 오픈 소스로 MIT 라이선스로 배포되어 개발자들의 자유로운 활용을 보장한다. 개발자들은 chat.deepseek.com에서 이 모델과 API에 접근하여 다양한 애플리케이션에 활용할 수 있다. NVIDIA의 시니어 리서치 매니저 짐 판은 DeepSeek의 오픈 소스 철학을 높이 평가하며, "진정한 개방성과 프런티어 연구의 가치를 실현하고 있다"고 말했다.
DeepSeek은 기술 보고서와 함께 6개의 증류된 모델을 선보였는데, 이는 효율성과 성능을 최적화한 결과물이다. 이 모델들은 OpenAI의 o1-mini와 유사한 성능을 보이며, 특히 수학적 문제, 코드 생성, 추론 분야에서 두각을 나타낸다.
DeepSeek-R1의 핵심은 후처리 단계에서 대규모 강화 학습을 활용한다는 점이다. 이 모델은 최소한의 레이블링된 데이터에 의존하면서도 높은 정확도를 달성하여, 데이터 가용성에 대한 부담을 줄였다. DeepSeek 팀은 "우리는 LLMs의 잠재력을 탐구하며, 감독 데이터 없이도 순수한 강화 학습을 통해 추론 능력을 개발할 수 있음을 보여준다"고 전했다.
DeepSeek-R1-Zero는 이러한 강화 학습의 원칙을 바탕으로 구축되어, 자율적인 추론 능력 개발이 가능하다. 초기 평가에서 AIME 2024 벤치마크에서 71%의 통과율을 달성하며 유의미한 성과를 보였다. 그러나 가독성 문제와 언어 혼합과 같은 개선점이 발견되어, DeepSeek은 후속 모델 개발에 주력했다.
DeepSeek은 다단계 훈련 접근법을 도입한 DeepSeek-R1을 통해 추론 능력을 개선하고 가독성을 유지하는 데 성공했다. 이 모델은 다양한 추론 과제에서 OpenAI의 o1-1217과 비슷한 성능을 보이며, AIME 2024 벤치마크에서 79.8%의 Pass@1 점수를 달성했다.
업계 반응은 뜨겁다. Wingify의 창업자 파라스 초프라는 "DeepSeek의 오픈 소스 모델은 업계 표준을 재정립하고 있다"고 말했고, Abacus AI의 빈두 레디는 "DeepSeek R1의 개방성과 투명성에 감탄한다"며 중국 AI 기술의 잠재력을 높이 평가했다.
최근 DeepSeek-V3의 성공적인 출시 이후, DeepSeek은 또 한 번 AI 업계에 파장을 일으키고 있다. KissanAI의 창업자 프라크 데사이는 "DeepSeek의 행보는 고래🐋로 불리는 거대 기업들에도 큰 영향을 미칠 것"이라며 존경을 표했다.
한편, OpenAI는 o3 모델의 논란에도 불구하고 새로운 o3 mini 모델을 곧 출시할 계획이다. 인도는 최첨단 미국 AI 칩에 대한 접근 권한을 받지 못했지만, MLDS 2025 콘퍼런스를 통해 AI 분야의 발전을 이어가고자 한다.
최신 AI 기술 개발을 둘러싼 업계의 치열한 경쟁과 혁신은 앞으로도 지속될 전망이다.