OpenAI는 AI 분야에서 또 다른 혁신적인 발걸음을 내디뎠다. 지난 목요일, OpenAI는 AI 에이전트인 Operator를 공개했다. 놀랍게도, Operator는 인간처럼 컴퓨터를 사용할 수 있다. 심지어 커서 및 키보드를 사용하여 그래픽 사용자 인터페이스(GUI)와 상호작용할 수 있다. OpenAI는 블로그 포스트를 통해 Operator가 컴퓨터 화면의 스크린샷을 해석하고, 버튼, 메뉴, 텍스트 필드 등 화면상의 요소를 인식하여 사용자의 요청에 따라 다양한 작업을 수행할 수 있다고 설명했다.
Operator는 브라우저를 통해 장보기, 예약, 이벤트 티켓 구매와 같은 다양한 작업을 수행할 수 있다. 그러나 OpenAI는 구매, 금융 거래, 이메일 전송과 같은 민감한 거래는 사용자의 승인이 필요하다고 강조했다.
OpenAI는 이번 출시가 ChatGPT의 능력을 질문 답변에서 사용자를 대신한 행동으로 확장하는 중요한 단계라고 밝혔다. 하지만, OpenAI는 타사 웹사이트의 악의적인 지시에 대한 잠재적인 위험을 경고했다. 이는 모델이 오도되거나 유해한 작업을 수행할 가능성을 내포한다. 또한, ChatGPT의 실수로 인해 되돌리기가 어려울 수 있다고 덧붙였다.
Operator는 지도학습과 강화학습을 통해 개발되었다. 지도학습은 Operator가 컴퓨터 화면을 읽고 정확하게 클릭하는 방법을 가르치는 데 사용되었고, 강화학습은 모델의 추론과 오류 수정 능력을 향상시키는 데 활용되었다.
Operator는 우선적으로 ChatGPT Pro 사용자에게 제공될 예정이다.
OpenAI의 경쟁사인 Anthropic과 Google도 AI 에이전트 개발에 박차를 가하고 있다. Anthropic은 Claude 3.5 Sonnet의 컴퓨터 사용 기능을, Google은 Project Mariner라는 웹 브라우징 AI 에이전트를 각각 발표했다. 하지만, 그들은 이러한 기능이 여전히 개발 중이며, 때로는 번거롭고 오류 가능성이 높다고 경고했다.
마이크로소프트는 OpenAI의 AI 모델을 위한 클라우드 독점권을 포기하고, 대신 Azure에서 OpenAI의 AI 작업부하를 호스팅할 수 있는 우선권을 가질 예정이다. 이는 마이크로소프트가 2019년 OpenAI에 10억 달러를 투자하여 독점 클라우드 제공업체가 된 이후 변화된 사항이다. 그 후, 마이크로소프트는 OpenAI에 총 140억 달러를 투자한 것으로 알려졌다.
마이크로소프트는 OpenAI의 애플리케이션 프로그래밍 인터페이스(API)에 대한 독점권을 유지할 예정이다. API는 소프트웨어 애플리케이션 간의 통신 규칙과 도구로, 기업들이 OpenAI의 AI 모델을 자사 애플리케이션에 통합하는 데 필수적이다.
OpenAI는 Microsoft와 함께 새로운 AI 인프라 프로젝트인 Stargate를 발표했다. Stargate는 AI 인프라 구축에 대규모 투자를 계획하고 있다. 여기에는 AI 데이터 센터 건설이 포함된다.
Google은 AI 기반 오디오 포드캐스트인 Daily Listen을 선보였다. Daily Listen은 AI 호스트들이 사용자의 관심사에 따라 매일 업데이트를 제공하는 서비스로, AI 기술의 발전을 보여준다.
Microsoft는 MaterialGen이라는 AI 모델을 통해 특정 특성을 가진 인조 물질을 빠르게 생성할 수 있다고 발표했다. 이는 배터리, 자석, 반도체와 같은 기술 분야에 혁신을 가져올 잠재력이 있다. 또한, MaterialGen은 친환경 물질을 생성하여 지속 가능성 문제를 해결하는 데 기여할 수 있다.