제미니 2.0이 출시되면서 함께 여러가지 AI 에이전트도 소개됐습니다. 제대로 구현되면 활용도도 높고, 파급효과도 클 것으로 예상되는데요.
- 프로젝트 아스타라(Project Astra): AI와 대화하는 프로젝트. 더욱 자연스러워 지고, 구글 검색, 렌즈, 맵스 활용 가능. 빠른 응답 속도와 최대 10분으로 긱력도 좋아짐
- 프로젝트 마리너(Project Mariner): 크롬 확장 프로그램으로 활용해 웹에서 작업을 자동화
- 줄스(Jules): 개발자를 위한 AI Agent, 깃허브와 통합돼 개발자 지시와 감독 하에 이슈를 처리하고, 계획 수립 및 실행
- 게임 에이전트: 화면 동작을 기반으로 게임을 추론하고, 실시간 대화를 통해 다음 행동을 제안
- Deep Research: 온라인 리서치 연구를 대신 수행하고 보고서 작성
이 중에서 저는 프로젝트 마리너와 딥 리서치가 인상적이었습니다. 이 두 가지만 제대로 되도 현재 하는 일의 많은 부분이 줄어든다고 생각합니다. 일정 부분은 제가 하는 일이 AI로 대체될 수 있다는 생각도 드는데요. 이 중 프로젝트 마리너를 더 자세히 알아보았습니다.
프로젝트 마리너는?
프로젝트 마리너는 구글이 최근 공개한 웹 자동화 AI 에이전트 연구 프로젝트입니다. Gemini 2.0을 기반으로 개발되었습니다.
핵심 기능
이 프로젝트는 웹 브라우저에서 하는 다양한 작업의 자동 수행을 목표로 합니다. 특이한 점은 크롬 확장 프로그램을 이용한다는 점인데요. 크롬 확장 프로그램은 누구나 쉽게 사용이 가능하고, 여기서 대화로 원하는 역할을 수행한다면 많은 작업을 자동화할 수 있겠습니다.
홍보 영상은 두 가지가 있는데 하나는 회사 목록을 주고, 이 회사의 이메일 주소를 수집해서 알려달라고 요청하는 내용입니다. 프로젝트 마리너는 회사를 하나씩 구글에서 검색하고, 웹페이지에 방문한 후에 Contact US에 있는 이메일 주소를 수집하는 모습을 보여줍니다. 작업이 끝나면 회사별 이메일 주소를 답변으로 줍니다.
다음은 후기 인상파 그림 중 색체가 다양한 그림을 찾고, Etsy에서 colorful paints를 찾아 장바구니에 넣는 작업입니다. 프로젝트 마리너는 검색을 통해 후기 인상파 화가로 피카소를 선택하고, 그의 그림을 탐색하는 모습을 보여줍니다. 또한 Etsy에서 물품을 검색해서 장바구니에 담는 모습도 보여줍니다. 이후에는 신뢰하고 안전성 있는 동작을 위해 사용자에게 이후 절차를 진행할 지 진행하는 모습도 나옵니다.
영상을 보면 브라우저 화면의 텍스트, 코드, 이미지, 양식 등 다양한 웹 요소들을 종합적으로 이해하고 처리하는 모습을 볼 수 있습니다.
프로젝트 마리너는 WebVoyager 벤치마크에서 83.5%라는 최고 수준의 성능을 기록했습니다. 이는 정보 검색, 양식 작성, 데이터 비교, 웹사이트 탐색 등의 작업 수행 능력을 실제 웹 환경에서 평가한 결과입니다.
현재 상태와 한계
아직은 수행 속도와 정확도 개선이 더 필요한 상태이지만, 기대가 많이 되는 프로젝트입니다. 구매와 같은 중요 작업 전에는 사용자 승인을 반드시 받도록 하고, 위험 요소를 파악하고 해결하기 위한 연구를 수행중이라고 합니다.
사용 방법
프로젝트 마리너는 아직 공개되지 않았습니다. 딥마인드 프로젝트 마리너 사이트에 방문하면 대기자(Waitlist) 신청을 받고 있습니다. 관심 있는 분들은 대기자 신청을 해보세요.
프로젝트 마리너가 웹 브라우징의 미래를 보여줄까요? 많은 일을 웹에서 할 수 있어, 제대로 구현되면 활용가치가 굉장히 크다고 생각합니다. 그리고 지금까지 발전 속도를 생각하면, 텍스트 한 줄로 여러가지 작업을 한 번에 수행하는 모습을 금방 볼 수 있지 않을까도 싶네요. 앞으로 발전 과정을 주목해볼 필요가 있겠습니다.
함께 읽으면 좋은 글
- 25년 필수 AI 도구 20선 총정리, 업무와 일상을 혁신!
- 챗GPT 아트팩트 기능 캔버스 내용 및 사용법
- 클로드3.5 소네트 놀라운 코딩 실력 알아보기: 아티팩트 등
- AI 사용을 돕는 파이썬 패키지, phidata 알아보기
- 챗지피티로 블로그 포스팅 작성하는 방법
- 오징어 게임 2 탑 역할 및 서사, 캐스팅 비하인드 등