제미니 2.0이 출시되면서 함께 여러가지 AI 에이전트도 소개됐습니다. 제대로 구현되면 활용도도 높고, 파급효과도 클 것으로 예상되는데요.
이 중에서 저는 프로젝트 마리너와 딥 리서치가 인상적이었습니다. 이 두 가지만 제대로 되도 현재 하는 일의 많은 부분이 줄어든다고 생각합니다. 일정 부분은 제가 하는 일이 AI로 대체될 수 있다는 생각도 드는데요. 이 중 프로젝트 마리너를 더 자세히 알아보았습니다.
프로젝트 마리너는 구글이 최근 공개한 웹 자동화 AI 에이전트 연구 프로젝트입니다. Gemini 2.0을 기반으로 개발되었습니다.
이 프로젝트는 웹 브라우저에서 하는 다양한 작업의 자동 수행을 목표로 합니다. 특이한 점은 크롬 확장 프로그램을 이용한다는 점인데요. 크롬 확장 프로그램은 누구나 쉽게 사용이 가능하고, 여기서 대화로 원하는 역할을 수행한다면 많은 작업을 자동화할 수 있겠습니다.
홍보 영상은 두 가지가 있는데 하나는 회사 목록을 주고, 이 회사의 이메일 주소를 수집해서 알려달라고 요청하는 내용입니다. 프로젝트 마리너는 회사를 하나씩 구글에서 검색하고, 웹페이지에 방문한 후에 Contact US에 있는 이메일 주소를 수집하는 모습을 보여줍니다. 작업이 끝나면 회사별 이메일 주소를 답변으로 줍니다.
다음은 후기 인상파 그림 중 색체가 다양한 그림을 찾고, Etsy에서 colorful paints를 찾아 장바구니에 넣는 작업입니다. 프로젝트 마리너는 검색을 통해 후기 인상파 화가로 피카소를 선택하고, 그의 그림을 탐색하는 모습을 보여줍니다. 또한 Etsy에서 물품을 검색해서 장바구니에 담는 모습도 보여줍니다. 이후에는 신뢰하고 안전성 있는 동작을 위해 사용자에게 이후 절차를 진행할 지 진행하는 모습도 나옵니다.
영상을 보면 브라우저 화면의 텍스트, 코드, 이미지, 양식 등 다양한 웹 요소들을 종합적으로 이해하고 처리하는 모습을 볼 수 있습니다.
프로젝트 마리너는 WebVoyager 벤치마크에서 83.5%라는 최고 수준의 성능을 기록했습니다. 이는 정보 검색, 양식 작성, 데이터 비교, 웹사이트 탐색 등의 작업 수행 능력을 실제 웹 환경에서 평가한 결과입니다.
아직은 수행 속도와 정확도 개선이 더 필요한 상태이지만, 기대가 많이 되는 프로젝트입니다. 구매와 같은 중요 작업 전에는 사용자 승인을 반드시 받도록 하고, 위험 요소를 파악하고 해결하기 위한 연구를 수행중이라고 합니다.
프로젝트 마리너는 아직 공개되지 않았습니다. 딥마인드 프로젝트 마리너 사이트에 방문하면 대기자(Waitlist) 신청을 받고 있습니다. 관심 있는 분들은 대기자 신청을 해보세요.
프로젝트 마리너가 웹 브라우징의 미래를 보여줄까요? 많은 일을 웹에서 할 수 있어, 제대로 구현되면 활용가치가 굉장히 크다고 생각합니다. 그리고 지금까지 발전 속도를 생각하면, 텍스트 한 줄로 여러가지 작업을 한 번에 수행하는 모습을 금방 볼 수 있지 않을까도 싶네요. 앞으로 발전 과정을 주목해볼 필요가 있겠습니다.
함께 읽으면 좋은 글
송대관 가끔은 예상치 못한 이별이 우리 가슴을 더 아프게 합니다. 국민가수 송대관의 갑작스러운 별세 소식은…
윈도우 pyenv 파이썬 버전 관리 파이썬을 쓰다 보면, 다양한 프로젝트에서 여러가지 버전을 사용해야 하는 일이…
파이썬 전역변수 global 파이썬에서 전역변수(global variable)는 프로그램 전체에서 접근 가능한 변수입니다. 전역변수 과다 사용은 프로그램…
제미나이 LLM 기술이 날로 발달하며, 가격도 시간이 흐를수록 저렴해지고 있습니다. DeepSeek는 오픈소스로 PC에 다운로드해 무료로…
파이썬 교육 "파이썬 배우고 싶은데 너무 어려워서 엄두가 안 나요..." 🤔 "코딩 강의는 많은데, 다…
파이썬 실행파일 만들기 파이썬은 뛰어난 가독성과 유연성 덕분에 많은 개발자들이 선호하는 프로그래밍 언어입니다. 종종 배포를…