아마존 노바 액트(Nova Act): AGI 시대를 향한 첫 번째 에이전트
“웹 브라우저를 대신 조작하는 AI가 나왔다고요?” 그런 소문 들으셨나요? 아마존이 마침내 그 기술을 현실로 끌어냈습니다. 단순한 비서가 아닌, 진짜 사람처럼 클릭하고 예약하고 쇼핑까지 해주는 AI. 그 중심에는 바로 Nova Act가 있습니다.
이번 포스트에서는 아마존의 최신 AI 에이전트 기술 Nova Act가 어떤 의미를 갖는지, 왜 이 기술이 중요한지, 그리고 앞으로 우리 일상에 어떤 변화를 가져올지 진짜 사람의 눈높이에서 풀어볼게요. 뭐랄까… 진짜 미래가 성큼 다가온 느낌이랄까요?
노바 액트란 무엇인가?
‘Nova Act’는 아마존이 야심차게 공개한 범용 AI 에이전트입니다. 단순한 텍스트 생성 수준을 넘어서, 실제로 웹 브라우저를 직접 조작하며 사용자를 대신해 예약, 쇼핑, 검색 등의 행위를 할 수 있는 기술이죠. 아마존이 새로 설립한 샌프란시스코 AGI 연구소에서 개발되었고, 이번에 ‘리서치 프리뷰’라는 이름으로 첫 선을 보였습니다.
기술적으로는 아직 완전한 자율 에이전트는 아니지만, 간단한 웹 조작을 자동화할 수 있다는 점에서 주목받고 있어요. 예를 들어, Sweetgreen에서 샐러드를 주문하거나 레스토랑 예약을 AI가 혼자 처리한다면? 그게 바로 Nova Act가 할 수 있는 일입니다.
OpenAI, Anthropic과의 성능 비교
Nova Act는 성능 면에서도 강력한 경쟁력을 자랑합니다. 아마존 내부 테스트 결과에 따르면, Nova Act는 OpenAI의 CUA와 Anthropic의 Claude 3.7 Sonnet보다 높은 점수를 기록했어요. 특히 화면 내 텍스트 조작 성능을 평가하는 ScreenSpot Web Text 항목에서는 94%라는 점수를 얻으며 88%와 90%를 기록한 경쟁사를 앞질렀죠.
AI 에이전트 | ScreenSpot Web Text 점수 |
---|---|
Amazon Nova Act | 94% |
OpenAI CUA | 88% |
Anthropic Claude 3.7 Sonnet | 90% |
Nova Act SDK의 개발 활용도
아마존은 이번에 Nova Act와 함께 SDK(소프트웨어 개발 키트)도 함께 공개했어요. 개발자들은 nova.amazon.com에서 도구를 내려받아 자신만의 에이전트를 직접 만들어볼 수 있습니다. 이 SDK를 활용하면, 에이전트가 웹페이지를 탐색하고, 양식을 작성하거나 캘린더에서 날짜를 고르는 등의 기능을 설정할 수 있어요.
- 웹 내비게이션 자동화
- 사용자 입력 처리
- 조건부 인간 개입 설정
Alexa+에 통합되는 Nova Act
Alexa+, 들어보셨나요? 아마존의 차세대 음성 비서 서비스인데요, 이 Alexa+의 핵심 기능 중 하나가 바로 Nova Act를 기반으로 한다는 사실! 이번에 출시된 Nova Act는 완전한 형태의 제품은 아니고 연구용 프리뷰지만, Alexa+에서는 훨씬 더 세련된 형태로 등장할 예정입니다. 아마존은 음성 명령과 에이전트 기술을 결합해 사용자 경험을 극대화하려는 목표를 가지고 있어요.
Alexa+가 성공하면, 단순히 음악 재생이나 날씨 확인을 넘어, 우리 일상 속 다양한 작업을 AI가 알아서 처리해주는 시대가 성큼 다가올 거예요. 진짜 ‘말로 조작하는 브라우저’, 드디어 현실화되는 셈이죠.
AI 에이전트 벤치마크의 현실
물론 아직 갈 길은 멀어요. Amazon은 자사 기준으로 Nova Act가 경쟁 제품보다 성능이 낫다고 밝혔지만, 외부에서 널리 사용하는 WebVoyager 같은 표준 벤치마크는 포함되지 않았거든요. 그래서 “진짜 잘하냐?”는 질문에는 조금 더 기다려봐야 할 듯합니다.
벤치마크 | Nova Act 지원 여부 |
---|---|
ScreenSpot Web Text | ✅ 지원 |
WebVoyager | ❌ 미지원 |
AGI로 가는 첫걸음인가?
이쯤 되면 이런 생각이 들어요. “그냥 샐러드 주문하는 AI가 AGI랑 무슨 상관이야?” 하지만 David Luan은 AGI란 결국 ‘사람처럼 컴퓨터로 할 수 있는 모든 일을 대행하는 시스템’이라고 정의하더라고요. 그런 점에서 Nova Act는 AGI의 진입로일 수도 있습니다.
- 사용자 대신 웹 환경에서 직접 조작
- 정해진 조건 하에서 인간 개입 요청
- 구체적인 작업 단위별 오토메이션 가능
- 다양한 작업을 통합하는 멀티태스킹 능력
FAQ
현재는 개발자용 리서치 프리뷰 형태로만 제공되며, 일반 사용자는 직접 체험하기 어렵습니다. 하지만 곧 Alexa+에 통합될 예정이니 기대해도 좋아요!
기존 Alexa는 음성 기반 명령 수행에 집중했지만, Nova Act는 브라우저를 조작하고 웹 상에서 복합적인 작업을 스스로 수행하는 에이전트 기능을 갖췄습니다.
아마존 AGI 연구소에서 개발되었으며, 여러 Nova 계열의 기반 모델들을 활용하고 브라우저 조작을 위한 사용자 행동 시뮬레이션 기술이 핵심입니다.
아마존 내부 테스트에서는 경쟁사보다 높은 성능을 보였지만, 외부 공개된 표준 벤치마크에는 아직 등장하지 않았기 때문에 완전한 평가는 조금 더 시간이 필요합니다.
웹 자동화, 양식 작성, 일정 선택 등 반복적인 작업을 에이전트가 대신하도록 구성할 수 있는 개발자용 도구입니다. 다양한 프로토타입 제작에 적합해요.
그렇다고 볼 수 있습니다. AGI란 결국 사람처럼 컴퓨터를 다루는 AI인데, Nova Act는 그 가능성을 보여주는 실질적인 첫 사례로 평가받고 있어요.
이제 AI가 클릭하고, 예약하고, 알아서 처리해주는 시대가 진짜로 열렸습니다. 아마존의 Nova Act는 단순한 기술을 넘어, 우리 생활 전반에 작지만 강력한 변화를 일으킬 준비를 하고 있어요. 이 글을 통해 Nova Act의 가능성을 엿보셨다면, 앞으로 어떤 에이전트 기반 기술이 등장할지 함께 기대해보는 건 어떨까요? 😊 여러분의 생각도 댓글로 꼭 남겨주세요. 이런 변화, 혼자 보기엔 너무 아깝잖아요!
'IT테크' 카테고리의 다른 글
네이버 넷플릭스 요금제 및 웰컴 쿠폰 받고 4,900원으로 편하게 OTT보자! (0) | 2025.04.08 |
---|---|
퓨리오사AI, 과연 혼자 설 수 있을까? 국내 AI 반도체 생태계의 진짜 현실 (0) | 2025.03.25 |
K-엔비디아? 유발 하라리와 이재명이 던진 AI 시대 국가의 역할 (0) | 2025.03.24 |
퀀텀에어로의 AI 파일럿, KAI를 날다: 하이브마인드의 비상 (0) | 2025.03.23 |
오픈AI, 음성 인식의 새 시대를 열다 (0) | 2025.03.23 |
댓글