AI 시대에 갈피 못잡던 구글의 역습

2025-05-24


실리콘밸리에는 묘한 패턴이 하나 있다. 구글이 제법 괜찮은 AI 제품을 내놓아도 사람들은 OpenAI의 ChatGPT와 Anthropic의 Claude 같은 스타트업 서비스들에게만 열광하는 것이다.

특히 구글의 최대 개발자 행사인 구글 I/O를 하루 이틀 앞두고 OpenAI가 시장을 뒤흔들 만한 제품을 발표하며 모든 이목을 집중시키는 일이 반복됐다. OpenAI는 2024년 GPT-4o와 함께 스칼렛 요한슨의 목소리를 흉내내는 전화형 모델을 출시했고, 2023년에는 구글의 Gemini 이전 버전인 Bard 출시 직전에 GPT-4를 선보이며 존재감을 과시했다. 시장은 항상 OpenAI에 열광했고, 구글은 "우리가 최고의 모델을 만들었다"는 옛 명성만 되뇌며 실질적인 반격에는 실패했다.

하지만 이번에는 달랐다. 구글 I/O 직전, OpenAI가 발표한 코딩 어시스턴트 '코덱스(Codex)'는 잠시 주목을 받았고 이후 발표된 조니 아이브의 OpenAI 하드웨어 디자인 총괄 합류 소식도 주목을 받았지만, 정작 새로운 제품은 없었다. 이들은 곧 구글 I/O의 비전에 묻혔다. 



구글은 AI 전쟁에서 누구보다 강력한 무기들을 가지고 있다. 전 세계 검색 시장 점유율 90%를 차지하는 압도적인 검색엔진 구글, 애플과 모바일 생태계를 양분한 안드로이드 OS, 그리고 구글 클라우드, 지메일, 구글맵 같은 킬러 앱들의 독점적 지위까지. 겉보기에는 실행 속도가 느리고, 조직 내에서는 AI를 각 부서가 따로 도입하면서 엉성하게 움직이는 듯 보였지만, 내부에는 충분한 잠재력이 있다.

세계 최고 수준의 리서치 그룹인 딥마인드(DeepMind), GPU 없이도 AI 모델을 훈련하고 서빙할 수 있는 TPU를 10년 전부터 개발해온 하드웨어 역량, 그리고 세계 최고 인재들이 몰려 있는 개발팀과 프로덕트 매니저들까지. 문제는 이 똑똑한 인재들이 제각기 다른 방향으로 일하고 있었고, 조직이 너무 커서 빠르게 움직이지 못했다는 점이다. 창립자들은 현업에서 물러나 있었고, 2019년 CEO로 선임된 순다르 피차이는 뚜렷한 리더십을 보여주지 못했다.

그러나 AI 시대에 뒤처지기 시작하자 공동 창업자 세르게이 브린이 2023년 Gemini 개발팀으로 복귀했다. 그는 딥마인드에게 연구보다 제품 통합에 집중하라고 지시했고, 구글의 모든 제품은 Gemini 통합을 최우선 과제로 삼게 되었다.

이번 구글 I/O 2025에서 구글이 보여준 것은 단순한 제품 발표나 성능 과시가 아니었다. AI 업계 전반을 아우르며 다음 세대를 위한 제품 방향과 가이드라인을 제시했다. 단지 언어 모델의 우수성을 강조하는 것이 아니라, AI가 실제 제품에 통합되었을 때 어떤 모습이 될 지를 다양하게 보여줬다.



1. 일반 사용자를 위한 제품



'제미나이 라이브(Gemini Live)'는 기존 '프로젝트 아스트라(Project Astra)' 모델이 실제 제품에 통합된 버전이다. 스마트폰 카메라, 음성 명령, 웹 검색을 통합한 멀티모달 AI로, 사용자와 자연스럽게 대화하며 현실 세계와 상호작용할 수 있도록 설계됐다. 예를 들어, "저기 보이는 식당 메뉴를 번역해줘"라고 말하면 즉시 카메라로 인식해 번역을 제공하며, 영상을 한 번 촬영해두면 제목과 내용을 기억해 요약까지 해준다. 카메라에 보이는 모든 것에 대해 대화가 가능하며, 집 내부를 촬영한 후 "어떻게 인테리어하면 좋을까?"라고 물어도 실제 조언을 제공한다.

 


<최근 완전히 적용된 AI 개요 부분과 자연어 검색>


검색도 진화했다. 한국에도 적용된 AI 오버뷰(AI Overview)는 검색 결과를 요약 형태로 보여주어 전체적인 내용을 빠르게 파악할 수 있게 하며, 이제는 키워드를 입력하는 방식에서 벗어나 자연어로 대화하듯 검색이 가능하다.

구글 미트(Google Meet)에서는 실시간 번역 기능이 탑재됐다. '프로젝트 스타라인(Project Starline)' 기술이 통합되어 한국어 사용자끼리 대화할 때는 자막을 제공하고, 영미권 사용자와의 대화에서는 자동 번역이 실시간으로 이뤄진다.

또한 쇼핑 기능도 진화하여, 사용자가 옷을 검색하면 자신의 사진을 업로드해 가상으로 착용해볼 수 있는 기능이 추가되었다. (단 해당 기능은 아직 한국에서는 미지원이다.)



2. 창작자들을 위한 도구


이미지나 영상 생성 기술에서도 구글은 강력한 도구들을 선보였다. 사실 Nvidia의 COSMOS 모델처럼 일부 영상 생성 모델은 아직 음성을 제대로 구현하지 못하거나 영상이 뭉개지는 등 기술적 한계가 명확했다. 그러나 구글의 시스템은 애니메이션부터 영화 수준의 영상까지 정교하게 생성해내며, 음성 더빙도 비교적 자연스럽게 처리한다.

Imagen 4는 AI 생성 이미지의 디테일을 혁신적으로 향상시켰으며, 포스터의 텍스트나 그림의 질감까지 정교하게 표현할 수 있다.

Flow는 AI 기반 영화 제작 도구로, 캐릭터나 배경 사진을 업로드하고 텍스트 프롬프트를 입력하면 짧은 영화를 자동으로 생성해준다. 구글이 시연한 "거대한 닭으로 자동차를 날리게 하는 노인" 영상은 아직 어색했지만, 기술의 방향성은 분명히 보여줬다.

Veo 3는 물리 법칙을 이해하는 비디오 생성기로, 더욱 자연스럽고 생동감 있는 애니메이션을 제작할 수 있게 해준다. 데모 영상은 꼭 직접 확인해볼 만하다.


<Veo 3로 만든 영화 장면(데모)>


3. 엔지니어들을 위한 도구


AI 서비스를 가장 빠르게 실현하고 있는 분야는 소프트웨어 엔지니어들을 위한 개발 도구다. 예전에는 모델이 제안한 코드를 자동 완성하거나 문서화를 돕는 수준이었지만, 이제는 개발의 모든 과정을 AI가 대체할 수 있을 정도로 진화했다.

구글이 발표한 'Jules'라는 코딩 에이전트는 종이에 그린 스케치를 완전한 코드나 일러스트로 변환해준다. 변환 과정도 투명하게 보여주며, 이는 개발자들의 작업 방식을 근본적으로 바꿔놓을 가능성이 크다.

또한, 기존의 트랜스포머 아키텍처가 아닌 디퓨전(Diffusion) 방식 기반의 새로운 모델 'Gemini Diffusion'도 공개됐다. 이 모델은 이미지와 영상 생성에서도 최첨단 성능을 보여주며, 텍스트 생성 과정에서도 기존과는 다른 효율성을 제시했다. 모델은 gemini diffusion 모델이 공개되었고, Diffusion 모델은 대부분의 AI 모델(GPT, Claude, DeepSeek 등) 의 모델에서 근간으로 하는 트랜스포머 아키텍처 기반이 아니라 Diffusion 모델을 기반으로 한다. 트랜스포머 아키텍처를 전혀 쓰지 않는 건 아니지만, 텍스트 결과를 생성하는 과정이 다르다. 그렇다면 장점은? 성능은 Gemini 2.0 Flash Lite와 비슷하지만 속도는 5배 이상 빠르다.

에이전트 모델인 '프로젝트 마리너(Project Mariner)'도 API로 통합되어, 다양한 도구와 브라우저에서 자동으로 활용될 수 있다. MCP 프로토콜 기반으로 작동하여 앱 간 데이터 전송이 줄어들고, 속도와 효율성 모두 개선되었다.

새로운 모델 제미나이 디퓨전(Gemini Diffusion)도 공개되었다. 이는 기존 텍스트 기반 AI를 넘어 이미지와 영상 생성에서도 최첨단 성능을 보여준다.



4. 하드웨어와 미래 비전


<다시 나온 구글 글래스 모습 - 맛집 추천과 함께 가는 지도도 함께 보여준다. >


구글은 소프트웨어를 넘어 하드웨어 영역에서도 야심찬 계획을 공개했다. Android XR 안경은 한국의 젠틀몬스터 및 기타 기업들과 협업하여 뛰어난 디자인을 구현했으며, 한동안 사라졌던 구글 글래스도 다시 등장했다.

글래스 사업을 추진했던 구글 X는 과거 수익성과 기술적 한계로 조직이 해체됐지만, 창업자인 세르게이 브린이 직접 챙기던 프로젝트였던 만큼 완전히 폐기되지 않았던 것으로 보인다.

또한, 삼성과 공동 개발 중인 VR 헤드셋 프로젝트 '무한'도 올해 말 출시 예정이다. 삼성의 기술력에 대한 우려가 있지만, 구글과 협업함으로써 제품의 완성도와 혁신성을 높일 수 있을 것으로 기대된다.

I/O 발표에서 구글러들이 착용한 안경 프로토타입은 텍스트, 지도, 사진 정보를 사용자 시야 중앙에 자연스럽게 표시했으며, 실시간 언어 번역 기능도 탑재돼 언어 장벽 없는 미래를 암시했다.




라이브 데모에서 구글러들이 착용한 안경 프로토타입은 텍스트, 지도, 사진을 착용자 시야 중앙에 자연스럽게 표시했다. 실시간 언어 번역 기능도 포함되어 있어, 언어 장벽 없는 미래를 엿볼 수 있었다.



5. 지구를 구하는 사명감까지



요즘 빅테크 기업들의 필수 항목이 된 '소셜 굿(Social Good)' 프로젝트도 빠지지 않았다. 구글은 FireSat이라는 프로젝트를 통해 AI 기반 위성으로 산불을 조기에 탐지하는 기술을 선보였다. 270피트 크기의 작은 화재까지 탐지할 수 있으며, 현재는 한 대의 위성만 궤도에 있지만 향후 위성 군집을 구축할 계획이다.

과거 허리케인 헬렌 당시 의료용품을 배송했던 드론 서비스 'Wing'도 확대될 예정이다. 이는 AI가 사용하는 막대한 에너지에 대한 일종의 '속죄'일 수도 있지만, 기술을 사회적 가치 창출에 활용한다는 점에서 의미가 크다.



다시 선두로

구글이 아직 AI 시장의 절대 강자로 복귀했다고 말하긴 어렵다. 하지만 이번 I/O에서 보여준 전방위적 전략과 제품 비전은 업계에 큰 충격을 주었다. 창작, 개발, 사용자 경험, 하드웨어까지 AI 생태계 전반을 포괄하는 통합된 비전을 선명히 제시했다.

무엇보다 중요한 것은, 구글이 다시 "먼저 움직이는" 회사가 되었다는 사실이다. 더 이상 OpenAI의 발표를 쫓지 않고, 자신들만의 속도와 방향으로 AI의 미래를 그리고 있다. 거인이 다시 깨어났다.




구글의 이번 발표가 담고 있는 비전과 기술, 상반기 AI 업계 주요 흐름과 하반기 전망을 종합하는 AI 트렌드 분석 세미나는 6월 28~29일 열립니다. 관심 있는 분께 사전 등록을 권합니다.







0