Google과 Microsoft는 각각 멀티모달 AI와 AI 에이전트를 중심으로 한 기술 혁신을 발표하며, AI가 일상과 개발 환경 전반에 깊숙이 통합되고 있음을 강조했는데요. 이번 뉴스레터에서는 두 컨퍼런스의 주요 업데이트와 이러한 업데이트된 기술이 기업에 미치는 영향까지 함께 살펴보겠습니다.
지난 5월 19일 Microsoft Build 2025가, 이어서 5월 20일 미국 마운틴뷰에서 Google I/O가 개최되었습니다. 이 연례 컨퍼런스들은 최신 기술과 제품 업데이트를 소개하는 자리로, 올해도 역시 'AI' 분야가 가장 큰 주목을 받으며 혁신적인 업데이트들이 공개되었는데요.
Google은 이번 컨퍼런스에서 한층 발전된 멀티모달 AI 모델과 서비스를 선보이며, AI가 가져올 일상과 업무 환경의 변화를 제시했고, Microsoft는 AI 에이전트의 중요성을 강조하며 개발자를 위한 코딩 에이전트를 소개하며, AI가 개발 프로세스 전반에 깊이 통합되고 있음을 보여주었습니다.
이번 슈퍼브 인사이트 뉴스레터에서는 Google I/O와 Microsoft Build 2025에서 발표된 주요 AI 기술과 트렌드를 살펴보고, 이러한 변화가 AI 업계와 기업의 비즈니스 환경에 어떤 의미를 지니고 있는지 함께 짚어보고자 합니다. 그럼, 본격적으로 슈퍼브 인사이트 뉴스레터를 시작해 볼까요? 🚀
실리콘밸리의 IT 대기업들은 연례 컨퍼런스에서 새로운 기술을 선보이기 위해 1년을 기다려왔습니다. 하지만 기술 발전 속도가 하루가 다르게 빨라지는 요즘, 이들은 정해진 시기에 구애받지 않고 새로운 모델과 기술을 수시로 발표하는 방식으로 전환하고 있는데요. 특히 Google은 과거 I/O 컨퍼런스 전까지는 새로운 기술 발표를 하지 않는 것이 관례였지만, 이제는 시기에 얽매이지 않고 새로운 업데이트 소식을 전하고 있습니다. 이처럼 지속적으로 기술 업데이트를 발표해왔음에도, 이번 컨퍼런스에서도 주목할 만한 새로운 소식들이 많았는데요. 함께 자세히 살펴볼까요?
① Google I/O 2025: Gemini 중심의 멀티모달 AI 통합 전략
Google의 차세대 AI 모델인 Gemini 2.5 Pro와 Flash가 주목을 받았습니다. Gemini 2.5 Pro는 복잡한 문제 해결을 위한 'Deep Think' 모드를 도입하여 향상된 추론 능력을 제공합니다. 또한, Gemini Live는 실시간 카메라와 음성 데이터를 활용하여 사용자의 요청을 보다 정확하게 처리할 수 있게 되었죠. 또한 AI 기반의 콘텐츠 제작 도구, 코딩 및 개발 지원 도구들도 많은 업데이트를 발표했습니다.
Veo 3는 텍스트나 이미지 프롬프트를 기반으로 고품질의 영상과 동기화된 오디오를 생성하는 도구로, 콘텐츠 제작의 접근성을 높입니다.
Imagen 4는 향상된 디테일과 타이포그래피를 제공하는 텍스트-이미지 생성 모델로, 고품질 2K 이미지 생성에 특화되어 다양한 스타일의 이미지를 생성할 수 있습니다.
Flow는 영화 수준의 콘텐츠 제작을 쉽게 할 수 있도록 지원합니다. 위의 Veo3, Imagen 4 그리고 Gemini까지 통합하여 단순한 일상 자연어 프롬프트로 영화적인 영상을 만들 수 있는 것인데요. 생성형 AI에서 놀라운 퀄리티를 보여줬던 Google의 모델들이 극강의 시너지를 발휘하는것을 볼 수 있었습니다. Flow는 스토리텔링 중심의 영상 제작을 지원하는 플랫폼으로서 창의적인 콘텐츠 제작을 촉진합니다.
Lyria RealTime은 실시간 음악 생성 모델로, 장르, 악기, 오디오 품질에 대한 세밀한 제어를 지원하여 인터랙티브한 음악 제작이 가능합니다.
GitHub Copilot이 코드 리뷰, 수정, 자동화를 지원합니다. 단순한 코드 보조 도구를 넘어, 개발자와 함께 작업을 수행하는 자율적인 코딩 에이전트로 진화하고 있는데요. 개발자들의 코딩을 도와주는 다양한 AI 에이전트가 널리 사용되면서, 가장 친숙하게 사용되는 github의 copilot이 얼마나 정확하게 코딩 작업을 지원할지 많은 기대를 받았습니다.
Agent2Agent(A2A)와 Anthropic의 Model Context Protocol(MCP)가 멀티 에이전트 환경에서 원활히 작동할 수 있도록 합니다.
Microsoft 365 Copilot Studio에서는 다중 에이전트 오케스트레이션 기능이 도입되어, 다양한 에이전트들이 협업하여 복잡한 업무를 처리할 수 있게 되었습니다 . 이는 기업의 업무 자동화와 효율성 향상에 큰 기여를 할 것으로 기대됩니다.
에이전트 기능을 Windows와 엣지 환경으로 확대:
Windows AI Foundry는 디바이스에서 바로 실행 가능한 AI 에이전트를 지원합니다. Windows AI Foundry를 통해 엣지 디바이스에서도 AI 기능을 활용할 수 있는 기반을 마련하고 있습니다.
NLWeb이라는 새로운 오픈 프로젝트가 시작되었습니다: 클라우드 의존 없이 웹사이트에 맞춤형 AI 에이전트를 통합할 수 있는 프로토콜이라고 하는데요. 사용자가 선택한 모델과 자체 데이터를 사용하여 대화형 인터페이스를 쉽게 제공할 수 있도록 지원하여 웹사이트에 풍부한 자연어 인터페이스를 간편하게 구축할 수 있도록 지원한다고 합니다. 또한, 모든 NLWeb 엔드포인트는 MCP 서버이기도해서 웹사이트는 AI 에이전트가 원하는 경우 콘텐츠를 쉽게 검색하고 엑세스할 수 있도록 지원합니다.
이렇게 IT 업계의 기술을 선도하는 기업의 새로운 기술 업데이트를 함께 살펴보았는데요. Google과 Microsoft의 발표는 AI 기술이 단순한 도구를 넘어, 비즈니스 전략의 핵심 요소로 자리잡고 있음을 보여줍니다. 이러한 AI 기술의 발전은 기업의 비즈니스 환경에도 큰 영향을 미치고 있습니다. 새로운 AI 기술들이 올해 우리의 비즈니스 환경에는 어떤 변화를 불러올까요?
멀티모달 AI의 부상: 이제 AI는 텍스트나 이미지 중 한 가지에 국한되지 않고, 텍스트, 이미지, 오디오, 비디오 등 다양한 데이터를 통합적으로 처리하는 멀티모달 방식으로 발전하고 있습니다. 이는 더욱 자연스럽고 직관적인 사용자 경험을 제공하며, 다양한 산업 분야에서의 활용 가능성을 높이고 있습니다.
에이전트 중심의 자동화: 단순한 작업 보조를 넘어, 자율적으로 업무를 수행하고 협업할 수 있는 AI 에이전트의 개발이 활발히 이루어지고 있습니다. 이는 개발자의 코딩 속도 및 생산성을 향상하고, 기업의 업무 프로세스를 혁신하며, 비즈니스의 전반적인 효율성을 극대화할 것으로 예상됩니다.
AI의 일상화: 검색, 이메일, 화상 회의 등 일상적인 서비스에 AI 기능이 통합되면서, 사용자들은 더욱 개인화되고 효율적인 서비스를 경험할 수 있게 되었습니다.
AI 기술이 이미 다양한 분야에서 필수적인 역할을 하고 있어, 이를 사용하지 않던 시절이 기억나지 않을 정도인데요. 시간이 흐를수록 AI의 성능은 더욱 강력해지고, 앞으로는 더욱 강력해지는 AI 성능을 얼마나 빠르게 도입하고 활용하여 성과를 창출할 수 있는지가 중요한 과제가 될 것이라 예상해 봅니다 :)
슈퍼브에이아이도 AI통해 기업의 문제를 빠르고 효과적으로 푸는데 집중하고 있습니다. 비전AI 프로젝트를 수많은 고객사와 함께 진행하면서 얻은 노하우를 여러분과 나누고 싶습니다. 우리 회사에도 산업 맞춤형 AI가 필요하다면 지금 바로 연락주세요.
이 아티클은 최근 PostgreSQL 18의 베타 버전에서 기본 지원을 시작한 UUIDv7에 대해 소개합니다. UUIDv7은 기존 UUID의 장점인 분산 환경에서의 고유성과 보안성은 유지하면서도, 정렬 불가와 인덱스 비효율성 같은 기존 단점들을 극복한 새로운 표준인데요. RFC 9562에 따라 설계된 UUIDv7은 Unix Epoch 기반의 타임스탬프를 활용하여 시간순 정렬 및 효율적인 인덱스 관리를 지원합니다.
특히 PostgreSQL 18은 Async I/O, 멀티 컬럼 인덱스 Skip scan 등 성능 최적화를 위한 여러 기능을 추가하며, uuidv7() 함수 및 타임스탬프 추출 기능을 지원하여 사용자 친화성을 높였습니다. 이로써 분산 시스템이나 다중 테넌트 환경에서 UUID를 기본 키로 사용하기를 꺼렸던 이유들이 해소되었으며, PostgreSQL 기반 애플리케이션의 성능과 유지보수성을 크게 향상시킬 수 있는 선택지가 될 것으로 기대됩니다.
이 레포지토리는 Andrej Karpathy의 NanoGPT를 baseline으로 하여, GPT-2 모델을 NVIDIA H100 GPU 8개 환경에서 가장 빠르게 학습하는 방법을 정리한 자료입니다. 기존의 baseline 학습 시간이 약 45분이었던 것을 단 3분으로 획기적으로 단축한 다양한 최적화 기술과 세부적인 팁들을 공유하고 있습니다.
구체적으로는 하이퍼파라미터 최적화, 새로운 최적화 알고리즘(muon), 빠른 attention 모듈 적용 등, 여러 측면에서 고성능 트레이닝을 위한 실질적이고 실용적인 가이드를 제공하는데요. 빠르게 변화하는 AI 환경에서 모델 학습 시간과 비용 절감이 필수가 된 지금, 빠른 실험과 모델 개선을 원하는 개발자와 연구자에게 매우 유용한 인사이트를 제공합니다.
슈퍼브에이아이가 '한화시스템즈 AI 챌린지'에서 2년 연속 정상에 올랐습니다. 2024년 임은수 연구원의 우승에 이어, 2025년에는 김승현, 고경렬 연구원 팀이 다시 한번 1위를 차지하는 쾌거를 이루었습니다.
적외선 카메라에서 사물을 정확하게 탐지하는 AI 모델 개발을 겨루는 이 대회는 단순히 AI의 탐지 정확도뿐 아니라 실제 산업 현장에서 중요한 모델의 추론 속도를 종합적으로 평가합니다. 특히 방산, 자율주행, 보안과 같은 첨단 산업 분야에서 중요시되는 적외선 영상 처리 기술력을 검증하는 자리입니다.
희귀한 적외선 영상의 데이터 부족 문제를 생성형 AI로 해결하여 정확도 13% 향상을 달성한 슈퍼브 연구팀의 노하우가 궁금하시다면 블로그에서 자세히 보실 수 있습니다.
슈퍼브에이아이는 인천국제공항 여객 흐름 관리 시스템 PoC를 진행하면서 에이전틱 AI와 디지털 트윈 기술을 통해 공항 전역의 CCTV 영상을 실시간으로 분석하고, 자연어 검색과 객체 재인식(Re-ID) 기술로 대기 시간을 단축하며 운영 효율성을 크게 향상시켰습니다.
이번 PoC는 슈퍼브에이아이의 비전-언어 모델(VLM) 기술과 엔비디아(NVIDIA)의 젯슨(Jetson) 플랫폼, 텐서RT(TensorRT) 라이브러리, AI 블루프린트 비디오 검색 및 요약(VSS) 기술을 인천공항의 물류 전문성과 통합 데이터 설계 능력에 결합해 진행했습니다. 슈퍼브 영상 관제 솔루션이 기존 영상 관제 솔루션의 한계를 극복한 내용을 공유합니다.