이젠온라인에듀

GPT-4.1 및 OpenAI Realtime API를 사용한 코드 없는 개인 에이전트 'Genspark'

작성일시
2025.07.07
작성자
경승현책임연구원
HIT
26

 

20명으로 구성된 팀으로 단 45일 만에 연평균 수익 3,600만 달러를 달성했습니다.

 

 

겐 스파크Super Agent를 개발한 회사로, 코드가 필요 없고 사용자 정의가 가능한 AI 에이전트로, 사용자가 전화 통화, 프레젠테이션 작성, 요리법을 짧은 영상으로 만드는 등 실제 업무를 자동화하는 데 도움을 줍니다.

Super Agent는 OpenAI 멀티모달 모델과 실시간 API를 사용하여 텍스트, 이미지, 음성 등 다양한 작업을 처리합니다. 사용자는 코딩 없이 간단한 프롬프트로 복잡한 워크플로를 자동화할 수 있습니다. 이 시스템은 폭발적인 성장을 거듭하여 단 45일 만에 3,600만 달러의 연간 수익(ARR)을 달성했습니다. 이는 강력한 사용자 수요 덕분입니다. 

 

OpenAI는 처음부터 Genspark를 지원해 왔습니다. OpenAI의 API는 단순히 모델을 구동하는 데 그치지 않고 20명으로 구성된 우리 팀이 누구도 예상하지 못했던 속도로 빠르게 개발, 출시, 확장할 수 있도록 지원했습니다.

- Genspark의 CTO 겸 공동 창립자인 Kay Zhu

 

검색을 넘어 에이전트로 이동

 

Genspark는 처음에는 소비자와 전문가가 정보를 종합하고 구조화할 수 있도록 설계된 AI 검색 엔진으로 출시되었습니다. 2024년 말부터 사용자 행동이 변화하기 시작했습니다. 사용자들은 단순히 답변을 원하는 것이 아니라 결과를 원했습니다. "시장을 요약하는 것" 대신, 피치 데크, 비디오 스크립트, 후속 이메일을 요구했습니다. 동시에 모델 기능도 빠르게 확장되었습니다. 더 길어진 컨텍스트 창, 더욱 강력한 추론, 그리고 새로운 멀티모달 API 덕분에 단순히 정보를 검색하는 것뿐 아니라 전체 워크플로를 자동화하는 것이 점점 더 가능해졌습니다.

 

사용자 수요와 모델 준비도의 변화로 인해 팀은 과감한 결정을 내리게 되었습니다. 2025년 4월, Genspark는 검색에서 벗어나 에이전트 AI를 완전히 수용했습니다.

 

OpenAI 멀티모달 모델을 사용한 무코드 자율 에이전트 구축

 

2025년 4월, Genspark는 전화 통화, 슬라이드 디자인, 비디오 제작 등을 수행할 수 있는 완전 자율형 노코드 어시스턴트 Super Agent를 출시했습니다. 이 플랫폼은 9개의 전문화된 대규모 언어 모델과 80개 이상의 통합 도구를 활용하여 각 작업을 가장 적합한 구성 요소에 동적으로 할당합니다.

 

OpenAI 모델은 이 시스템의 핵심입니다. GPT‑4.1은 향상된 지시 이행 및 1M 토큰 컨텍스트 윈도우를 통해 연구 및 구조화된 출력을 처리하여 상담원이 긴 문서를 잘림 없이 완벽하게 처리할 수 있도록 합니다. 엄격한 JSON 출력은 다운스트림 도구에 대해 안정적으로 구조화된 응답을 제공하도록 설계되었으며, 자동 프롬프트 캐싱은 지연 시간과 API 비용을 줄여주는데, 이는 특히 다단계 워크플로에서 유용합니다. 이미지 생성을 위해 플랫폼은 OpenAI API를 통해 GPT‑image-1 모델을 사용합니다.

 

이 시스템은 완전히 노코드(no-code) 방식이라 사용자가 이런 것들을 생각할 필요가 없습니다. 사용자가 원하는 것을 설명하면 "치과 의사에게 전화해 줘", "이 보고서를 요약해 줘", "슬라이드 자료 만들어 줘"와 같은 간단한 작업만으로 Super Agent가 나머지를 처리합니다.

 

AI를 활용한 사직 전화 처리

 

Super Agent의 가장 큰 화제 기능 중 하나는 바로 Call For Me입니다. 이 AI는 사용자를 대신하여 실제 전화를 걸어 대화를 이끌어냅니다. 대본도 없고, 번거로운 연결 과정도 없습니다. 예약이나 배송 일정 변경 시, 상담원은 OpenAI Realtime API와 음성 대 음성 기능을 활용하여 자연스럽고 유창하게 실시간 대화를 처리합니다.

 

이중 계층 시스템이 상호작용을 지원합니다. 실시간 API는 실시간 대화를 관리하고, 섀도 모델은 메시지 큐를 통해 상호작용을 모니터링하고 안내합니다. 그 결과, 통화 중 대기 음악이나 모호한 사용자 응답이 포함되어 있더라도 빠르고 일관된 대화가 가능합니다. 일본에서는 한 가지 활용 사례가 큰 인기를 끌었습니다. 사용자가 상담원에게 고용주에게 보내는 사직 전화를 처리해 달라고 요청하는 방식입니다. 이는 대부분의 사람들이 AI 상담원이 처리해 줄 것이라고 기대하지 않는, 깊이 있는 인간적인 상호작용입니다. 

 

전화 통화 외에도, Super Agent는 개인화된 콘텐츠를 제작하는 데 도움을 줍니다. 베이퍼웨이브 스타일의 홍보 자료를 요청하면, Super Agent는 슬라이드 초안을 작성하고, GPT‑image-1을 사용하여 스타일리시한 표지 이미지를 생성하고, 최종 자료를 편집합니다. 동영상의 경우, Super Agent는 장면별 대본을 작성하고, 이미지를 생성하고, 인스타그램에 올릴 만한 짧은 영상을 제작합니다.

 

이러한 사용 사례는 OpenAI의 멀티모달 기능, Genspark의 실행 속도, 그리고 OpenAI 스타트업 팀과의 긴밀한 협력을 통해 가능합니다. Genspark는 OpenAI 솔루션 설계자들과 정기적으로 만나 모범 사례를 공유하고, 워크플로를 미세 조정하고, 모델 성능을 최적화했습니다. Genspark는 Realtime API를 활용한 음성 경험을 최초로 출시한 기업 중 하나이며, 모델 개선에 도움이 되는 피드백을 지속적으로 제공하고 있습니다.

 

Zhu는 "우리는 다양한 모델에 걸친 모델 성능뿐만 아니라 개발자 경험 때문에 OpenAI를 선택했습니다."라고 말하며, "OpenAI API 설계 덕분에 병목 현상 없이 신속하게 배포, 디버깅, 확장할 수 있었습니다."라고 덧붙였습니다.

 

 

기록적인 성장, 유료 마케팅 없음

 

Super Agent를 출시한 지 한 달 남짓 만에 Genspark는 다음과 같은 성과를 거두었습니다.

 

▪ 단 45일 만에 ARR 3,600만 달러로 성장

▪ 70일 만에 8개의 주요 에이전트 기능을 배송했습니다.

 

이 모든 것은 20명의 팀과 유료 광고 없이 이루어졌습니다. 이러한 성장은 전적으로 제품 바이럴 마케팅과 입소문에 힘입어 자연스럽게 이루어졌습니다. Super Agent의 매력은 바로 접근성에 있습니다. 사용자는 워크플로를 구축하거나 설정을 구성할 필요가 없습니다. 필요한 내용만 말하면 나머지는 에이전트가 처리합니다.

 

OpenAI를 통해 에이전트 AI를 더욱 발전시키다 

 

다음으로, Genspark는 자율 에이전트가 더 큰 가치를 창출할 수 있는 새로운 분야로 확장하고 있습니다. 예를 들어, 사용자가 탐색하는 모든 콘텐츠를 처리하는 AI 브라우저나 다양한 포맷의 문서를 생성하는 AI 문서 등이 있습니다. OpenAI API는 팀의 빠른 개발 및 배포를 위한 핵심 요소로 남아 있습니다.

 

Zhu는 "Genspark는 단순한 채팅 인터페이스가 아닌, 올인원 AI 작업 공간으로 구현되었습니다."라고 말하며, "OpenAI API를 통해 이를 기록적인 시간 안에 구현할 수 있었습니다."라고 덧붙였습니다.

 

 

답변 (0)