▶ 지니 TV AI 에이전트, 사용자와 대화하며 탐색하는 대화형 AI 플랫폼으로 진화
▶ 고도화된 자연어 처리 기술과 멀티턴 대화로 직관적이고 풍부해진 서비스 제공
▶ 멀티 LLM 전략…B2C 서비스에 GPT-4o 기반 한국적 AI 모델 SOTA K 최초 도입
#[자유 대화형]
(고객) “한국 주식이 요즘 갑자기 왜 뜨는 거야?”
(지니) “요즘 한국 주식이 뜨는 건 경기회복 기대감, 기업 실적 개선, 외국인 투자자 유입 등 복합적인 요인이 적용해서예요.”
(고객) “그럼 지금 들어갈 타이밍이야?”
(지니)”’투자 타이밍은 개인성향과 목표에 따라 달라서 신중히 판단하는 게 좋아요.”
(키즈) “어른들은 왜 맨날 바쁘다고 해?”
(지니) “어른들은 마치 여러 가지 맛있는 디저트를 한꺼번에 먹으려고 바쁘게 움직이는 것처럼 여러가지 해야 할 일이 많아서 그래.”
(키즈) “어른이 되면 놀 시간이 없어져?”
(지니) ”어른이 돼도 놀 시간이 있어! 마치 숨바꼭질할 때 숨는 시간처럼, 바쁜 중에도 잠깐씩 쉬고 놀면서 힘을 내는 거야.”
스마트폰 혁명이 사람들의 삶에 큰 변화를 일으켰듯 앞으로는 AI가 우리 일상에 또 다른 혁신을 만들어낼 것으로 기대된다. 특히 AI가 탑재된 IPTV는 이제 단순한 콘텐츠 재생 기기가 아니라, 사용자와 대화하며 함께 탐색하는 대화형 AI 플랫폼으로 발전하고 있다.
KT(대표이사 김영섭)의 지니 TV AI 에이전트는 기존 “지니야 TV 켜줘”, “채널 바꿔줘”와 같은 단순 명령형 제어를 넘어, 일상적인 질문과 대화를 주고받는 ‘자유 대화형’ 형태로 발전했다. 이는 지니 TV AI 에이전트 도입 6개월 맞아 200만 셋톱박스의 이용 키워드 데이터를 분석한 결과이다.
지니 TV AI 에이전트는 기가지니를 통해 축적된 AI∙빅데이터 기술력에 LLM 최적화 역량이 더해져 자연스러운 언어 이해와 응답을 제공한다. 이제 사용자는 대화형 UX(Conversational UX)를 활용해 음성으로 ▲정보 검색 ▲콘텐츠 추천 ▲기기 제어 ▲일상대화 기능을 이용할 수 있다.
▲ 미디어 에이전트를 통한 세밀한 자연어 이해로 대화 경험 고도화
지니 TV는 AI 에이전트 적용 후 사람과 자유롭게 대화할 수 있는 차세대 대화형 AI 플랫폼으로 진화하고 있다. 이러한 혁신의 중심에는 마스터 에이전트(Master Agent)와 서브 에이전트(Sub Agent)의 협업 구조로 설계된 미디어 에이전트(Media Agent) 기술이 자리한다.
마스터 에이전트는 지니TV 대화 시스템의 중앙 제어 허브로, 사용자의 발화를 분석하고 대화의 맥락을 이해한 뒤 가장 적합한 서브 에이전트를 선택해 결과를 통합한다. 이렇게 호출된 서브 에이전트는 역할에 맞는 동작을 수행하며 최적의 응답을 생성한다.
서브 에이전트는 여러 분야별로 역할이 특화된 전문 모듈형 AI이다. 각 서브 에이전트는 모델이 해석 가능한 형태로 자연어를 정규화하고, 사고의 구조를 설정하며, 실제 동작을 수행하는 3단계 절차적 사고를 따른다. 이를 통해 불필요한 추론이나 환각을 최소화하고, 보다 정확하고 자연스러운 대화 경험을 제공한다.
이제 사용자는 줄거리나 간단한 설명만으로도 콘텐츠를 찾을 수 있다. “꽉 막힌 고가도로에서 사람들이 차에서 내려 춤추는 영화는?”과 같이 컨텐츠 내용의 일부 상황 묘사만으로도 영화 제목을 알아낼 수 있다. “학교를 주제로 한 영화를 찾아줘”라고 질문하면 지니 TV는 학교 관련 소재나 사물이 포함된 작품을 탐색해 정보를 제공한다.
또한, 지니 TV AI 에이전트는 단방향이나 일회성 음성 명령을 넘어 ‘멀티 턴(Multi-turn) 대화’ 서비스를 제공해 사람과 자연스럽게 이어지는 대화 경험을 제공한다. 음성 인식률도 95% 이상으로 크게 개선돼 보다 자연스럽고 인간에 가까운 대화가 가능하다.
▲ 발화 정보 저장 및 멀티 LLM 전략으로 사용자 맞춤형 대화 구현
지니 TV AI 에이전트는 개인의 취향을 반영하는 지능형 파트너이다. STM(Short-Term Memory)가 최근 대화 내용을 저장하면, LTM(Long-Term Memory)를 통해 장기적으로 의미 있는 정보를 추출해 기억한다.
LTM은 STM에 저장된 사용자의 발화 중 “안녕” 같은 즉흥적이거나 부정확한 내용은 제외하고 기억할 가치가 있는 정보만 남긴다. “나는 요즘 다큐멘터리를 자주 봐.”에서 “다큐멘터리 선호”와 같이 명시적으로 표현된 사실만을 저장하면, 기존 LTM와 비교해 정보를 정제한다. 이후 사용자의 프로필 정보와 행동 이력을 분리해 관리하며 개인화 응답에 활용한다.
여기에 멀티 LLM 전략을 통해 사용자의 질문 의도에 맞는 가장 적합한 모델을 자동 호출하며 대화의 품질을 유지한다.
지니 TV AI 에이전트는 멀티 LLM 전략의 일환으로 ▲마이크로소프트와 협력해 도입한 애저 오픈AI 서비스(Azure OpenAI Service) ▲GPT-4o 기반 한국적 AI 모델 SOTA K(Sota K built on GPT-4o) 등을 활용한다. KT는 한국 가정 댁내 최적화된 환경 제공을 위해 멀티 LLM 연동을 확장하고 멀티모달 모델 확보를 계속 추진할 계획이다.
한편 SOTA K의 지니 TV AI 에이전트 적용은 지난 9월 모델 출시 이후 최초로 B2C 서비스에 도입된 사례로, KT와 마이크로소프트의 전략적 협업 성과를 보여준다. SOTA K는 글로벌 최고 수준 성능의 GPT-4o에 한국어와 한국 사회·문화적 맥락을 정교하게 접목한 협업형 모델로 국내 AI 생태계에 새로운 이정표를 제시할 것으로 기대된다.
▲ 거실 미디어 소비의 혁신 이끄는 AI IPTV, 일상 바꾸는 AI로 기대
이와 같이 거실 미디어 소비의 중심인 TV는 이렇게 AI IPTV를 중심으로 변화하고 있다. 2025년 상반기 기준 유료방송 가입자의 IPTV가 59.11%를 이용하며, KT는 전체 가입자 중 최고 점유율인 24.92%를 기록했다.
앞으로도 KT는 지니TV의 AI 에이전트를 발전시켜 미디어 서비스를 넘어 사용자 삶 속에 더욱 깊이 스며드는 대화형 AI 플랫폼으로 발전시킬 계획이다.
[사진 1~2] 모델들이 지니 TV AI 에이전트를 활용하고 있는 모습
* 더 자세한 내용은 KT 기술 블로그 kode.kt.com에서 확인하실 수 있습니다.


