[칼럼] 김은희 l 한국오라클 컨설턴트 'RAG 에이전트 핵심 임무? AI 굿 데이터 조달'

패션비즈 취재팀 (fashionbiz_report@fashionbiz.co.kr)|24.12.13 ∙ 조회수 934
Copy Link

[칼럼] 김은희 l 한국오라클 컨설턴트 'RAG 에이전트 핵심 임무? AI 굿 데이터 조달' 27-Image


프레젠테이션을 마친 발표자가 바쁘게 다음 일정으로 이동할 때, Q&A 세션은 음성 챗봇이 담당한다. 최근 소프트웨어 기술 세션에서 자주 볼 수 있는 장면이다. 이 같은 모습이 가능해진 것은 RAG 에이전트, 생성형 AI, TTS가 협력해 지식 저장소(Knowledge Base)에 저장된 기술 문서를 바탕으로 AI가 스스로 고객을 응대할 수 있기 때문이다.


RAG 기술의 등장을 이해하기 위해 간단히 생성형 AI 발전 과정을 살펴보면 다음과 같다. ChatGPT-4o 출시 이후 높은 구독료에도 불구하고 이용자 수가 증가하며 AI 열풍이 재확인됨. LLM 개발 시 발생하는 막대한 GPU 비용 문제를 해결하기 위해 소형 LLM에 대한 관심이 커짐. RAG 기술을 통해 정보의 실시간성 확보, 소형 LLM 성능 보완, 파인 튜닝 대비 비용 절감 효과를 기대할 수 있음.


RAG 기술의 핵심은 바로 ‘굿 데이터’ 조달이다. RAG는 사용자 질문을 이해하고 관련 문서를 검색하며 정확한 텍스트를 생성하는데, 이 과정에서 LLM 모델이 단어 잇기를 할 때 환각(Hallucination)을 방지하도록 최신, 전문적, 사내 정보를 검색해 필요한 정보만 발췌해서 제공한다.   


AI 시대 ‘굿 데이터’란 무엇일까? 활용 주체는 AI다. 따라서 AI가 이해할 수 있는 형태로 문서를 수치로 변환(Embedding)하고 사용자의 질문이 들어오면 관련 문서를 거리 계산으로 찾을 수 있도록 데이터를 정제해야 한다. 이때 문서를 적절한 크기로 자르는 청킹(Chunking) 작업이 중요하다. 구조화된 벡터DB 구성과 함께 검색된 문서를 ‘연관성’ 순으로 정렬하는 작업(Rank model)도 굿 데이터를 만드는 데 필수 요소다.


국내에서 굿데이터 기반의 RAG와 생성형 AI 솔루션에서 두각을 나타내는 기업이 있다. 2016년 오라클 개발자 출신 신현철 씨가 창업한 유니라인(UNILINE)이 바로 그 기업으로 와이힐(WYHIL)의 자회사다. 중소벤처기업부 창업진흥원, 서울과학기술대학교의 지원으로 글로벌 진출을 준비하고 있다.


유니라인은 AI 드라이브, AI 검색, AI 챗봇 플랫폼을 서비스하고 있다. ‘AI 드라이브’는 OCR, RAG 에이전트를 기반으로 원하는 문서 요약, Q&A, 개인화된 응답을 제공해 주는 Gen AI 서비스다. AI를 자유자재로 운전할 수 있다는 ‘AI 드라이브’이기도 하고 저장 장치인 HDD와 SDD에서 유래한 ‘AI 드라이브’라는 뜻을 동시에 담고 있다. 데이터 정제와 구조화된 벡터DB 구성에서 특화된 기술을 보유한 AI 드라이브는 이미 의료와 법률 분야 고객사들로부터 최고의 응답 성능을 인정받고 있다. 또 개인정보 보호와 기업정보 유출을 막기 위한 AI 모니터링 서비스도 제공하며, 특히 AI 컨설팅부터 SaaS 구축까지 원스톱으로 생성형 AI 플랫폼을 구축할 수 있다는 것이 강점이다. 


AI 시대 ‘굿 데이터’ 기반의 AI 추론은 ‘AI=DI (Data Intelligence)’라는 명제로도 표현될 수 있다. 인간중심 검색에서 AI 중심의 데이터 활용과 생성형 AI의 발전을 의미하는데, AI 열풍이 단순히 트렌드를 넘어 산업 전반의 혁신을 주도할 것으로 전망된다. 


이 기사는 패션비즈 2024년 12월호에 게재된 내용 입니다.

패션비즈는 매월 패션비즈니스 현장의 다양한 리서치 정보를 제공합니다.

Comment
  • 기사 댓글 (0)
  • 커뮤니티 (0)
댓글 0
로그인 시 댓글 입력이 가능합니다.
Related News
Banner