김은희 l 한국오라클 컨설턴트<BR>코드 없이 하는 ‘오토 ML’ 시대 활짝

People

< 알쓸패잡_패션과 IT >

김은희 l 한국오라클 컨설턴트
코드 없이 하는 ‘오토 ML’ 시대 활짝

Tuesday, Sept. 7, 2021 | 외고, mizkim@fashionbiz.co.kr

  • VIEW
  • 661
머신 러닝이 자동화됐다. 데이터 과학자 없이도 컴퓨터가 스스로 기계 학습을 수행하기 때문에 코딩을 쓸 줄 모르는 현업에서도 코드 없이, 머신 러닝이 가능한 것이 ‘오토 머신 러닝(Auto Machine Learning, 이하 오토 ML)’이다. 3년 전쯤 콘퍼런스에서 데이터 로봇을 선보였을 때 오토 ML은 탄성을 자아내는 새로운 것이었는데, 이제는 대부분의 클라우드 서비스 업체(CSP)가 제공하는 상용화된 상품으로 출시됐다.        

빅데이터와 AI가 패션의 지형을 바꾸고 있다. H&M은 200명이 넘는 데이터 과학자를 고용해 빅데이터 분석 기반으로 운영 비용을 70% 절감했다. 온라인 쇼핑몰에서도 넷플릭스처럼 추천 시스템을 통해 성과를 높이려는 시도가 많아지고 있다. 패션은 전문가의 지식이나 감이 절대적으로 중요한 산업이지만, 최근에는 데이터 기반으로 수익성을 높이는 방안을 찾아 의사결정을 합리적으로 하고 있다.

패션업 실무자도 데이터 분석에 관심을 기울이고 데이터/IT 부서와 협업을 해야 한다. 일반적으로 데이터 분석의 목적은 예측과 추론이다. 예측(Prediction)은 결과를 맞히는 것이고 추론(Inference)은 원인과 결과 사이의 관계를 분석하는 것이다.

예를 들면, 이미지 인식(Deep Learning)은 고양이를 맞히는 예측 정확도만 중요할 뿐 어떤 요인에 의해서 고양이라고 인식했는지는 중요하지 않다. 그러나 매장의 매출을 분석하는 추론에서는 원인(X)에 따른 결과(Y)의 변화를 찾는 게 중요하다.

선형회귀를 예로 들면 매장 크기, 유동인구, 주차장 크기, 그 외 요인 등에 따라 매출이 구체적인 값이 나오고 원인의 방향과 변화 정도에 따라 결과가 어떻게 변하는지가 중요하다. 실무적으로는 실행 계획에 대한 근거를 제공한다.  이처럼 머신 러닝은 통계분석과 비슷한데 관계식의 매개변수(parameter)를 끊임없이 머신 스스로 컴퓨팅으로 계산해 나가는 과정, 즉 알고리즘을 학습하는 과정에 초점을 둔 용어이며 인공지능의 일부분이다.  

필자가 접해 본 오라클 Auto ML을 소개하자면, 데이터를 로딩 후 결과(Y) 항목에 데이터의 해당 칼럼을 선택하면 나머지는 자동으로 머신 러닝이 수행된다. Y값이 수치인지, 범주인지에 따라서 각각 회귀·분류의 방법을 고른 후 그에 속한 모든 알고리즘에 대해서 적절한 X변수를 선택하고 매개변수를 반복 작업으로 튜닝하고 모델을 완성하는 과정을 거친다.

결과로는 모델별로 설명력(R2), ROC커브, 오차율 등 평가 지표가 나오고 각 요인이 결괏값에 미치는 영향도까지 계산해 준다.  현업에서는 이제 오차율이 가장 낮은 머신 러닝 모델을 고를 수 있다. 파이선 코드의 노트북으로 전환해서 코드를 읽어보거나 자동으로 API를 생성해서 웹 페이지에 머신 러닝을 추가할 수 있다.

일례로 소비자가 신체 치수를 입력하면 보디형이나 옷 사이즈를 보여주는 ML이 포함된 웹 페이지를 만들 수 있다.  이제 머신 러닝은 자동화에 맡겨도 좋다. 실무자는 현장의 노하우를 어떤 분류와 회귀라는 수학 문제로 풀까, 데이터를 준비하고 추론을 고민하는 것이 중요해졌다. 패션업 실무자가 데이터를 이해하는 문제해결형 리더로 성장하길 기대한다.  


■ profile
•현 한국오라클 상무, 컨설턴트
•MIT 로지스틱스, SCM 공학석사
•FIT 패션바잉, 머천다이징 AAS
•서울대 의류학과 학사, 석사, 박사


<저작권자 ⓒ Fashionbiz , 무단전재 및 재배포 금지>