[경제] 업스테이지 표절 논란 일단락 됐지만…'독자성' 판가름 기준 시험…

본문

bt2f3de61572830f3e026e6e838e04fdd7.jpg

지난해 12월 30일 서울 강남구 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 참석자들이 업스테이지 부스를 둘러보고 있다. 연합뉴스

국가대표 인공지능(AI) 선정 사업에 참여중인 업스테이지의 AI 모델 표절 논란이 의혹 제기자 측 사과로 일단락되는 모양새다. 하지만 AI 모델의 독자성을 어떤 잣대로 평가할 거냐는 문제는 여전히 남아있다.

4일 AI 업계에 따르면 고석현 사이오닉AI 대표는 지난 3일 자신의 소셜미디어(SNS)에 “엄밀하게 검증되지 않은 채 공개함으로써 불필요한 혼란과 논란을 야기한 점에 진심으로 사과드린다”면서도 “독자성을 판단하는 기준 또한 기술적·학술적 관점에서 사회적으로 합의 가능한 형태로 정교화 될 필요가 있다”고 밝혔다.

앞서 고 대표는 업스테이지의 AI 모델 ‘솔라 오픈 100B’가 중국 AI 스타트업 즈푸AI의 모델 GLM을 기반으로 만들어졌다고 주장했다. 두 모델의 구조(레이어 정규화)가 유사하고, AI가 학습하는 단어를 숫자로 변환한 값인 ‘토큰 임베딩’의 분포가 통계적으로 비슷하다는 이유였다. 이에 업스테이지는 지난 2일 공개 검증회를 열고 정면 반박에 나섰다. 김성훈 업스테이지 대표는 “모델 구조는 허깅페이스(글로벌 AI 공유 플랫폼)에 있는 오픈소스 코드로 표준화돼 있지만, 가중치(웨이트)는 새로 학습한 ‘프롬 스크래치’ 방식을 따랐다”고 주장했다. 그 근거로 모델의 가중치와 학습 추적 로그도 공개했다. 김 대표는 “초기에는 로스(오답률)가 높았다가 낮아졌다. 처음부터 학습했다는 흔적”이라며 “고 대표가 문제 삼은 레이어 정규화의 유사성은 전체 모델의 0.0004%에 불과한 극히 일부”라고 주장했다.

업계에선 업스테이지의 주장에 힘을 실어줬다. 이승현 포티투마루 부사장은 “(이번 논란은) 라이센스와 저작권을 혼동해서 벌어진 일”이라며 “소스 코드를 가져왔다고 해서 표절로 볼 순 없다. 업스테이지는 가중치를 독자적으로 구성해서 모델을 만들었다”고 말했다.

독자 AI 모델 기준은

bt79217cab73848f6610e267cd7507017b.jpg

배경훈 과학기술정보통신부 장관(왼쪽 세번째)이 지난해 9월 9일 서울 중구 르메르디앙 미드센츄리룸에서 열린 '독자 AI 파운데이션 모델 프로젝트 착수식' 에서 참석자들과 기념 촬영하고 있다. 연합뉴스

이제 논쟁은 업스테이지의 표절 여부가 아닌 AI 모델 개발의 독자성 기준이 무엇인지로 옮겨가고 있다. 특히 과학기술정보통신부가 독자 AI 파운데이션 모델 사업의 기준으로 삼은 ‘프롬 스크래치’의 개념이 모호하다는 지적이 나온다. 프롬 스크래치는 말 그대로 ‘아무것도 없는 바닥부터 시작한다’는 뜻의 관용구다. 통상 AI 업계에선 모델의 가중치를 랜덤으로 초기화한 뒤 그 상태에서 처음부터 새로 학습하는 것을 말한다.

문제는 AI 개발 방식이 다양해지고 있다는 점이다. 기존 모델을 추가 학습하는 파인튜닝(미세조정)한 모델들에 대해서도 마케팅 용어처럼 무분별하게 혼용돼 혼란을 불러일으킨다. AI 플랫폼 기업 W&B의 오현우 시니어 매니저는 “프롬 스크래치는 아직 국제적으로 통일된 규정이 없어 계속 논의하면서 발전시켜 나가야 할 개념”이라며 “정부가 제시하는 프롬 스크래치의 기준이 불명확하다 보니, 문제가 생긴것 ”이라고 지적했다.

업계에선 정부가 5~15일 진행할 독자 AI 파운데이션 모델 사업 1차 평가를 주목하고 있다. 평가 결과 네이버클라우드, 업스테이지, SK텔레콤, NC AI, LG AI연구원 등 5개팀 중 1개 팀이 탈락한다. 배경훈 부총리 겸 과학기술정보통신부 장관은 “평가 과정에서 모든 정예팀으로부터 개발 모델의 최종 파일과 복수의 중간 체크포인트 파일 등을 제출받아 전문기관인 한국정보통신기술협회(TTA)를 통해 면밀히 검증할 예정”이라며 “전문가 평가위원회를 통해서도 동 자료를 바탕으로 계획에 부합한 AI 모델이 개발되었는지 여부를 검증하여 확인할 계획”이라고 밝혔다.

0
로그인 후 추천을 하실 수 있습니다.
SNS
댓글목록 0
등록된 댓글이 없습니다.
전체 49,916 건 - 1 페이지