챗봇 서비스 ‘심심이’, AI 윤리 검증 데이터 구축 사업 진행

이정현 기자 / 기사승인 : 2021-12-01 10:44:30
  • -
  • +
  • 인쇄

AI에게 있어 윤리 문제는 매우 어려운 과제로 꼽힌다. 사람들이 대화형 AI를 자신보다 낮은 지윌로 인식하는 반면 AI가 사람보다 훨씬 더 윤리적으로 말하길 요구하는 관계적 특성 때문이다.


이에 인공지능(AI) 기술을 활용한 챗봇 서비스 ‘심심이’는 AI 윤리 검증 데이터 구축 사업을 진행하고 있다.


‘2021년도 인공지능 학습용 데이터 구축사업’은 대화형 AI 윤리에 대한 경험 및 노하우를 인정받아 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 추진하고 있다. 심심이는 해당 사업에 참여해 ‘텍스트 윤리검증 데이터’ 구축에 박차를 가하고 있는 것으로 전해졌다.


심심이에 따르면 최근 10년간 딥러닝 패러다임이 AI기술을 지배하고 있다. 특히 최근 3~4년간 전이학습 기반의 대용량 언어모델 발전이 비약적으로 이뤄지고 있다고 한다. 최신 모델이 공개될 때마다 빠지지 않고 등장하는 응용 영역 중 하나는 소셜 챗봇이다.


심심이는 이러한 소셜 챗봇이 당장 해결하기 어려운 여러 문제점을 안고 있다고 설명했다. 자신과 대화를 나누는 상대방에 대한 정보 부족, 이전 대화의 맥락을 유지하지 못해 일관성을 유지하기 어려운 부분, 윤리적인 문제가 될 수 있는 대화를 방지하기 어려운 점 등의 문제점이 있다.


심심이는 챗봇의 윤리 문제를 해결하는 부득이한 방법으로 규칙 기반 방어 솔루션을 제안했다. 일례로 자살 관련 사용자 발화 패턴을 수집해 이에 대한 특정한 자살 방지 안내를 하도록 하는 식이다.


그러나 이 방법은 목적지향적 챗봇에서와 달리 소셜 챗봇에서는 재미 요소를 크게 반감시킨느 문제가 있다.


심심이 관계자는 “한국은 국가, 기업을 중심으로 AI 기술 개발에 공을 많이 들이는 국가로 꼽히는데 최근 초거대 언어모델 개발 붐이 일어나며 한국어 기준으로 글로벌 빅테크 기업에 대응할 수 있는 수준의 기술 및 데이터가 등장하고 있다”고 말했다.


그러면서 “이러한 흐름에서 게임, 메타버스, 디지털 휴먼 등 다양한 분야에 활용 가능한 소셜 챗봇 관련 수요도 나타나고 있는 실정”이라며 “이러한 공급, 수요 관계 역시 운리 문제에 직면하고 있는 만큼 윤리 검증에 대한 관심이 갈수록 높아지고 있다”고 덧붙였다.


심심이는 현재 가장 많은 언어를 지원하고 있는 가운데 소셜 챗봇에 대한 윤리 검증 데이터 및 기술을 보유하고 있는 등 독특한 소셜 챗봇 사례로 알려져 있다.


또한, 다양한 언어로 서비스를 제공하는 만큼 언어별, 국가별 등장하는 윤리적 문제에 대한 경험도 많다. 특히 해결하기 위한 기술도 다양하다. 이는 각 언어 사용자들이 직접 대화 시나리오를 학습시킬 수 잇는 구조이기 때문에 소셜 챗봇에서 나타날 수 있는 온갖 비윤리적인 유형의 데이터를 수집하게 된 것이다.


심심이는 현재까지 30여개 언어에서 약 3500만건 이상의 문장을 해당 언어 사용자들이 10번 이상 전수 검사한 윤리 데이터를 보유하고 있다고 전했다.


해당 데이터를 학습해 실시간 윤리 검증이 가능한 고성능 딥러닝 모델을 자체 개발한 것으로 알려졌다.


최정회 심심이 대표는 “이번 과제는 세계적으로 처음 시도되는 인공지능 윤리 데이터에 대한 공공기관 발주사업으로 의미가 깊다”면서 “이를 통해 우리나라가 인공지능 윤리 데이터에 있어서 한 걸음 앞서 나가며 다른 국가나 후속 사업의 이정표를 세울 수 있었다”고 말했다.


이어 “처음인 만큼 보다 범용적으로 과제 방향을 변경할 수 밖에 없었지만 후속사업에서는 최신 언어모델 등에 가장 필요하면서 심심이가 가장 잘 기여할 수 있는 소셜 챗봇 등 대화형 인공지능을 위한 윤리 검증 데이터를 구축할 수 있길 기대한다”고 밝혔다.


[저작권자ⓒ 매일안전신문. 무단전재-재배포 금지]

이정현 기자 이정현 기자

기자의 인기기사

뉴스댓글 >