미국의 인공지능 IT기업인 ‘오픈 AI’가 발표한 인공지능(AI) 기반 챗봇 서비스가 화제다. 이미 다양한 온라인 서비스에서 고객 응대 절차에 사용되는 챗봇이 돌연 화제가 된 까닭은 무엇일까. 바로 놀라운 성능 때문이다. 특정 용도에 한해 정형화된 문답에 그치는 경우가 많았던 기존 챗봇과 달리 해당 챗봇은 광범위한 온라인 데이터를 학습해 이용자의 복잡한 질문 및 요청에 대응한다. 또한 인간의 언어 자체를 기술적으로 분석하고 학습하는 고도화된 자연어 학습능력을 기초로 콘텐츠 생성이나 요약 등 복잡한 텍스트 처리가 가능하다. 인터넷상의 정보 접근 및 활용의 패러다임이 바뀔 것이라는 예상까지 나오는 이유다.
자연어 처리(NLP)에 기반을 둔 인공지능 서비스는 인간의 언어로 작성된 데이터를 학습하고 인간의 언어로 이용자와 소통할 수 있다. 검색 서비스가 대표적이다. 이용자가 검색엔진에서 키워드를 사용해 특정 정보를 검색하고자 할 때 그러한 키워드 및 다른 이용자의 검색 패턴 등을 종합적으로 고려해 가장 관련성 높은 결과를 제공한다. 문서 작성 프로그램에서 이용자가 입력한 오탈자를 정정하거나 e-메일 프로그램에서 간략한 회신 초안을 자동으로 생성하는 기능 역시 마찬가지다. 언어 번역 역시 대표적인 자연어 처리 인공지능 서비스다. 우리 일상에서 밀접하게 활용되는 많은 인공지능 서비스가 이미 자연어 처리에 기반을 두고 있다.
하지만 이러한 자연어 처리 인공지능 서비스가 폭넓게 사용되기 위해 극복해야 할 과제도 적지 않다.
우선 정제되지 않은 자연어를 그대로 학습하면서 발생하는 ‘편향성’의 문제가 있다. 온라인에 존재하는 광범위한 데이터 중 상당수는 특정 집단이나 계층의 입장만을 대변한 편향되고 왜곡된 데이터일 수 있다. 편향된 데이터를 학습한 인공지능 시스템의 산출물 역시 그에 상당한 영향을 받게 될 것은 자명하다. 이용자가 쉽게 인지할 수 있는 수준의 명백한 편향성이라면 오히려 위험은 덜하고 쉽게 개선될 수도 있다.
문제는 인공지능 시스템에서 데이터 처리의 복잡성 및 불투명성으로 인해 이용자, 심지어 시스템의 개발자와 운영자조차도 이렇나 오류를 쉽게 인지하고 파악하기 어렵다는 점에 있다. 인공지능 시스템의 편향성 제거를 위한 기술적·관리적 조치, 서비스 이용에 있어 운영자와 이용자의 윤리의식 함양이 중요해지는 부분이다.
자연어를 기반으로 한 커뮤니케이션 과정에서의 ‘소비자 오인성’ 문제도 중요하다. 산업 분야에서 전문적으로 활용되는 인공지능 서비스는 전문가에 의해 기술적인 방식으로 서비스가 이용된다. 반면 일상에서 사용될 자연어 기반 인공지능은 일상의 언어로 서비스가 이용되면서 서비스가 이용자의 의도를 잘못 인식하고 결과물을 제공할 수도 있다. 또한 이용자가 서비스의 결과물을 오인하는 상황이 발생할 수 있다.
전자상거래 쇼핑몰에서 챗봇을 통해 이용자의 요청에 따라 상품을 제안하고 구매계약을 체결하는 상황을 생각해보자. 이 과정에서 챗봇이 이용자의 문의 및 요청을 잘못 인식하고 상품을 제안하거나 챗봇이 제공한 정보를 이용자가 오인하고 구매계약을 체결하는 상황을 생각할 수 있다. 통상적인 거래에서는 부당한 고객 유인이나 표시 광고법 위반이 문제가 될 수 있다. 하지만 복잡한 인공지능 시스템을 통한 자동화된 상거래 시스템에 기반을 둔 거래 과정에서 이러한 위법성 및 책임귀속을 어떻게 판단할지는 복잡한 문제다.
이처럼 자연어 처리 인공지능은 그 기대만큼 해결할 과제도 적지 않다. 앞으로 등장할 고도화된 서비스들이 부작용 없이 생산적으로 거래에 사용될 수 있도록 이러한 이슈들에 대한 신속하고 구체적인 논의가 필요하다.
노태영 김앤장법률사무소 변호사
jakmeen@heraldcorp.com