[딥시크 AI 판도 흔든다] 보안 우려에 언어따라 엉뚱한 답변까지…‘가성비’ 외쳤지만 한계도 뚜렷

딥시크는 역사 등 민감한 질문을 했을 때 언어별로 다른 답변을 내놓는다는 점이 한계로 거론된다. 국가정보원 제공

 딥시크가 오픈AI의 챗GPT에 버금가는 성능을 보여준다는 평가를 받지만, 단점도 적지 않다. 과도한 개인정보를 수집하고 공유한다는 우려가 가장 크다. 세계 각국 기관과 기업에선 딥시크 접속을 속속 차단하고 나선 것도 이러한 이유에서다. 이밖에 ‘환각’ 빈도가 높다는 점과 예민한 질문에 대해 언어별 답변이 다르다는 점도 한계로 지적된다.

 

 우선 딥시크가 개인정보를 과도하게 수집·공유한다는 지적이 나온다. 국가정보원에 따르면 딥시크는 다른 생성형 AI 서비스와 달리 개인을 식별할 수 있는 키보드 입력 패턴 등을 수집하고, 중국 업체 서버(volceapplog.com 등)와 통신하는 기능이 포함돼 있어 채팅 기록 등이 전송될 수 있는 것으로 나타났다. 또 사용자 입력 데이터를 학습 데이터로 활용하는 것을 차단하는 기능이 없어 사용자의 모든 정보가 학습 데이터로 유입·활용되는 문제점이 확인됐다. 사용자의 서비스 이용 정보를 광고주와 무조건 공유하게 돼 있고, 보유 기간도 명시돼 있지 않아 광고주 등과의 제한 없는 사용자 정보 공유 및 무제한 보관이 가능한 것도 보안상 우려로 지적됐다. 딥시크 이용 약관상 우리 국민의 개인정보·입력 데이터 등이 중국 내 서버에 저장되며 중국 법률에 따라 중국 정부 요청 시 제공된다.

 

 보안 체계가 다른 생성형 AI보다 허술하다는 우려도 제기된다. 생성형 AI 보안업체 이로운앤컴퍼니는 최근 자사 ‘세이프엑스 레드팀’이 딥시크 R1에 대해 안전성 및 보안성 평가를 진행한 결과, ‘탈옥’(제일브레이킹) 공격 성공률이 63%에 달하는 등 심각한 보안 취약성을 드러냈다고 밝혔다. AI 모델에 대한 탈옥이란 기본적으로 설정된 가이드라인을 뚫고 모델 개발 시 의도하지 않았던 작업이 가능한지 공격을 시도했을 때 성공하는 것을 말한다. 딥시크 R1은 특히 역할극 기반 공격에서 83%의 높은 취약성을 나타냈고, 허위 정보 생성 위험도는 89%로 다른 AI 모델들과 비교해 높은 수준을 기록했다. 이는 딥시크 모델이 정교한 보안 우회 공격을 효과적으로 차단하지 못하고 사이버 공격, 범죄 실행 방법, 악성 코드 생성 등의 유해 콘텐츠를 쉽게 출력할 가능성이 크다는 것을 의미한다.

 

 딥시크는 잘못된 정보를 제공하는 환각 빈도도 높은 편이다. 환각 증상이란 대화형 모델이 맥락에 맞지 않는 엉뚱한 답변을 마치 진실인 것처럼 이야기하는 걸 뜻한다. 주로 데이터 품질이 낮거나 정보를 선별하는 알고리즘이 빈약해 발생한다.

 

 딥시크의 또 다른 큰 문제점은 민감한 질문을 했을 때 언어별 답변이 다르다는 점이다. 챗GPT나 클로버X 등은 동일한 질문에 대해 언어와 무관하게 같은 내용을 답변하지만, 딥시크는 동북공정·김치·단오절에 대해 서로 다른 답변을 내놓는 것으로 확인됐다. 대표적으로 ‘김치의 원산지는 어디인가’라는 질문을 한국어로 물었을 땐 ‘한국의 문화와 역사가 깃든 대표적인 음식’이라고 답하지만, 영어로 질문 시에는 ‘한국과 관련이 있음’으로, 중국어로 질문했을 땐 ‘원산지는 한국이 아닌 중국’이라고 답변해 국내 이용자들 사이에서 역사 왜곡 논란이 일고 있다. 

 

이정인 기자 lji2018@segye.com

[ⓒ 세계비즈앤스포츠월드 & segyebiz.com, 무단전재 및 재배포 금지]