구글 바드에 '김가은' 검색했더니 도와드릴 수 없다…왜?
자유인291
IT과학
1
553
01.15 19:08
구글 바드, 일부 한국이름에 엉뚱한 답변 제시
영어로는 상세한 답변…한국 관련 데이터 부족 가능성
"공인 아니면 답 못하는 안전장치 설정 가능성" 의견도[이데일리 김가은 기자] 구글 생성형 인공지능(AI) 챗봇 ‘바드(Bard)’가 일부 한국어 이름에 답을 내놓지 못하는 것으로 나타났다. 아직 실험버전인 바드에 한국 혹은 한국어에 대한 학습 데이터가 충분치 않거나 대표적인 공인이 없을 경우 답을 하지 않는 방향으로 안전장치(가드레일)가 적용됐을 가능성이 있어 보인다.
15일 구글 바드에 기자 이름인 ‘김가은’을 입력했다. 바드는 “텍스트 기반 AI라 도와드릴 수가 없다”거나 “언어 모델일 뿐이라 그것을 도와드릴 수가 없다” 같은 답이 나왔다. 한국에서 흔한 이름인 ‘김지현’에 대해서만은 바드가 먹통이 된다는 보도와 달리 한국어 이름과 관련한 추가 사례가 나오고 있는 것이다.
답변을 하기 위해 추가 정보를 제공해봤다. 앞서 비슷한 사례에서 △직업 혹은 전문분야 △나이 또는 생년월일 △고향, 작업한 프로젝트와 같은 특징적 정보를 추가로 제공해달라는 내용이 검색됐기 때문. ‘한국의 기자’라는 정보를 추가로 입력했는데도 바드는 “저는 그렇게 하도록 프로그램되지 않았다”며 엉뚱한 대답을 했다.
이를 두고 국내 한 AI 전문가는 “유명인이 아니면 답을 내놓지 않도록 안전장치가 걸려있거나 학습된 것이 아닌가 한다”며 “거대언어모델(LLM) 팜2(Palm2)에서 제미나이 프로로 넘어오면서 이렇게 된 것 같다”고 분석했다. 제미나이는 지난해 12월6일(현지시간) 구글이 공개한 ‘복합 정보처리(멀티모달)’ AI로 텍스트, 음성, 이미지, 영상 등 다양한 데이터를 인식하고 처리할 수 있다.
이 전문가는 “바드의 안전장치 운영정책일 수도 있다”며 “특정 이름 혹은 단어에만 강력한 안전장치(하드 가드레일) 정책이 적용됐을 수도 있다”고 덧붙였다.
다만 같은 이름을 영어로 입력할 경우엔 달랐다. 김가은을 영어로 ‘Kim Gaeun’이라고 입력하자 바드는 동명이인인 배우 김가은 씨의 정보를 내놨다. 같은 이름이지만 영어에는 답을 했다는 것은 결국 한국어 또는 한국에 대한 데이터 학습이 부족하다는 의미로 해석된다.
최경진 가천대학교 교수(한국AI법학회 회장)는 “충분한 정보가 없어서 답을 못하거나, 학습이 덜 됐을 가능성이 있다”며 “LLM 자체의 특성상 충분한 질문과 대화 맥락을 거치면서 답을 할 수 있으므로 성능이 떨어진다거나 하는 문제는 아니다”라고 설명했다.
구글은 바드의 한국어 이름 입력시 결과 오류와 관련해 아직 별다른 답을 내놓지 않고 있다. 구글코리아는 “현재 관련 내용을 논의 중”이라고 답했다.
한편 구글의 ‘복합 정보처리(멀티모달)’ AI 제미나이는 규모와 성능에 따라 울트라·프로·나노 등 3개 모델로 나뉜다. 이 가운데 제미나이 프로와 나노는 이미 출시됐으며 프로는 공개 당일부터 바드에 적용됐다. 가장 작은 크기의 버전인 나노는 스마트폰 등 모바일 기기에 특화된 모델로, 구글의 최신 스마트폰 ‘픽셀8 프로’ 에 적용됐다. 구글의 목표는 검색엔진, 광고 제품, 크롬 인터넷 브라우저에 제미나이 3개를 결합해 전 세계에서 사용할 수 있도록 하는 것이다.
구글은 바드에 울트라 버전을 적용해 내년 초 ‘바드 어드밴스드’라는 이름으로 출시할 예정이다.
영어로는 상세한 답변…한국 관련 데이터 부족 가능성
"공인 아니면 답 못하는 안전장치 설정 가능성" 의견도[이데일리 김가은 기자] 구글 생성형 인공지능(AI) 챗봇 ‘바드(Bard)’가 일부 한국어 이름에 답을 내놓지 못하는 것으로 나타났다. 아직 실험버전인 바드에 한국 혹은 한국어에 대한 학습 데이터가 충분치 않거나 대표적인 공인이 없을 경우 답을 하지 않는 방향으로 안전장치(가드레일)가 적용됐을 가능성이 있어 보인다.
|
15일 구글 바드에 기자 이름인 ‘김가은’을 입력했다. 바드는 “텍스트 기반 AI라 도와드릴 수가 없다”거나 “언어 모델일 뿐이라 그것을 도와드릴 수가 없다” 같은 답이 나왔다. 한국에서 흔한 이름인 ‘김지현’에 대해서만은 바드가 먹통이 된다는 보도와 달리 한국어 이름과 관련한 추가 사례가 나오고 있는 것이다.
답변을 하기 위해 추가 정보를 제공해봤다. 앞서 비슷한 사례에서 △직업 혹은 전문분야 △나이 또는 생년월일 △고향, 작업한 프로젝트와 같은 특징적 정보를 추가로 제공해달라는 내용이 검색됐기 때문. ‘한국의 기자’라는 정보를 추가로 입력했는데도 바드는 “저는 그렇게 하도록 프로그램되지 않았다”며 엉뚱한 대답을 했다.
이를 두고 국내 한 AI 전문가는 “유명인이 아니면 답을 내놓지 않도록 안전장치가 걸려있거나 학습된 것이 아닌가 한다”며 “거대언어모델(LLM) 팜2(Palm2)에서 제미나이 프로로 넘어오면서 이렇게 된 것 같다”고 분석했다. 제미나이는 지난해 12월6일(현지시간) 구글이 공개한 ‘복합 정보처리(멀티모달)’ AI로 텍스트, 음성, 이미지, 영상 등 다양한 데이터를 인식하고 처리할 수 있다.
이 전문가는 “바드의 안전장치 운영정책일 수도 있다”며 “특정 이름 혹은 단어에만 강력한 안전장치(하드 가드레일) 정책이 적용됐을 수도 있다”고 덧붙였다.
|
|
최경진 가천대학교 교수(한국AI법학회 회장)는 “충분한 정보가 없어서 답을 못하거나, 학습이 덜 됐을 가능성이 있다”며 “LLM 자체의 특성상 충분한 질문과 대화 맥락을 거치면서 답을 할 수 있으므로 성능이 떨어진다거나 하는 문제는 아니다”라고 설명했다.
구글은 바드의 한국어 이름 입력시 결과 오류와 관련해 아직 별다른 답을 내놓지 않고 있다. 구글코리아는 “현재 관련 내용을 논의 중”이라고 답했다.
한편 구글의 ‘복합 정보처리(멀티모달)’ AI 제미나이는 규모와 성능에 따라 울트라·프로·나노 등 3개 모델로 나뉜다. 이 가운데 제미나이 프로와 나노는 이미 출시됐으며 프로는 공개 당일부터 바드에 적용됐다. 가장 작은 크기의 버전인 나노는 스마트폰 등 모바일 기기에 특화된 모델로, 구글의 최신 스마트폰 ‘픽셀8 프로’ 에 적용됐다. 구글의 목표는 검색엔진, 광고 제품, 크롬 인터넷 브라우저에 제미나이 3개를 결합해 전 세계에서 사용할 수 있도록 하는 것이다.
구글은 바드에 울트라 버전을 적용해 내년 초 ‘바드 어드밴스드’라는 이름으로 출시할 예정이다.