김소의 올리브스톤 책임

▲ 김소의 올리브스톤 책임

[컴퓨터월드] 전자문서에 대한 관심이 높아지고 있다. 종이문서를 대체하면서 시간과 공간의 제약없이 누구나사용할 수 있기 때문이다. 전자문서 전문업체인 포시에스와 UX 및 디자인 전문업체인 올리브스톤이 협업으로 진행한 음성 인식 사용자 경험 기반의 지능형 전자문서 클라우드 플랫폼 개발 프로젝트 역시 업계의 관심을 받았다.

여기에서는 전자문서 클라우드 서비스인 eformsign과 패키지 솔루션인 OZ e-Form의 제품을 바탕으로 한 음성 사용자 경험(Voice UX, 이하 VUX)이 전자문서에 어떻게 접목됐는지 알아본다.


1. AI 스피커로 전자 문서를 작성할 수 있을까?

카카오, 라인, 구글, 누구, 빅스비 등 AI 스피커 종류가 다양해 지면서 사용자 역시 크게 늘어나고 있다. AI 스피커에서 가장 많이 쓰이는 기능은 음악을 재생하거나 날씨, 뉴스 등을 묻거나 전화를 거는 등의 간단한 작업이다.

그렇다면 PC나 스마트 태블릿에서 많이 이용하는 전자 문서를 AI 스피커를 이용해 작성할 수 있을까? 이 때 필요한 프로세스와 어려운 점은 무엇인지에 대해 알아보고 이에 대한 시나리오를 작성했다.

시나리오는 크게 서비스 전체를 아우르는 <서비스 처리>와 문석 작성의 세부 사항인 <문서 작성 처리>로 구성했다.


전자문서 서비스 메뉴 트리

클라우드 전자문서 eformsign 서비스의 프로세스는 크게 진입-인트로-문서 작성-문서 처리-문서 검색 종료로 구분하고, 문서 작성/문서 처리/문서 검색을 서비스 이용 순서와 각 메뉴의 기능으로 나누었다.

▲ 메뉴트리 네비게이션

각 Task와 하위의 의도 Task로 분류하고 분기되는 케이스에 따라 조건 Task로 나누어 작성했다. 사용자 발화에는 대표 명령어와 다양한 대체 명령어를 정의해 유사어를 인식할 수 있도록 하고 각 Task에 필요한 서비스 정책, 스피커 정책, 화면 정책, 음성 설정을 정의해 기준을 세울 수 있도록 했다.

▲ 시나리오 예시


2. 사용 가능한 플랫폼의 종류

전자 문서의 작성과 관련해 사용 가능한 플랫폼에 대해서도 연구 및 개발이 이루어졌다.

은행이나 관공서에서 가장 많이 사용하는 태블릿 PC는 사용자에게 가장 익숙한 디바이스이다. 태블릿 PC는 특히 필기 인식이 용이해 종이와 가장 유사한 사용성을 보인다. 스마트폰 역시 익숙한 디바이스로 애플리케이션을 사용할 수도 있고 카카오톡, 페이스북 메신저 등의 챗봇을 활용해 보다 친근하고 간편하게 전자 문서를 작성할 수 있다.

스마트 워치도 사용이 늘어나고 있는 디바이스 중 하나다. 앞서 연구한 스피커와 비슷한 음성인식 서비스를 도입할 수 있는데다 디스플레이를 겸하고 있어 보다 정확하며 휴대가 편리하다는 장점을 갖고 있다.

홈 디바이스로는 TV의 음성인식 기능을 이용한 3rd Party 앱으로 전자문서 작성을 접목시킬 수 있다.

▲ 오즈 이-폼 필기를 통한 문서 작성 예시


3. 그 밖의 활용 범위

위치 기반 서비스를 활용한 전자 문서

사례 1. 위치 정보 식별
Situation: 사용자가 특정 장소에 도착했을 때 서비스가 활성화됨
Technology: 위치 정보 식별 기술, 위치 기반 서비스 호출 및 알람
Example: 인력 관리, 자산 관리, 위치기반 광고

[예상 시나리오]

1. 특정 위치 방문 시 이벤트 발생 알림
■사용자가 지정한 위치 도달 시 푸시 알람 제공
■임산부 접근 시 임산부석에 부착된 수신기 점등으로 알람 제공
■이벤트 발생 시, 화면 및 음성 안내 동시 제공

2. 허가된 위치에서만 문서 작성 및 결재

■설정한 위치에 이탈/재 입장 시 알람 제공

3. 현장 관리 사원이 기기를 들고 현장에 도착했을 때, 중간 관리자에게 알람
■위치 트레킹
■사용자 또는 제3자가 이동 경로 및 위치 정보 확인 가능


사례 2. 위치 정보 저장

Situation: 사용자의 위치 정보를 저장하여 서비스에 활용
Technology: 위치 정보 저장, 위치 정보 확인
Example: 서명 위치 저장, 문서 생성 위치 확인, 사진 촬영 위치 확인 등

[예상 시나리오]

1. 특정한 위치 정보를 별도로 관리
■위치 정보를 용도에 따라 분류해 저장 가능

2. 저장한 위치 정보 선택 시, 지도/상세 정보 화면으로 연결
■저장한 위치 정보 선택 시, 해당 위치에 대한 상세 정보 확인 가능
■작성 문서 및 입력한 파일/사진 등의 위치 정보 확인
■위치 정보를 문서/파일/사진에 표시

위치 기반 서비스의 UX 개발 방향

o인지(Awareness)
- 음성 안내, 팝업/푸시 알림으로 사용자가 지정한 위치에 도달/이탈 했음을 인지시킴

o연결성(Connectivity)
- 이동 중에도 서비스가 매끄럽게 연결됨
- 위치 선택 시 해당 정보에 대한 지도/상세 정보 화면으로 Seamless한 연결

o추적(Tracking)
- 사용자의 이동 경로 및 위치 정보 저장
- 사용자 이외의 제3자도 사용자의 위치 정보와 이동 경로를 열람

o 관리(Management)
- 자주 사용하는 위치 정보는 별도로 관리
- 보안 이슈에 대비하여 위치 정보 표시 기능을 사용자가 설정에서 직접 관리


4. 음성 인식 및 여러 디바이스를 활용한 전자 문서 프로토타입의 사용성 평가

프로토타입의 보완을 위해 사용성 평가를 진행했다. 총 26명의 사용자를 전문가/비전문가 그룹으로 나누었고 설문지를 통한 정량적 평가를 실행했다. 성별, 연령대, 비교군은 다음과 같다.

▲ 성별, 연령대, 비교군

1) 사용자들의 음성 인식 서비스에 대한 인지도 및 경험 파악을 위한 사전 설문

[음성 인식 서비스 인지도와 사용 경험]
- 전문가/비전문가 그룹과 무관하게 모두 음성 인식 서비스 알고 있었음
- 71%의 사용자만이 실제 이용 경험 있음 (그 중 53%만이 꾸준히 사용 중)
- 기술적인 측면이 아닌 환경이나 감성적인 요인으로 사용하지 않는 이유도 있음

[음성 인식 서비스 사용 이유와 빈도수]
- 사용 이유: 재미 있어서, 혼자 있을 때 외롭지 않아서, 간단한 작업을 해결, 두 가지 이상의 작업이 가능해서, 음성작업이 더 빨라서(꼭 필요한 기능 때문이 아니어도 대화를 시도하는 것을 알 수 있었음)
- 사용 빈도: 높지는 않으나 사용에 익숙한 사용자들은 매일 사용한다는 것을 알 수 있었음

[사용하는 상황과 기능]
- 사용하는 상황: 타이핑이 귀찮을 때 사용, 운전할 때, 심심할 때, 웨어러블 디바이스를 사용할 때
- 주로 사용하는 기능: 전화, 날씨 확인, 길 찾기, 인터넷 검색, 문자, 음악 재생, 알람 설정

[음성 인식 서비스의 편리성]
- 자주 사용하는 사용자 그룹이 편리함을 언급


2) 필기

- 장점
o입력한 값이 바로 보이는 점
o빠르고 정확함
o항목을 선택하는 부분이 편함
o일부 삭제가 되어서 좋음
o종이보다 편리

- 단점
o어르신들에게는 어려울 수 있음
o한글과 숫자의 오인식
o삭제 기능 인식 부족
o종이와 다른 느낌

-추가되었으면 하는 제스처 및 기능
o숫자 콤보 박스로 선택
o첨삭 기능
o자동으로 입력되는 하이픈
o지우개 등 수정 기능
o부분 오탈자 자동 수정

►사용자 의견
“규칙 필요 부분은 입력박스에 가이드가 필요해요”
“직업, 주소 찾아보기 등의 빠른 목록 선택이 가능하면 훨씬 편리할 것 같아요”
“글씨를 쓸 때 확대 기능이 필요해요”
“더 다양한 제스처가 있었으면 좋겠어요”
“긴 문장은 시간이 더 필요해요”
“흘림체나 글씨를 잘 못쓰더라도 인식되는 기능이 필요해요”
“공공시설이나 다양한 곳에서 사용하고 싶어요”


3) 챗봇

- 장점
o익숙한 폰 사용법으로 작성
o빠른 반응 속도
o타자를 입력
o입력 시 바로 보이는 답안
o입력의 정확성
o버튼형 선택 방식

- 단점
o관심사를 하나씩 입력
o하이픈 입력
o질문 내용이 헷갈림
o입력 가이드나 길게 입력해야 하는 부분에서 선택 입력 없음

►사용자 의견
“질문과 예시가 분리되어 보이면 좋겠어요”
“입력 가이드와 그래픽적 요소가 있었음 좋겠어요”
“복수 응답은 한번에 여러 개 선택하는 게 필요해요”
“하이픈이 자동 입력됐으면 좋겠어요”

▲ 다양한 형태의 디바이스


4) 스피커

- 장점
o간단한 명령만으로 문서 작성
o생각보다 빠른 반응 속도와 정확한 발음
o음성을 인식하고 바로 표현함
o손이 자유로움
o처음이라 신기함

- 단점
o잘못 입력 시 취소할 수 없음
o길게 이야기할 때 인식 못함
o특정 발음은 잘 못 알아들음
o여러 번 반복해야 할 때 불편함
o말의 빠르기 조절이 필요함

►사용자 의견
“기다리는 부분이 답답해요”
“입력 오류 시 수정할 수 있었음 좋겠어요”
“답변 확인할 때 속도 조절이 필요할 것 같아요”
“남성이나 여성 음성 종류를 선택할 수 있었음 좋겠어요”
“주소 입력할 때 시군동과 세부 주소를 나누면 더 정확할 것 같아요”
“잠시 기다리라는 멘트가 필요해요”
“보기 항목같은 안내가 더 간결하고 자연스러웠으면 좋겠어요”


5) 스마트 워치

- 장점
o터치와 음성을 모두 사용할 수 있어 편리함
o워치의 편의성
o빠르고 간결함
o로딩이 짧음
o터치 시 반응이 만족스러움
o디자인이 좋음

- 단점
o숫자 입력이 불편함
o길게 입력해야 하는 주소 등은 어려움
o발음이 정확해야 입력됨
o글씨와 버튼의 사이즈가 작음
o스크롤이 불편함
o음성과 터치의 반복적인 부분

►사용자 의견
“화면을 보지 않고도 입력할 수 있었음 좋겠어요”
“수정 기능이 필요할 것 같아요”
“선택하는 부분은 좋은데 음성으로 입력하는 게 어려워요”
“글씨와 버튼의 사이즈를 조절할 수 있었으면 좋겠어요”
“항목 나열이 간소화되었음 좋겠어요”

▲ 각 디바이스 솔루션의 특징

6) 전체 디바이스에 대한 의견
- 종이 문서보다 스마트 기기 이용이 더 편리한가에 대한 질문: 대체적으로 스마트 기기 선호
- 사용이 편리했던 기기: 1순위-필기 → 2순위-챗봇 → 3순위 스마트-워치 → 4순위-스피커
- 사용법이 쉬운 기기: 1순위-필기 → 2순위-챗봇 → 3순위 스마트-워치 → 4순위- 스피커

[에러 포인트]
- 요구하는 규칙이 많을수록 오류발생률 증가
ex) 생년월일 입력 시 ‘-’ 요구, 한/영 중 하나만 입력 가능 등
- 입력 값이 길어질수록 오류발생률 증
ex) 주소 발화 도중 입력, 주소 입력 중 오류 등

▲ 에러포인트

[사용성 평가 결과]

사용 이전의 “음성 인식 서비스는 부정확 하고 불편하다”, “접할 기회가 없고 사용 방법을 모른다”라는 의견에서 “생각보다 정확하고 빨라서 편리하다”, “처음 사용해 보는데 어렵지 않다”로 음성인식 서비스에 대한 편견이 많이 사라지고 친근함을 보였다. 이후 서비스를 발전시켜 나가면서 3가지 관점으로 사용자의 입장에서 개선할 필요성이 느껴진다.
-누구나 쉽게 사용 가능
-감성적인 부분의 발전 가능성
-음성과 시각의 자유로운 사용

▲ 이폼사인 서비스에 음성을 통한 문서 작성 예시


5.전자문서 음성인식 서비스의 발전 방향

포시에스 전자문서 클라우드 서비스인 eformsign과 패키지 솔루션인 OZ e-Form의 제품의 음성, 필기, 챗봇, 스마트 워치 등 다양한 프로토타입의 사용성 평가를 통해서 사용자들이 지니고 있는 음성인식 서비스에 대한 어려움은 단지 기술적인 부분에만 있는 것이 아니라 정서적이고 감성적인 부분에도 해당된다는 것을 알 수 있었다.

종이 문서 또한 사람들에게는 부담으로 다가올 수도 있는데, 스마트 기기를 사용해서 작성하는 것이 처음에는 어렵게 느낄 수밖에 없었을 것이다. 하지만 직접 기기를 사용해보고 음성으로 명령을 내려보니 쉽고 재미를 느끼는 사용자들이 많았고, 사용 전보다 사용 후에 긍정적으로 인식이 변화하는 것을 알 수 있었다.

사용자마다 생활 환경이 다르고, 추구하는 사용법 역시 차이가 있을 수밖에 없다. 때문에 음성 명령만으로 두 손을 자유롭게 사용하거나, 가장 친근한 방법으로 스마트 기기를 접하거나, 종이와 가장 유사한 환경에서 전자문서를 작성하고 처리하는 등 사용자 개개인에게 가장 적합한 방식을 선택하여 사용할 수 있게 됨으로써 환경과 시간에 제약을 받지 않으면서 문서를 작성할 수 있게 되었다.

현재 여러 분야의 다양한 환경에서 각종 디바이스를 이용해 전자문서를 작성하고 있다. 앞으로 음성인식을 이용해 보다 편리한 서비스를 기대해 본다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지