하모니넷

테바소프트, 음성인식 인터페이스 표준 포맷 ‘ACK2022’ 학회에서 발표

테바소프트는 11월 3일부터 5일까지 3일간 열림 ACK (Anuunal Conference of KIPS) 2022 학술대회에 음성인식 활용성 증진을 위한 인터페이스 표준 포맷에 대한 연구결과를 발표했다. 

최근 많은 기기들에서 음성인식 기능을 탑재하기 시작하면서, 음성인식 서비스에 대한 수요가 늘어남에 따라서, 주요 인터넷 업체들과 음성인식 전문업체들에서 SaaS(Software as a Service)를 통한 음성인식 서비스 제공이 늘어나고 있다. 음성인식은 어느 분야에 대한 음성을 더 많이 수집하고, 학습하였는가에 따라 성능이 결정되기 때문에, 인터넷 업체별로 자신들의 강점 분야가 생기게 되었다. 따라서, 음성인식 서비스를 제공하는 기업 입장에서는 다양한 음성인식 서비스 제공업체 중에서 가장 적합한 서비스를 골라서 적용해야 하는데, 이럴때마다 인터페이스 방식이 달라서 적용하는데 어려움을 겪어왔다. 이에 대한 인터페이스 표준 포맷을 활용하여 여러 음성인식 서비스를 성능에 따라서 활용할 수 있는 방안을 제시했다는 점에서 이번 논문의 의미가 깊다고 할 수 있다.

이번에 논문발표를 한 테바소프트의 이병훈 기술이사는, “음성인식 기반으로 대화분석을 수행하는 finger.ai를 개발할 때, 음성인식 서비스 마다 성능차이가 있어서 다양한 음성인식 서비스를 비교하고 선택하는 과정을 거치었다. 예를 들면, 한국어는 네이버가 가장 우수하고, 영어는 구글이 우수하고, 의료분야는 AWS가 좋으며, 가격은 음성인식 전문 업체의 서비스가 저렴했다. 이 중에서 우리 서비스의 목적에 맞게 여러개의 서비스를 활용하다 보니, 공통 인터페이스의 필요성이 대두되어, 인터페이스 표준에 대한 연구를 수행하고, 그 결과를 발표하게 되었다. 우리가 제시한 인터페이스 표준을 활용하여 많은 기업이 음성인식 서비스를 쉽게 활용할 수 있는데 기여할 수 있으면 좋겠다.”라고 말하였다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

하모니넷