Skip to content

음성 인식 (STT)

오토샌드 아바타

음성 입력을 기본 인터페이스로 사용하는 아바타의 경우, 연결 완료 시 자동으로 음성 인식을 시작할 수 있습니다.

js
SDK.onStatus((status) => {
  if (status === 'CONNECTED_FINISH') {
    SDK.startListening();
  }
});

startListening()

마이크를 활성화하고 음성 인식을 시작합니다.

js
SDK.startListening();

endListening()

음성 인식을 종료하고 마이크를 비활성화합니다. 인식된 텍스트가 있으면 아바타가 응답합니다.

js
SDK.endListening();

cancelListening()

음성 인식을 취소하고 마이크를 비활성화합니다. 인식된 텍스트를 폐기하고 아바타가 응답하지 않습니다.

js
SDK.cancelListening();

STT 관련 시그널

STT 세션과 발화 구간은 별개입니다

startListening() / endListening()STT 세션(마이크 ON/OFF)을 제어합니다. USER_SPEECH_STARTED / USER_SPEECH_STOPPED는 세션 내 발화 구간 감지이며, 마이크는 계속 켜져 있습니다. USER_SPEECH_STOPPED을 수신해도 STT 세션은 종료되지 않습니다. endListening()을 호출해야 종료됩니다.

js
SDK.onSignal((data) => {
  switch (data.signal) {
    case 'USER_SPEECH_STARTED':
      // 사용자가 말하기 시작 (마이크는 이미 켜져 있음)
      console.log('사용자 발화 시작');
      break;
    case 'USER_SPEECH_STOPPED':
      // 사용자가 말을 멈춤 (마이크는 여전히 켜져 있음)
      console.log('사용자 발화 종료');
      break;
    case 'STT_RESULT':
      console.log('인식 결과:', data.payload.text);
      break;
  }
});

전체 STT 흐름