音声認識

音声をテキストに変換し、あらゆる音声通話中に、その意図を分析します。従量制料金でご利用いただけます。

音声テキスト変換の仕組み

<Response>
    <Gather input=”speech”
             action=”/finalresult” 
             partialResultCallback=”/partialResult”> 
    <Say>Say ahoy to Twilio Speech Recognition!</Say>
    </Gather>
<Response>

簡単な<Gather>コマンド1つで、音声認識APIが音声をリアルタイムでキャプチャし、テキスト化して返します。

リアルタイムでテキスト化

自動音声認識(ASR)の追加は簡単です。

トレーニングは不要です

事前にトレーニングしなくても、さまざまな業界固有の言葉やフレーズを、そのままテキスト化します。

ストリーミング結果

顧客の話に沿ってその部分的な認識結果から動作する、応答性に優れた音声アプリケーションを構築できます。

複数言語

119の言語とその方言を認識し(まもなく、さらに多くの言語に対応)、グローバルなユーザー基盤をサポートします。

ユースケース

メニューの操作や情報収集に、顧客はそれぞれの母国語の使用を選べます。

  • Chat bubble with clock
    IVR

    複雑に枝分かれした電話の転送先の把握も、「本日はどのようなご用件しょうか?」というシンプルな音声プロンプトにまとめられます

  • Mobile notification
    音声検索

    顧客がナレッジベースにダイヤルインして、必要な答えを得られるようにします

  • User speech bubble
    フォームへの記入

    ASRを使用して、顧客への質問とその応答をフォームに記入し、見込み客の絞り込みを行います。

料金

初期費用なしの従量課金

標準モデル

$0.02

<Gather>15秒あたり

拡張モデル*

$0.02

<Gather>15秒あたり

音声を収集する<Gather>の最長継続時間は60秒です。
<Gather>10万回/月の年間契約。

Twilioの優位性

Business connecting to customer through preferred communication channels
Business connecting to customer through preferred communication channels

*プレミアムでは、phone_callモデルのみご利用いただけます