Twilio Conversation Relay

「オペレーター(有人)」が存在しないストレスを解消する、人に優しい音声AI

音声AIを簡単にスタックに統合し、スムーズでパーソナライズされた顧客との会話を実現します。複雑なインフラストラクチャは不要で、AIが使いにくいということもありません。

Smiling woman speaking on the phone with a virtual agent interface overlay displayed.
Smiling woman speaking on the phone with a virtual agent interface overlay displayed.

Conversation Relayの音声AIを試す

Twilio Conversation Relayのしくみ

Diagram showing integration of Twilio Voice with a ConversationRelay API connecting to an app with TTS and STT components.
Diagram showing integration of Twilio Voice with a ConversationRelay API connecting to an app with TTS and STT components.

Twilioのスケーラブルなソリューションは、WebSocket APIによってシームレスにオーケストレーションされ、高速な音声認識(STT)および音声合成(TTS)機能と任意のAIを組み合わせています。

  • 長時間の一時停止や音声AIの終了を待つ必要がない

    Deepgram Flux、自動言語検出SSMLタグにより、不自然なデジタルの沈黙を解消します。低レイテンシーで会話の流れが途切れず、ロボットのような不自然な会話が大幅に減ります。

  • 自然な音声、ペーシング、イントネーション

    実際の人間のように聞こえる顧客との対話を実現し、複雑な問題についてはシームレスにオペレーター(有人)に転送できます。

  • パーソナライズされたサポートのコンテキストを追加

    AIオペレーターが顧客を認識し、対話を呼び出せるように、大規模言語モデル(LLM)でスムーズな入力/出力を実現します。

ライブの対話向けに構築

自然なペースで会話が流れるようにレイテンシーを最適化。

0.5秒未満

レイテンシーの中央値

0.725秒未満

全体の95%がこの値となる水準*

顧客を理解するAIサポートを構築

魅力的で親しみやすく、常にポイントを押さえた顧客体験を創出

簡単なセルフサービスサポートを提供

問い合わせを効率的に処理し、人間が介入するタイミングを正確に把握する、コンテキストを認識したインテリジェントな仮想オペレーターを実現します。

  • 日常的な問い合わせに対応すると同時に、顧客を引き付けながら顧客の不満を解消します。

  • 必要に応じて、複雑な問題や機密性の高い問題をオペレーター(有人)にエスカレーションします。

  • 顧客データをオーケストレーションし、パーソナライズされたコンテキストが豊富な対話を大規模に提供します。

Flowchart showing an incoming call, user data collection, virtual agent interaction, and sentiment analysis.
Flowchart showing an incoming call, user data collection, virtual agent interaction, and sentiment analysis.

Conversation Relayの機能

複雑さを軽減しながら、人間のような対話を大規模に実現します。

A dashboard showing a virtual agent and sentiment analysis results indicating positive sentiment.
A dashboard showing a virtual agent and sentiment analysis results indicating positive sentiment.

新機能

あらゆるやり取りを、コンテキストに沿った継続的な会話に変える

Conversation Relayは、TwilioプラットフォームのConversationsレイヤーの一部です。断片化された顧客とのやり取りを、チャネル、AIオペレーター、人間のオペレーター、時間をまたいでもコンテキストが失われない連続的な会話に変えられます。実際、永続的な顧客の記憶を通じて、やり取りを重ねるごとに賢くなっていきます。

  • ニーズに合わせたLLM統合

    独自のLLMを柔軟に利用できるため、UXを制御し、コストを管理し、新しいテクノロジーがリリースされるたびに迅速に導入できます。

  • 音声認識STT

    リアルタイムで音声をテキストに変換し、正確な文字起こしをLLMに提供して、応答性の高い会話を実現します。

  • 人間のように自然に聞こえるTTS

    発音、イントネーション、リズムを正確に再現することや、既存のテキスト読み上げ機能を利用してカスタマイズされた統合を実現することができます。

  • 割り込み処理

    調整可能な割り込み感度を使用し、騒がしい環境下でのオペレーターの反応を微調整できます。

  • グローバルな接続

    番号プロビジョニングの移植コンプライアンスを含む、柔軟で安全な接続を利用できます。

  • 低レイテンシーのインフラストラクチャ

    レイテンシーを最小限に抑えることで、音声AIの対話品質を向上させ、より優れた顧客体験を実現します。

  • 規制の厳しい業界でも安全に拡張

    PCI準拠のワークフローやHIPAA対応のアーキテクチャを構築し、コンプライアンスに準拠したソリューションをより迅速に展開できます。

音声AIオペレーターに命を吹き込む

包括的なAPI、ドキュメントと、ドラッグ&ドロップツールを使用して安全なAI音声フローを展開できるConversation Relay Studio Widgetをご覧ください。

<?xml version="1.0" encoding="UTF-8"?>

<Response>
  <Connect action="https://myhttpserver.com/connect_action">
    <ConversationRelay url="wss://mywebsocketserver.com/websocket" welcomeGreeting="Hi! Ask me anything!" />
  </Connect>
</Response>

Conversation Relayの設定にヘルプが必要ですか?

信頼できるパートナーの協力のもと、音声AIソリューションを設定し、優れたエンゲージメントの提供を開始できます。パートナーはこちら

AIが会話を強化します。Twilioが音声を処理します。

直感的なドラッグ&ドロップ式のStudio Widgetや包括的なAPIを使用して、安全な音声AIフローを展開すると、仮想オペレーターが提供すべきスマートで有意義な対話設計に集中できます。

A smiling man holding a phone to his ear, wearing a dark jacket and green shirt with a red background.
A smiling man holding a phone to his ear, wearing a dark jacket and green shirt with a red background.

Conversation Relayに関するFAQ

お客様が頻繁に直面する問題:

  • 複雑度が高い: リアルタイムのコミュニケーション、Webソケット、コーデックの管理
  • レイテンシーの問題: パフォーマンスとユーザー体験のバランス。
  • 統合の課題: スケーラビリティを維持しながら、TTS、STT、LLMソリューションをオーケストレーションする。

Conversation Relayは、技術的な障壁を最小限に抑え、合理化され、すぐに使用できるインフラストラクチャで、このような問題に対処します。

レイテンシーは音声AI対話の品質に直接影響します。レイテンシーが大きいと、予期しない一時停止や中断が発生し、顧客を不満にさせ、信頼を損なう可能性があります。Conversation Relayはレイテンシーを最小限に抑えるように最適化されており、顧客サポートと販売における重要な対話に不可欠な、人に優しいスムーズな会話を実現します。

  • Twilioプラットフォームにネイティブに統合された業界トップのプロバイダー
  • 専用のシングルテナントのカスタマイズされたインフラストラクチャが、コールエッジとメディアエッジに共存しています。
  • 割り込み処理、結果の事前取得、テキストトークンのバッチ処理を行う独自のオーケストレーションアルゴリズム。

Conversation Relayは、本番品質の音声AIオペレーターを簡単に構築できるように設計された、対話型AI製品です。音声認識(STT)、音声合成(TTS)、大規模言語モデル(LLM)オーケストレーションなどの主要コンポーネントを統合することで、開発プロセスを簡素化します。独自のメディアサーバー、オーケストレーション、統合を管理する必要があるメディアストリームとは異なり、Conversation Relayでは、低レイテンシーと優れた制御性を備えた使いやすいWebソケットインターフェイスを提供するため、音声AIソリューションの構築と拡張が容易になります。

音声合成プロバイダー

  • Google Voices
  • Amazon Voice
  • ElevenLabs Voices

自動音声認識

  • Google Speech API
  • Amazon Speech
  • DeepGram

Conversation Relayは、設定プロセスを簡素化する組み込みのパッケージとAPIを提供します。これにより、お客様は基盤となるインフラストラクチャに対応するのではなく、AIモデルとユーザー体験に集中できます。これらのクイックスタート構成は、一般的なユースケースに合わせてカスタマイズされているため、短期間でタイムトゥバリューを実現できます。

どのプロバイダーオプションが選択されているかによって異なります。

  • 地域化: Amazon、Google
  • US1: Deepgram
Conversation RelayはHIPAAに適合し、PCIに準拠しています。

*異なるモデルを使ったConversation Relay(p50 491 ms、p95 713 ms)を用いた社内ベンチマークに基づく。結果は異なる場合があります。