Twilioのスケーラブルなソリューションは、WebSocket APIによってシームレスにオーケストレーションされ、高速な音声認識(STT)および音声合成(TTS)機能と任意のAIを組み合わせています。
-
-
自然な音声、ペーシング、イントネーション
実際の人間のように聞こえる顧客との対話を実現し、複雑な問題についてはシームレスにオペレーター(有人)に転送できます。
-
パーソナライズされたサポートのコンテキストを追加
AIオペレーターが顧客を認識し、対話を呼び出せるように、大規模言語モデル(LLM)でスムーズな入力/出力を実現します。
ライブの対話向けに構築
レイテンシーの中央値
全体の95%がこの値となる水準*
Conversation Relayの機能
新機能
あらゆるやり取りを、コンテキストに沿った継続的な会話に変える
Conversation Relayは、TwilioプラットフォームのConversationsレイヤーの一部です。断片化された顧客とのやり取りを、チャネル、AIオペレーター、人間のオペレーター、時間をまたいでもコンテキストが失われない連続的な会話に変えられます。実際、永続的な顧客の記憶を通じて、やり取りを重ねるごとに賢くなっていきます。
-
ニーズに合わせたLLM統合
独自のLLMを柔軟に利用できるため、UXを制御し、コストを管理し、新しいテクノロジーがリリースされるたびに迅速に導入できます。
-
音声認識STT
リアルタイムで音声をテキストに変換し、正確な文字起こしをLLMに提供して、応答性の高い会話を実現します。
-
人間のように自然に聞こえるTTS
発音、イントネーション、リズムを正確に再現することや、既存のテキスト読み上げ機能を利用してカスタマイズされた統合を実現することができます。
-
割り込み処理
調整可能な割り込み感度を使用し、騒がしい環境下でのオペレーターの反応を微調整できます。
-
グローバルな接続
番号プロビジョニングの移植コンプライアンスを含む、柔軟で安全な接続を利用できます。
-
低レイテンシーのインフラストラクチャ
レイテンシーを最小限に抑えることで、音声AIの対話品質を向上させ、より優れた顧客体験を実現します。
-
規制の厳しい業界でも安全に拡張
PCI準拠のワークフローやHIPAA対応のアーキテクチャを構築し、コンプライアンスに準拠したソリューションをより迅速に展開できます。
音声AIオペレーターに命を吹き込む
包括的なAPI、ドキュメントと、ドラッグ&ドロップツールを使用して安全なAI音声フローを展開できるConversation Relay Studio Widgetをご覧ください。
AIが会話を強化します。Twilioが音声を処理します。
直感的なドラッグ&ドロップ式のStudio Widgetや包括的なAPIを使用して、安全な音声AIフローを展開すると、仮想オペレーターが提供すべきスマートで有意義な対話設計に集中できます。
お客様が頻繁に直面する問題:
- 複雑度が高い: リアルタイムのコミュニケーション、Webソケット、コーデックの管理
- レイテンシーの問題: パフォーマンスとユーザー体験のバランス。
- 統合の課題: スケーラビリティを維持しながら、TTS、STT、LLMソリューションをオーケストレーションする。
Conversation Relayは、技術的な障壁を最小限に抑え、合理化され、すぐに使用できるインフラストラクチャで、このような問題に対処します。
レイテンシーは音声AI対話の品質に直接影響します。レイテンシーが大きいと、予期しない一時停止や中断が発生し、顧客を不満にさせ、信頼を損なう可能性があります。Conversation Relayはレイテンシーを最小限に抑えるように最適化されており、顧客サポートと販売における重要な対話に不可欠な、人に優しいスムーズな会話を実現します。
- Twilioプラットフォームにネイティブに統合された業界トップのプロバイダー
- 専用のシングルテナントのカスタマイズされたインフラストラクチャが、コールエッジとメディアエッジに共存しています。
- 割り込み処理、結果の事前取得、テキストトークンのバッチ処理を行う独自のオーケストレーションアルゴリズム。
Conversation Relayは、本番品質の音声AIオペレーターを簡単に構築できるように設計された、対話型AI製品です。音声認識(STT)、音声合成(TTS)、大規模言語モデル(LLM)オーケストレーションなどの主要コンポーネントを統合することで、開発プロセスを簡素化します。独自のメディアサーバー、オーケストレーション、統合を管理する必要があるメディアストリームとは異なり、Conversation Relayでは、低レイテンシーと優れた制御性を備えた使いやすいWebソケットインターフェイスを提供するため、音声AIソリューションの構築と拡張が容易になります。
音声合成プロバイダー
- Google Voices
- Amazon Voice
- ElevenLabs Voices
自動音声認識
- Google Speech API
- Amazon Speech
- DeepGram
Conversation Relayは、設定プロセスを簡素化する組み込みのパッケージとAPIを提供します。これにより、お客様は基盤となるインフラストラクチャに対応するのではなく、AIモデルとユーザー体験に集中できます。これらのクイックスタート構成は、一般的なユースケースに合わせてカスタマイズされているため、短期間でタイムトゥバリューを実現できます。
どのプロバイダーオプションが選択されているかによって異なります。
- 地域化: Amazon、Google
- US1: Deepgram