Feed元
Azure AI Services
AI 要約
MicrosoftはAzure AI Speechの新しいマルチモーダル機能を発表。音声解析、迅速な音声認識、ビデオ翻訳、多言語音声翻訳、個人音声の一般提供を含む。顧客との会話分析、音声転写、ビデオコンテンツ翻訳、言語切替、カスタム音声作成が可能。
年月週
2024年5月4週
リンク
記事概要
Microsoftは、Azure AI Speechの新しいマルチモーダル機能を発表しました。これには、音声解析、迅速な音声認識、ビデオ翻訳、多言語音声翻訳、個人音声の一般提供が含まれます。
記事要約
- 音声解析は、顧客との会話を分析し、インサイトを提供する新機能です。
- 迅速な音声認識APIは、大規模な音声転写を高速で行います。
- ビデオ翻訳は、ビデオコンテンツの翻訳を効率的に行います。
- 多言語音声翻訳は、同一音声ストリーム内での言語切替をサポートします。
- 個人音声機能は、短い音声サンプルからカスタム音声を作成できます。
用語
用語 | 説明 |
音声解析 | 音声データを分析し、インサイトを提供する技術 |
音声転写API | 音声ファイルを高速でテキスト化するAPI |
ビデオ翻訳 | ビデオコンテンツの多言語翻訳を行うサービス |
多言語音声翻訳 | 複数言語の音声翻訳をサポートする技術 |
個人音声 | カスタム音声を作成する機能 |