新しいマルチモーダル機能の発表: Azure AI Speech

Feed元

Azure AI Services

AI 要約

MicrosoftはAzure AI Speechの新しいマルチモーダル機能を発表。音声解析、迅速な音声認識、ビデオ翻訳、多言語音声翻訳、個人音声の一般提供を含む。顧客との会話分析、音声転写、ビデオコンテンツ翻訳、言語切替、カスタム音声作成が可能。

年月週

2024年5月4週

リンク

Announcing new multi-modal capabilities with Azure AI Speech

Customers continue to innovate with Azure OpenAI and Azure AI Speech. They are bringing new efficiencies into their enterprise and building new multimodal..

techcommunity.microsoft.com

Announcing new multi-modal capabilities with Azure AI Speech

記事概要

Microsoftは、Azure AI Speechの新しいマルチモーダル機能を発表しました。これには、音声解析、迅速な音声認識、ビデオ翻訳、多言語音声翻訳、個人音声の一般提供が含まれます。

記事要約

音声解析は、顧客との会話を分析し、インサイトを提供する新機能です。
迅速な音声認識APIは、大規模な音声転写を高速で行います。
ビデオ翻訳は、ビデオコンテンツの翻訳を効率的に行います。
多言語音声翻訳は、同一音声ストリーム内での言語切替をサポートします。
個人音声機能は、短い音声サンプルからカスタム音声を作成できます。

用語

用語	説明
音声解析	音声データを分析し、インサイトを提供する技術
音声転写API	音声ファイルを高速でテキスト化するAPI
ビデオ翻訳	ビデオコンテンツの多言語翻訳を行うサービス
多言語音声翻訳	複数言語の音声翻訳をサポートする技術
個人音声	カスタム音声を作成する機能