NEC、映像・音声コンテンツを話題ごとに自動分類する技術を開発
NECは、映像・音声コンテンツに含まれる音声からトピックの変化を検出し、映像・音声コンテンツを話題ごとに分割する「トピック分割技術」を開発した。
この技術は、コンテンツの音声をテキストに変換する技術と、変換したテキストをトピック毎に分類する技術によって構成されている。
大量のコンテンツの中から目的のシーンを検索する技術では、これまで、番組にメタデータを付与し、キーワード検索する方法が主に検討されてきた。NECでは、この方法について、「メタデータ作成に大きなコストがかかるほか、キーワードを用いた単純な検索では、意味のある単位での視聴が容易ではない、といった問題点がある」と指摘。
新技術では、話題が違えば語やフレーズの出現傾向も違うという「話題間の差異」に着目してトピックを分類することにより、政治・芸能・スポーツなど話題の具体的内容に影響されることなく分割できる。
また、一連の話題の移り変わりを数理的なモデル(隠れマルコフモデル)で表現し、話題の変化点をコンテンツ全体から総合的に判断することにより、話題が変わる頻度に関わらず安定して高い性能を実現するという。さらに、人工知能分野の最新の学習アルゴリズム(変分ベイズ法)を応用することにより、多くの語彙を含む複雑なコンテンツに対しても高い精度で話題の変化を検出できる、としている。
(Phile-web編集部)
この技術は、コンテンツの音声をテキストに変換する技術と、変換したテキストをトピック毎に分類する技術によって構成されている。
大量のコンテンツの中から目的のシーンを検索する技術では、これまで、番組にメタデータを付与し、キーワード検索する方法が主に検討されてきた。NECでは、この方法について、「メタデータ作成に大きなコストがかかるほか、キーワードを用いた単純な検索では、意味のある単位での視聴が容易ではない、といった問題点がある」と指摘。
新技術では、話題が違えば語やフレーズの出現傾向も違うという「話題間の差異」に着目してトピックを分類することにより、政治・芸能・スポーツなど話題の具体的内容に影響されることなく分割できる。
また、一連の話題の移り変わりを数理的なモデル(隠れマルコフモデル)で表現し、話題の変化点をコンテンツ全体から総合的に判断することにより、話題が変わる頻度に関わらず安定して高い性能を実現するという。さらに、人工知能分野の最新の学習アルゴリズム(変分ベイズ法)を応用することにより、多くの語彙を含む複雑なコンテンツに対しても高い精度で話題の変化を検出できる、としている。
(Phile-web編集部)