静岡大学 社会連携シーズ
音声メディア利活用のための音声言語情報処理技術
長時間の実環境センサーデータからの知識獲得と利用
音声メディア利活用のための音声言語情報処理技術
長時間の実環境センサーデータからの知識獲得と利用
キーワード
自動音声認識、音声検索、自動字幕、AI応用、長時間センサーデータ
研究内容
音声言語情報処理の基礎および応用技術の開発
・ 深層学習(AI技術)による話し言葉の自動音声認識システム、様々な言語・環境で利用可能にする適応学習技術、検索語例示による長時間録音中の類似区間の検索(音声文書検索)技術
・ 多人数の発言や環境雑音を含む録音データからの話者分離や自動字幕出力、新しい用語検出と学習等の編集支援技術 など
メディア・センサー情報を対象とした知能情報処理応用技術の開発
・ 長時間データから様々な音の種類(音響イベント)や行動の区間を同定する技術
・ 音声聴取時または想起時の脳波信号を利用した脳内活動の特徴表出の学習と認識の技術 など
社会連携に向けたアピールポイント
◆特筆すべき研究ポイント
・近年の深層学習(AI技術)の進展に関わりが深い音声・言語処理技術(音声認識・検索・自動字幕化など)の開発実績
・実環境の収録音声データ(電話収録音声、講演・講義音声、多人数会議音声、など)やセンサー信号(運転行動信号や脳波信号など)を対象とした研究開発事例
・企業のための実環境運用向けのシステム実装を含むソフトウェア開発の実績(コールセンター向けの最適化)
最近のAI技術の進展によってコンピュータによる音声言語やセンサー信号の処理技術は高い能力をもつようになってきました。音声や周囲のセンサー信号を活用することで、人間の知的活動に役立てたり社会活動をもっと豊かにしたりする仕組みを作っていくことを支援できればと思っています。
◆関連書籍等
音声言語処理と自然言語処理(増補)(共著), コロナ社, 2018.
SDGs目標
年度
2026~
関連URL
- 教員氏名
- 甲斐充彦
- フリガナ
- カイ/アツヒコ
- 所属
- 学術院工学領域
- 職名
- 准教授
- 研究分野
-
- 情報通信知能情報学
- 情報通信知覚情報処理
- 情報通信ヒューマンインタフェース、インタラクション