ホーム > 学部・大学院 > 大学院 技術科学研究科 > 産業技術学専攻 > s2114:情報保障のための音声言語処理特論

s2114:情報保障のための音声言語処理特論

授業科目名 情報保障のための音声言語処理特論
英 訳 Spoken Language Processing for Information Accessibility
科目番号 S2114 科目区分 専門科目 ■コース指定選択科目
標準履修年次 1年次 単位数 2単位
授業の形式 講 義
担 当 教 員 小林 彰夫
授業の概要 情報保障を目的とした音声言語処理技術のうち,音を文字に変換する音声認識を重点的に学ぶ。まず,音声言語を扱うための基礎知識(音声の生成機構と信号処理,音声とテキストの解析手法)を理解する。次に,音声認識(統計的音響・言語モデル,探索)の動作原理を学ぶ。最後に,音声言語処理の産業上の応用事例を通じ,情報保障への理解を深める。
授業の到達目標 基本的な音声・テキスト処理を理解すること。音声認識の動作原理(データに基づく統計的手法)を理解すること。音声言語に関わる社会的課題に対して,問題解決のための工学的な手法を考案できるようになること。問題解決にあたり,初歩的な学術書や入門書を独力で読めるようになること。以上を到達目標とする。
受 講 条 件 なし
教材、参考書 参考書:「音声言語処理と自然言語処理」(コロナ社,ISBN 978-4-339-02469-2)
成績評価方法 定期試験およびレポート課題(評価の80%)。講義内でのリアクションペーパーの提出(評価の20%)
キーワード 音声,音声言語,信号処理,音声認識,機械学習,情報保障




担当教員 授 業 内 容
1 小林彰夫 「講義の概要〜情報保障のための音声言語処理〜」:講義の概要と到達目標について
2 小林彰夫 「音声と信号処理」:信号の諸性質(振幅や位相),音声の生成機構,音声分析の手法,音声に含まれる諸情報(継続時間や高さ)を学ぶ。
3 小林彰夫 「音声言語処理の基礎」:音素による言語音の弁別に始まり,言語を理解するために必要な語彙,形態素の概念および書き言葉と話し言葉の違いを学ぶ。
4 小林彰夫 「音声認識〜イントロダクション〜」:音声認識技術の全体像を俯瞰し,分析技法やデータ収集,統計的モデルといった各要素の位置付けを理解する。
5 小林彰夫 「音声認識〜統計的音響・言語モデル〜」:音声認識の音響モデル(特徴量抽出手法,隠れマルコフモデル)と言語モデル(n-gram)を学ぶ。
6 小林彰夫 「音声認識〜データの収集と処理〜」:統計的音響・言語モデルの学習を行うためのデータ(音声・テキスト)収集方法,処理方法を学ぶ。
7 小林彰夫 「音声認識〜ニューラルネットワーク〜」:統計的音響モデルの具体的な実現方法として,ニューラルネットワークに基づく音素の推定方法を学ぶ。
8 小林彰夫 「音声認識を利用した情報保障技術」:テレビジョン放送の字幕を作成する実用的なシステムを概観する。情報保障分野で音声認識技術がどのように使われているかを学ぶ。      
9 小林彰夫 「音声認識を利用した産業応用」:スマートスピーカーや対話システムで使われる情報検索技術や利用者とのインタラクション技術について,産業上の事例に基づいて学習する。
10 小林彰夫 「感情音声の認識」:音声認識における韻律情報(音の高さやパワー)を学び,音声から喜びや悲しみといった感情を推定する方法について学習する。
11 小林彰夫 「音環境の理解」:環境音を認識し,理解することを目的とした音響イベント認識技術に関して,最新の研究事例を通じて学ぶ。
12 小林彰夫 「音声認識の課題」:音声認識の性能改善を妨げる要因(背景雑音・残響)を理解し,これらの影響を低減するための手法について学ぶ。
13 小林彰夫 「音声合成」:文字から音声を生成する音声合成の技術について学ぶ。音声の情報(アクセント),言語の情報(係り受け)が音声合成に重要な要素であることを理解する。
14 小林彰夫 音声合成を利用した情報保障技術」:最新の研究開発事例である「ガイド音声による視覚障害者への情報保障」について学び,音声言語処理技術の応用の広がりを理解する。
15 小林彰夫 「講義の振り返りと今後の学習」:リアクションペーパーや課題レポートの講評を元に,音声言語処理技術を活用できる社会的課題について考える。