
マイページに作品情報をお届け!
音声認識
オンセイニンシキ
- 著: 篠田 浩一
音声の信号処理についての知識ゼロでも読めるように、懇切丁寧に解説した。基礎理論はコンパクトにまとめ、「耐雑音」「話者認識」「深層学習」についてたっぷり解説。一気に実用が進んだ音声認識分野がこれ一冊で学べる!
■おもな内容
第1章 音声とは
第2章 音声分析
第3章 音声認識とは
第4章 隠れマルコフモデル
第5章 言語モデル
第6章 大語彙連続音声認識
第7章 耐雑音音声認識
第8章 話者適応と話者認識
第9章 深層学習
■機械学習プロフェッショナルシリーズ
本シリーズでは、発展著しい機械学習技術の数学的な基礎理論、実用的なアルゴリズム、それらの活用法を、全29巻にわたって刊行する。
ビッグデータ時代を牽引している若手・中堅の現役研究者が、入門的な内容から最先端の研究成果までをわかりやすく解説。
これからデータサイエンス分野で研究を始めようとしている大学生・大学院生、および、機械学習技術を基礎科学や産業に応用しようとしている研究者・技術者に向けた注目のシリーズである。
■シリーズ編者
杉山 将 理化学研究所 革新知能統合研究センター センター長/東京大学大学院新領域創成科学研究科 教授
- 前巻
- 次巻
オンライン書店で購入する
目次
第1章 音声とは
1.1 音の知覚
1.2 音声の生成
1.3 音韻と音素
第2章 音声分析
2.1 前処理
2.2 音声特徴量
2.3 音声特徴量の量子化
第3章 音声認識とは
3.1 音声認識の分類
3.2 DPマッチング
第4章 隠れマルコフモデル
4.1 確率モデルを用いたパターン認識
4.2 マルコフ過程
4.3 隠れマルコフモデルとは
4.4 音声認識のための隠れマルコフモデル
4.5 HMMを用いたパターン認識
第5章 言語モデル
5.1 言語の複雑さの尺度
5.2 確率的言語モデル
5.3 形態素解析
第6章 大語彙連続音声認識
6.1 サブワード認識単位を用いた学習・認識
6.2 音素文脈決定木を用いたクラスタリング
6.3 発音辞書
6.4 探索技術
6.5 識別学習
第7章 耐雑音音声認識
7.1 雑音とは
7.2 加算性雑音
7.3 乗算性雑音
7.4 非定常雑音への対応
第8章 話者適応と話者認識
8.1 話者適応とは
8.2 事後確率最大化法
8.3 最尤線形回帰法
8.4 話者正規化
8.5 話者認識とは
8.6 i-vectorを用いた話者照合
第9章 深層学習
9.1 ニューラルネットワーク
9.2 誤差逆伝播法
9.3 ニューラルネットワークによる音声認識
9.4 音声認識のための深層学習
9.5 音声認識の要素技術における深層学習
9.6 End-to-End学習
9.7 今後の展望
書誌情報
紙版
発売日
2017年12月09日
ISBN
9784061529274
判型
A5
価格
定価:3,080円(本体2,800円)
ページ数
176ページ
シリーズ
機械学習プロフェッショナルシリーズ
電子版
発売日
2018年09月07日
JDCN
06A0000000000050653O
著者紹介
東京工業大学情報理工学院 教授
オンライン書店一覧
関連シリーズ
-
グラフニューラルネットワーク
-
最適輸送の理論とアルゴリズム
-
機械学習工学
-
ガウス過程と機械学習
-
機械学習のための連続最適化
-
劣モジュラ最適化と機械学習
-
変分ベイズ学習
-
深層学習による自然言語処理
-
統計的学習理論
-
統計的因果探索
-
生命情報処理における機械学習
-
深層学習
-
強化学習
-
機械学習のための確率と統計
-
関係データ学習
-
確率的最適化
-
画像認識
-
異常検知と変化検知
-
ヒューマンコンピュテーションとクラウドソーシング
-
バンディット問題の理論とアルゴリズム
-
ノンパラメトリックベイズ 点過程と統計的機械学習の数理
-
トピックモデル
-
データ解析におけるプライバシー保護
-
スパース性に基づく機械学習
-
サポートベクトルマシン
-
グラフィカルモデル
-
オンライン予測
-
オンライン学習
-
ウェブデータの機械学習