自然言語処理と機械学習入門
PHPを使って機械学習がよくわかる
斉藤常治・高橋佑幸 著 B5変型判 568ページ 定価:3,960円(税込) ISBN:978-4-89797-959-5 2014年7月上旬刊行
電子書籍
「機械学習」は、人間ではとても扱いきれないビッグデータを、人間に代わってコンピュータ(機械)が実現する処理のことです。データ量が増えると、比例して有用なルールや判断基準が増えていき、あたかも人間が学習を進めていくように、そのアルゴリズムを発展させていく、その様から「機械学習」と呼ばれます。 本書は、その機械学習をPHPという普及度抜群の言語で解説した入門書。「小難しい理論は後回し。まずは手を動かして、その挙動を見てみよう」をコンセプトとした実践的な入門書になっています。
内容詳細
■ちょっと閲覧   
 ・1.1節 自然言語処理と機械学習処理の概要space.gifpdficon_s.gif(1.5MB)space.gif
 ・3.1節 PHPだけで自然言語文を解析してみようspace.gifpdficon_s.gif(983KB)
 ・4.1節 形態素解析用のPHPクラスを実装しようspace.gifpdficon_s.gif(823KB)
 ・5.1節 ベイジアンフィルタとはspace.gifpdficon_s.gif(1.2MB)
space.gifspace.gifspace.gifspace.gif

■サンプルデータのダウンロードはこちらから

■本書には掲載していないコラムはこちら(PDF)

■本書の主な構成
Chapter 1 自然言語処理と機械学習処理とは
1.1 自然言語処理と機械学習処理の概要
Chapter 2 準備編
2.1 開発環境を用意しよう
2.2 デスクトップ環境を整える
2.3 支援ツールの導入
2.4 開発作業の流れ
Chapter 3 自然言語処理の初歩
3.1 PHPだけで自然言語文を解析してみよう
3.2 形態素解析ソフトウェア"MeCab"
3.3 PHP用のMeCabモジュール"php_mecab"を使ってみよう
Chapter 4 自然言語処理の応用:テキストマイニング
4.1 形態素解析用のPHPクラスを実装しよう
4.2 コーパス(言語資源)を使おう
4.3 単語の分布を調べよう
4.4 自然言語をベクトルに変換しよう
4.5 テキストクラスタリング:似ているもの同士をまとめよう
Chapter 5 機械学習処理:ベイジアンフィルタ
5.1 ベイジアンフィルタとは
5.2 単語のスコアを計算してみよう
5.3 文書の判定用スコアを計算してみよう
5.4 判定用スコアを使った分類方法を考えよう
5.5 ベイジアンフィルタの性能を調べよう
5.6 ベイジアンフィルタのまとめ