自然言語処理と機械学習入門
「機械学習」は、人間ではとても扱いきれないビッグデータを、人間に代わってコンピュータ(機械)が実現する処理のことです。データ量が増えると、比例して有用なルールや判断基準が増えていき、あたかも人間が学習を進めていくように、そのアルゴリズムを発展させていく、その様から「機械学習」と呼ばれます。
本書は、その機械学習をPHPという普及度抜群の言語で解説した入門書。「小難しい理論は後回し。まずは手を動かして、その挙動を見てみよう」をコンセプトとした実践的な入門書になっています。
内容詳細
■サンプルデータのダウンロードはこちらから ■本書には掲載していないコラムはこちら(PDF) ■本書の主な構成 |
Chapter 1 自然言語処理と機械学習処理とは |
1.1 自然言語処理と機械学習処理の概要 |
Chapter 2 準備編 |
2.1 開発環境を用意しよう 2.2 デスクトップ環境を整える 2.3 支援ツールの導入 2.4 開発作業の流れ |
Chapter 3 自然言語処理の初歩 |
3.1 PHPだけで自然言語文を解析してみよう 3.2 形態素解析ソフトウェア"MeCab" 3.3 PHP用のMeCabモジュール"php_mecab"を使ってみよう |
Chapter 4 自然言語処理の応用:テキストマイニング |
4.1 形態素解析用のPHPクラスを実装しよう 4.2 コーパス(言語資源)を使おう 4.3 単語の分布を調べよう 4.4 自然言語をベクトルに変換しよう 4.5 テキストクラスタリング:似ているもの同士をまとめよう |
Chapter 5 機械学習処理:ベイジアンフィルタ |
5.1 ベイジアンフィルタとは 5.2 単語のスコアを計算してみよう 5.3 文書の判定用スコアを計算してみよう 5.4 判定用スコアを使った分類方法を考えよう 5.5 ベイジアンフィルタの性能を調べよう 5.6 ベイジアンフィルタのまとめ |