日本語入力を支える技術 ~変わり続けるコンピュータと言葉の世界 (WEB+DB PRESS plus)
読了。
半分分かったような・・・そうでもないような・・・
ただ、ヒントになりそうなセンテンスは多かったので紹介。
目次
日本語と日本語入力システムの歩み
日本語入力システムの概観
かな漢字変換エンジンに用いられるデータ構造
かな漢字変換システムの実装
統計・機械学習のアルゴリズムとその応用
日本語入力のこれから
気になった
形態素
なぜ検索エンジン各社がかな漢字変換エンジンを作るのか
オープンソースでのライブラリ入手
スパムにはスパムっぽい単語が含まれていることが多い
モデル化(日本語らしいかそうではないか)
隠れマルコフモデル
教師あり学習と教師なし学習
感想
付箋の付いたところを改めてめくってみたんですがよくわからない部分がちらほらとw
自分の場合、こういった専門書はいったんめくって全て目を通してあとは放っておきます。
その後、別の本を読んだ時、あるいは何かの現象に当たった時に「繋がり」が起こって「あの時読んだのはこういうことだったのか」とひらめくことが多いです。
なので今はあまり分かっていないのですが、日本語の知識のストックとして置いておくのがいいのかなと。
例えば検索エンジンが日本語をどうやって解析しているのかという予想の精度を少しでも高めることが出来る、とかそういう応用になる。
もはや本の感想ではないですがw