桶屋ブログ

風が吹いても儲からないSE(仮)のブログ

機械学習超入門1を読む

機械学習SVMっぽい上、詳しい方の入門エントリーが見つかったので読んでいこうと思う。

機械学習超入門 〜そろそろナイーブベイズについてひとこと言っておくか〜 - EchizenBlog-Zwei
(続きあります)

"使いたい人はまず使ってみよう!"
ということらしく、名前が挙がっているのがLibSVMとSVMlight。LastUpdateがLibSVMは2013/4/1、SVMlightは2008/8/14。それと少し気になるのがGoogleのヒット数が386000と107000ということ。手詰まったら大変そうだ。

"ナイーブベイズは忘れよう"
横浜ベイスターズベイブルース
ナイーブベイズ分類器を頑張って丁寧に解説してみる - Qiita
基礎確率論の単位取ったけど、はぇ~眩暈がしそう。あとで読む(白目)

やっぱりスコアで判断するんだね。

昨日「Aの要素が+4、ではそのAと比較してBの要素は+いくつなのか?」と悩みましたが、その+値、重み自体も導き出してくれるのかな?
何せ僕がやろうとしていることは素性(簡単にいうとパラメータ)が多すぎるといっても過言でないものなので、とりあえず素性をまとめあげてみて、どうするか考えた方がいいかもしれません。

機械学習超入門II 〜Gmailの優先トレイでも使っているPA法を30分で習得しよう!〜 - EchizenBlog-Zwei

やっぱり重み計算してくれるんだね。
でも、この式に値を当て嵌められるのが何時になるか、眩暈はしないけど目が霞んできた。

 

しかし、目的のためとはいえ後の業務とかけ離れた分野に手を出すことになるとは…。おそらく5月前には一応の決着がつくと思うので、無理ならそこで方向転換しても間に合いそうなのでそれまで頑張ります。