NLP

NLP勉強会#2で文脈自由文法の話をしてきた

NLP勉強会 #2 @dwango で話をしてきた。 内容は文脈自由文法の基本の話。 オーディエンスとしてどういう人が来るのかよく分からなかったので話す内容をどうするか大いに悩んだが、会の趣旨が自然言語処理の再学習ということらしいので、勉強会界隈では話され…

「情報推薦システム入門」読んだ

持ってたし読んでたけど、通読してみた。 結構新しい話もカバーしてるし、レコメンドエンジンこれからやろうって人には全体を見通せるいい本だと思う。というか、これ以上の話って泥臭い現場の話とか運用の話くらいしか残ってないような... これに加えて、「…

Jaro-Winkler距離

以前、スペルミスや「もしかして」系の機能の裏で動く技術としてわりと知られているLevenshtein距離についてちょっと書いてみました。 今回はそれと同様な用途に用いられがちなJaro-Winkler距離。 Jaro-Winkler距離というのは、Levenshtein距離同様に文字列…

Levenshtein距離とか。

某所のパズルでまさにこれを使う問題が出たので2年ぶりくらいに実装してみる。 ●レーベンシュタイン距離 2つの文字列があるとき、片方からもう片方に変換したい。 文字の置換・挿入、削除の3つの操作が可能なとき、一連の操作の最も少ない回数のこと。 Goo…