Kentaro Kuribayashi's blog

Software Engineering, Management, Books, and Daily Journal.

みみずのおしゃべりを微妙に改善した

>

これまでのところ「マルコフ連鎖による文章の自動生成」にて述べた、2 語のプレフィクスと 1 語のサフィックスのデータ構造をもとにマルコフ連鎖アルゴリズムによって発言らしきものを捏造していたのですが、今日はそのデータ構造を 3 語のプレフィクス + 1 語のサフィックスに変更しました。また、形態素解析器に「茶筌」を使っていたのですが、これを「MeCab(和布蕪)」へ変更しました。その結果、それ以前よりはいくぶんかはまともな発言をするようになりました。


MeCab については、当初 debian sid から ver.0.77 のパッケージをインストールしたのですが、入力文字列をなぜかぶったぎって最初の数十文字しか解析してくれなかったので、ソースからインストールしたらうまくいきました。


とか書いてもどれぐらい改善されたのかわからないので、そのうちログをテケトに掲載することにしようと思った。