FrontPage

wikipediaとかmysqlとか

女子のために贈る暇つぶし。英語は読めてください。日本語嫌い。

リンク

mysqlいらないんじゃない?という話。

実は重要なのは言語ごとのアルファベットの出現頻度だったり、単語の分布だったりする気がするので何も気にしないでxmlファイル全部を処理すればなんの問題もないような気がします。どうなんだろう。

純粋に統計処理するのであればtf/idfとかでも要らない情報取り除けたりするんじゃないのかなと思うけど、この辺は試したことがない。

それでもmysqlでやりたければ

以下のURLとかがすごく参考になる気がします。(動作未確認


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS