辞書解析中(その3)
変換後が、16文字以下の漢字のみのもの(且つ同音異義語のないもの?)も取得できるようになりました
(まだ、適当なので出力後のファイルの下のほうにゴミが付きますが)
ダウンロードはこちら
まだまだ、なぜか取れるはずで取れないものとかいろいろ試行錯誤中です・・・
でも、段々法則性は見えてきました
この解析後をしてもオリジナル辞書は、作れなさそうですが・・・
どうやら、文字数書換・言葉追加でも辞書ファイルとして認識しなくなってしまうようです
きちんと解析しないと辞書を作るのは難しそうです
うちよりまともな抽出ツール作られてる方がいるようなので、抽出ツールの更新は止めてオリジナル辞書を作れる方向に注力したいと思います〜
(まだ、適当なので出力後のファイルの下のほうにゴミが付きますが)
ダウンロードはこちら
まだまだ、なぜか取れるはずで取れないものとかいろいろ試行錯誤中です・・・
でも、段々法則性は見えてきました
この解析後をしてもオリジナル辞書は、作れなさそうですが・・・
どうやら、文字数書換・言葉追加でも辞書ファイルとして認識しなくなってしまうようです
きちんと解析しないと辞書を作るのは難しそうです
うちよりまともな抽出ツール作られてる方がいるようなので、抽出ツールの更新は止めてオリジナル辞書を作れる方向に注力したいと思います〜
午後はちょっと仕事します(^^;
今日中に2機能、目処つけないといけないので・・・
Comments
null:(2006/04/18 11:53 AM)
試してみました(仕事中にw)
着々と解析しておられますね〜
現状、6500語くらい抽出できてますけど、全部で何語くらい入ってるんでしょうかね?
着々と解析しておられますね〜
現状、6500語くらい抽出できてますけど、全部で何語くらい入ってるんでしょうかね?
_:(2006/04/18 4:00 PM)
同じく解析中ですけど、オリジナル辞書を作るのは大変そうですよねぇ・・・
トラックバックには、以下のURLをご利用下さい。
http://another.willcomnews.com/trackback/216754
http://another.willcomnews.com/trackback/216754
2006/04/18 11:04 PM
●keroさんが辞書解析中・・・ いろいろやってるみたい・・・。でも別の辞書を作...
なおっきのぶろぐ