スポンサーリンク

FreeBSDにportsからmecabをインストールすることができます。
デフォルトの文字コードは、EUC-JPです。
デフォルトの状態でUTF-8のデータを処理したいときには、一度、EUC-JPに変換しないと処理できません。
これは、面倒なので、mecabをUTF-8に対応させたほうが良いケースも多々あるでしょう。

mecabだけUTF-8に対応させればよいわけではなく、mecabと一緒に使われるmecab-ipadicもUTF-8に対応しなければなりません。

すでにmecabとmecab-ipadicがインストールされている場合には、sudo make de-install を実行するか、pkg_deleteなどで一度パッケージを削除(アンインストール)してください。

mecabとmecab-ipadicの量パッケージをUTF-8に対応させる方法は、WITH_CHARSETで文字コードをutf-8と指定するだけです。

cd /usr/ports/japanese/mecab
sudo make WITH_CHARSET=utf-8
sudo make WITH_CHARSET=utf-8 install
sudo make clean
cd /usr/ports/japanese/mecab-ipadic/
sudo make WITH_CHARSET=utf-8
sudo make WITH_CHARSET=utf-8 install
sudo make clean

ja-mecab-0.98
ja-mecab-ipadic-2.7.0.20070801
ja-php5-mecab-0.4.0
のパッケージで
本件とは、別の問題だと思いますが、parseToNodeが期待した動作をしません。
mecabのparseは動くけど、parseToNodeが空っぽのデータを返してくるのは、何が問題なんでしょうか。

スポンサーリンク
スポンサーリンク
 
いつもシェア、ありがとうございます!


もっと情報を探しませんか?

関連記事

最近の記事

人気のページ

スポンサーリンク
 

過去ログ

2020 : 01 02 03 04 05 06 07 08 09 10 11 12
2019 : 01 02 03 04 05 06 07 08 09 10 11 12
2018 : 01 02 03 04 05 06 07 08 09 10 11 12
2017 : 01 02 03 04 05 06 07 08 09 10 11 12
2016 : 01 02 03 04 05 06 07 08 09 10 11 12
2015 : 01 02 03 04 05 06 07 08 09 10 11 12
2014 : 01 02 03 04 05 06 07 08 09 10 11 12
2013 : 01 02 03 04 05 06 07 08 09 10 11 12
2012 : 01 02 03 04 05 06 07 08 09 10 11 12
2011 : 01 02 03 04 05 06 07 08 09 10 11 12
2010 : 01 02 03 04 05 06 07 08 09 10 11 12
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12
2005 : 01 02 03 04 05 06 07 08 09 10 11 12
2004 : 01 02 03 04 05 06 07 08 09 10 11 12
2003 : 01 02 03 04 05 06 07 08 09 10 11 12

サイト

Vim入門

C言語入門

C++入門

JavaScript/Node.js入門

Python入門

FreeBSD入門

Ubuntu入門

セキュリティ入門

パソコン自作入門

ブログ

トップ


プライバシーポリシー