C/Migemo を Python から利用するための拡張モジュールです.
このモジュールの利用にあたっては, C/Migemo がインストールされていることが前提となっています. ライブラリ検索パスに migemo.so が, ヘッダ検索パスに migemo.h が存在することをご確認下さい.
同梱の setup.py をご利用下さい:
$ ./setup.py build
# ./setup.py install
setup.py の実行には setuptools が必要です. エラーが発生する場合は setuptools をインストールしてから再度実施して下さい.
基本的な使い方は以下のようになります:
>>> import migemo
>>> m = migemo.Migemo('/usr/share/migemo/migemo-dict')
>>> print(m.query('hoge'))
(hoge|hoge|ほげ|捕鯨|帆桁|補元|ホゲ)
migemo-dict 辞書ファイルと共に Migemo クラスのオブジェクトを生成し, Migemo.query() メソッドに文字列を渡すと,正規表現が返ります. この正規表現を re と組み合わせれば検索等の用途に利用することができます.
Note
返却される正規表現は読み込んだ辞書によって異なるので, 必ずしも上記の通りになるとは限りません.
migemo をハンドルするクラスです. dictionary は利用する migemo-dict 辞書ファイルのパスです.
query から正規表現を返します. query は unicode でもエンコードされた文字列でも構いません. ただし query がエンコードされた文字列の場合, そのエンコーディングが辞書のエンコーディングと異なると, エラーとなる可能性があります.
辞書を正常に読み込めているかどうかチェックします. 正常に読み込めている場合は True が, そうでない場合は False が返ります.
辞書を読み込みます. dict_id は後述の DICTID のいずれかで,読み込む辞書の種類を指定します. dict_file は辞書ファイルのパスです. このメソッドは成功すると読み込んだ辞書の DICTID を返します. 読み込みに失敗した場合は DICTID_INVALID を返します.
index で指定された,正規表現に使用するメタ文字を返します. index は後述の OPINDEX のいずれかを指定する必要があります.
index で指定された正規表現に使用するメタ文字を op に変更します. index は後述の OPINDEX のいずれかを指定する必要があります. 変更に成功すれば True が,失敗すれば False が返ります.
読み込んだ辞書のエンコーディングを返します. 例えば EUC-JP で書かれた辞書であれば 'euc_jp' が返ります. 'cp932' か 'euc_jp' か 'utf8' か 'ascii' のいずれかが返ります.
Migemo.load() で利用する辞書の種類です.
migemo-dict 辞書を示します.
ローマ字→平仮名変換表を示します.
平仮名→カタカナ変換表を示します.
半角→全角変換表を示します.
全角→半角変換表を示します.
辞書の読み込みに失敗した場合に返る DICTID です.
Migemo.get_operator() または Migemo.set_operator() で利用するメタ文字の種類です.
論理和を示します. デフォルトは '|' です.
グルーピング時の開き括弧を示します. デフォルトは '(' です.
グルーピング時の閉じ括弧を示します.. デフォルトは ')' です.
選択の開始を表す開き鈎括弧を示します. デフォルトは '[' です.
選択の終了を表す閉じ鈎括弧を示します. デフォルトは ']' です.
各文字の間に挿入される「0 個以上の空白もしくは改行にマッチする」 パターンを示します. デフォルトは '' です.
二条項 BSD ライセンスに準拠します. 詳細は同梱の LICENSE ファイルをご覧下さい.