テキスト入力専用ツール 「ポメラ」 Vol.10

このエントリーをはてなブックマークに追加
12227
txt2dicが出来たのでUPします。
とりあえずDM20ではインポートできた。

ttp://www1.axfc.net/uploader/File/so/53653.zip

・前回(>107)同様、可能ならば各自でソースコードからコンパイルしてほしい。
・実行ファイルもつけたけど、これを実行する際は自己責任でたのむ。
(ウチの環境に蟲がいた場合、責任取れないから)

概要:
 ATOK8のワードリスト形式のテキストファイルをpomeraの辞書ファイル atok.dicに変換します。

■注意
・区切り文字は半角","とtabのみ対応。
・入力テキストはソートしておくこと。(入力テキストのソート処理を実装していません)
・よみ仮名が11文字以上の場合、登録が怪しくなります。(要するにチェックしてない)
・たぶん、DM5,DM10でも動くと思うけど、手元に実機がないので試験できてません。

[pomera側の制限は以下の通り]
 読みの最大入力文字数は全角8文字
 語句の最大入力文字数は全角18文字
12327:2010/11/04(木) 03:25:38 ID:9TybRzmI
atok.dic の先頭16バイトはファイルヘッダの様です。
0x0000〜3 データ長
0x0004〜7 チェックサム(データ部の全バイトを単純に加算したもの)

チェックサムが合ってないとエラーにされます....
12427:2010/11/04(木) 03:39:12 ID:9TybRzmI
肝心要のtxt2dicの動作を書き忘れていました。
元となる辞書のユーザ辞書を全てクリアして、指定した辞書ファイルの内容で置換します。
atokの学習内容には手を出していませんので、学習内容はそのまま残ります。

【注意】
 入力ファイルと出力ファイルが同一か否かの判定をしていません。
 同一のファイルを指定するとファイルが破壊されますので御注意ください。


■お勧めの編集手順
 PCの辞書ツールで新規にユーザ辞書を作成し、ここに dic2txtで出力したワードリストを読込ます。
 辞書ツールで編集を行います。
 辞書ツールからテキスト出力したものを txt2dicの入力にします。

テキストファイルを直接編集する方は、ソート順に注意して編集してください。