[KINGJIM]ポメラツール総合[pomera]
「27 ◆ZNEn0TzDmk0e」氏による解説
>手元にwindowsXPのマシンしかないのでXPを使用しているという前提で説明します。
>(vistaや7の場合は異なるかもしれないけど、持ってないので判らない)
>
>01.キーボードで『ウィンドウズキー+R』を押下する。
>02.「ファイル名を指定して実行」というダイアログが表示される。
>03.ここで、cmd と入力してOKを押す。
>04.黒いウィンドウが表示される。これがコマンドプロンプト。
>05.cdと入力し、スペースキーを1回押す。
> 次に、デスクトップ という文字が表示されるまで tabキーを何度か押す。
>06.『cd デスクトップ』という文字が表示されたら、Enterキーを押す。
>07.エクスプローラでtxt2dic.exeの存在するフォルダを開く。
>08.txt2dic.exeを、コマンドプロンプトの黒い窓にドロップする。
>09.コマンドプロンプトに、txt2dic.exeがフルパスで表示される筈。
> たぶん、
> C:¥Documents and Settings¥あなたの名前¥デスクトップ>C:¥PROJECTS¥pomera¥tools¥txt2dic¥txt2dic.exe
> とか、表示されている筈。
> そしたら、黒い窓を1回クリックし、スペースキーを1回押す。
>10.登録したい単語のテキストファイルを、コマンドプロンプトの黒い窓にドロップする。
> ドロップしたファイル名が表示される筈。
> C:¥Documents and Settings¥あなたの名前¥デスクトップ>C:¥PROJECTS¥pomera¥tools¥txt2dic¥txt2dic.exe C:¥PROJECTS¥pomera¥idx50.txt
> そしたら、黒い窓を1回クリックし、スペースキーを1回押す。
>
>11.ポメラからエクスポートした辞書ファイルか、Wikiに上がっている空辞書ファイルを
> コマンドプロンプトの黒い窓にドロップする。ドロップしたファイル名が表示される筈。
> C:¥Documents and Settings¥あなたの名前¥デスクトップ>C:¥PROJECTS¥pomera¥tools¥txt2dic¥txt2dic.exe C:¥PROJECTS¥pomera¥idx50.txt D:¥PROJECTS¥pomera¥clean.dic
> そしたら、黒い画面を1回クリックし、スペースキーを1回押す。
>
>12.ここで、黒い窓にフォーカスが当たっているのを確認し、新しい辞書の名前を入力します。(atok.dic とか)
> C:¥Documents and Settings¥あなたの名前¥デスクトップ>C:¥PROJECTS¥pomera¥tools¥txt2dic¥txt2dic.exe C:¥PROJECTS¥pomera¥idx50.txt D:¥PROJECTS¥pomera¥clean.dic atok.dic
>
>13.Enterを押す。
> これでデスクトップに、atok.dicという辞書が生成される筈。
> ポメラからエクスポートした辞書ファイルを、デスクトップに置く場合は、どちらかの名前を変えてください。
> たぶん、上の12で入力するとき別の名前を指定するのが良いと思われます。
>
>エラーが発生した場合は、画面のメッセージを知らせてください。
>
>※コマンドプロンプトの窓のタイトルバーの左端のアイコンをクリックすると現れるメニューから、
> 編集->範囲指定 で 範囲選択してEnterキーを叩くとクリップボードにコピーできます。
>(画面のハードコピーを取ってもいいけど、こっちの方が簡単だと思う)
あとなにかテンプレ的なものありますかね?
個人的にはmac版があればうれしいけど、叶わぬ夢かなw
>>8 rarの解凍に失敗してしまう……
それ以前の問題として、GUIアプリじゃないと扱えないっす
>>9 頑張ってGUIを作るんだ!
しかし何だってRAR?
そりゃZIPより小さくはなるけど、元々大したサイズじゃないし
汎用的で誰でも普通に扱えるのはZIPだと思うんだが
使うのも GUI じゃないとつらいって人にプログラム作れは酷じゃないか?
>>9 JavaでならGUIを作れるけど、Macって確か、
Javaプログラムを動かすJVMって奴がApple独自のものだよね
いくらJavaの売りがクロスプラットフォームでも
Windows版の最新で作ったプログラムはきっと動かないよなぁ
>>14 お疲れ様。
これって、たとえば登録単語が
てん,、、、、、、,一般名詞
みたいな場合で、区切りに「、」を用いたとしても正確に動作するって事でいいのかな?
>>15 このように記述してください。
てん,"、、、、、、",一般名詞
>>15-16うにょ?
『区切りに「、」』ってこういう事じゃないのけ?
てん、"、、、、、、"、一般名詞
今のプログラムはダブルクォート(")の処理で手抜きをしているので、
『"あああ,』や『"いいい、』など区切り文字と半角のダブルクォート(")の混ざった語句の登録ができません。(※全角の”は制限なしです。)
希望者が多ければ対応しますが、必要な人、いますか?
お疲れ様です。そもそも半角は半角入力モードで打ち込むので必要ありません
"と、の混ざった語句の登録は個人的にはあんまり必要無いけど、
逆に、区切り語句が混ざって無い単語で、""で囲わず書いちゃう事は普通にやっちゃうな。
ATOKの方でそれで問題ないから""で囲う癖がついてないっていう。
ポメラが出て結構経ったのにツールって無いもんだなあ
キーワードを変えて色々ぐぐっても殆ど見つからねー
出力がテキストなだけあってそれ以上何かしようがないものね。
今取り組まれてる辞書関連だって重箱と言えば重箱。
良く出来てるんだな、あらためてだけど。
確かにシンプルなガジェットだもんな
本来はツールがどうこうって製品でもないか
英辞郎などの電子辞書データを、ポメラで持ち歩くのに最適な形に分割・加工して
くれるツールって何かある?
分割と言うとDM10の頃の制限に特化した
テキスト分割ツールしか判らんなあ
電子辞書データってのが具体的にどんな形かは知らんが
もしテキストならそのツールが使えるんじゃ?
最適な形かどうかはともかく
>有用なツールを開発するためのスレ
なんだから、既存のツールを無理やり探す必要はないんじゃない?
>28
これ、いいかな、と思ったけど
α版じゃ、試す気が起きないねえ……
>>31 元のデジモノ板ならともかく、この板でその姿勢はどうかと思うけどな
ちょっと試したけどα版と言っても0.6とか0.7とかの
1.0より前の微妙なバージョンで普通に公開してるレベルだと思う
ドキュメントもついてたし
つかこのスレタイでデジモノに立てりゃよかったのに
電子書籍もよそに移ったし、あそこはどうしたいのよ
このスレ、早々に寂れる雰囲気ビシバシなんだけど
辞書の登録単語部分は終わったとして
学習結果部分の解析も出来た人っているの?
専門用語が移行できるだけでもかなり役立つね
既出だったらsms
”ふくせん・ふくそう・ふくよう・ふくえき”等を打ち込んだ
ときの変換候補に”梟”が出てくるんだが、なぜだろうか
単語登録はしてないんだけど・・・
>>36 辞書を消去した状態で打って見たが、梟はでなかった。
現在の辞書をエクスポートして保存してから、初期状態の辞書を読み込んで試してみ。
仕事でぽめら使ってるけど、この間俺がデスクを離れた際に、
団塊世代の上司にpomeraのケース開けられて弄られてたわ
そしたら、メモは頭にするもんなんだぞ!とか
こんなの使うくらいなら百科事典を全シリーズ持ち歩くのかqwせsdrftgyっふじこ!とか
散々切れられた
意味不明です\(^o^)/
せっかくスレが立ったのに早々に寂れさせても何だから辞書の解析ネタを
ここでは解析を敬遠する人はいないかもしれないけど、一応トリップつけときます
0x0104〜 学習結果ヘッダ?
0x0104-5 nullの場合もあり
0x0106-7 学習結果1の総バイト数に似ている
0x0108-9 0x0106-7と同じ場合も、まったく異なる場合もある
0x010A-B ?
0x010C-D ?
0x010E〜 学習結果1
読みと表記(変換結果)の組み合わせの羅列
0x8102〜 学習結果2
一発変換できずに手動変換した語の読み
ただし前の領域から続く違うデータが入っている場合があり、位置は固定ではないかも
0xE900〜 学習結果3
読みと表記、および表記と読みの対応表
学習結果1〜3は連動しているため、本来は一緒に解析したほうが良いと思われる
しかしながらまだ構造がよくわからないので、とりあえず別個に解析
学習結果1のデータ構造
[1] 読み
[2] 0xFD
[3] 4〜6バイト(注1)
[4] 表記
[5] 0xFE
[6] [1]〜[6]までのバイト数
(注1) 動詞など活用がある語は6バイト、名詞など活用がない語は4バイト。
ただし名詞でも動詞でもない不明データ(表記も半角カナである上、
読みと結びつかない内容)において5バイトになっているケースがあった。
名詞の例
(1)
[1] CE DF D2 D7:ポメラ
[2] FD
[3] 10 00 08 08 (注2)
[4] 83 7C 83 81 83 89:ポメラ
[5] FE
[6] 11
(2)
[1] BC DE C3 DD:ジテン
[2] FD
[3] 00 00 08 00 (注2)
[4] 8E AB 93 54:辞 典
[5] FE
[6] 0F
(注2) 3バイト目は必ず値が入っている。1、2、4バイト目はnullであるデータが多い。
活用のある語の例
(1)
[1] D0:ミ
[2] FD
[3] 00 00 00 20 40 00 (注3)
[4] 8C A9:見
[5] FE
[6] 0C
(2)
[1] CA C5:ハナ
[2] FD
[3] 04 00 00 40 08 00 (注3)
[4] 98 62:話
[5] FE
[6] 0D
(注3) 4バイト目は必ず値が入っている。5バイト目もほとんど値が入っている。
1〜3、6バイト目はnullであるデータが多い。
>40
解析お疲れ様です。
どうして、こんな変態な構造なんでしょうね?
(このような構造だから、辞書が壊れるバグがでるのかしら?)
>>43 ユーザ辞書部分の構造を考えると、領域を節約してるんじゃないかな
まあ、我々がわかってないだけで、そんな変な構造でもないと思う
やっと規制解除されたか…。
解析の人乙&頑張れ−。
ツールの動作確認報告くらいしか手伝えないけど応援してる。
俺も応援してる。人柱はまかせてくれ
一太郎の新バージョンでポメラ連携と聞いて「辞書も?」と思ったらそんなことなかったしなー。
そうなんだよな
そもそも文書を連携できるったって
プレーンなテキストなんだから別に大した売りじゃない
辞書を弄べるなら良かったのに
>>45-46 レスd
ユーザ辞書部分よりはるかに面倒っぽい構造のため、
実のところ解析しきれるとは思ってないw
自分、ユーザ辞書の解析に協力させて貰った者だけど
あれはもともと途中まで適当解析→飽きて放置、だったのを
◆ZNEn0TzDmk0e氏が頑張ってるのを見て本腰を入れたってのがあったんで
同じように誰かが参考にしてくれればいいな、程度
バイナリを解析できる人が5人くらいいれば、着眼点も手持ちの学習結果も違うから
カバーし合えそうなんだけど、そもそもスレを見てる人数が少ないだろうし
なのでこういうデータを入力してみたらいいんじゃないかって
案――と言うか、思いつきを適当に出して貰えると嬉しいかな
「どこかに活用の種類でも入ってるんじゃ?」
→「形容詞と動詞で違いがあるのかな」
→「この順番でこの読みを入力、こういう変換をしたら」とか
数打ちゃ当たる方式で、いつかはキモの部分にヒットするんじゃないかな
複数の辞書を比べた結果、
>>40の「学習結果2」の位置は不定ではなく固定で、
それも0x8102〜ではなく0x8100〜らしい
固定ではなさそうと思ったけど、それはどうも「学習結果1」の古い情報が
直前バイトまで残っており(ユーザ辞書の場合も古い情報はクリアされずに残る)
最新の「学習結果1」はそれに上書きする形だったため
パッと見ではデータがつながってるように思えただけかと
なので
>>40のヘッダ情報のどれかは
「学習結果1」の総バイト数またはそれに準ずる情報と思われる
学習結果2のヘッダ?
0x8100-1 nullの場合もあり
0x8102-3 学習結果2の総バイト数-1と同じか?
0x8104-5 0x8102-3と同じ場合も、まったく異なる場合もある
学習結果2のデータ構造
[1] 読み
[2] 0x00
[3] [1]〜[3]までのバイト数
例
- ヘッダ -
[0x8100-1] 00
[0x8102-3] 09
[0x8104-5] 09
- データ1 -
[0x8106-9] CE DF D2 D7:ポメラ
[0x810A-A] 00
[0x810B-B] 06
- データ2 -
[0x810C-D] B6 DD:カン
[0x810E-E] 00
[0x810F-F] 04
俺もα版でもなんでも人柱ならまかせとけw
解析の続き
学習結果3は一番よくわからない
表記対読み、読み対表記、いずれでもないデータ、が
混在しているため、格納順にも重要な意味があるのかも知れない
学習結果3のヘッダ?
0xE900-1 ?
0xE902-3 ?
0xE904-5 ?
学習結果3のデータ構造(表記対読みの場合)
[1] 0x08(注1)
[2] 5バイト(注2)
[3] 表記
[4] 0x00
[5] [3](表記)のバイト数
[6] 読み
[7] 0x00
[8] ?
[9] [6](読み)のバイト数
[10] ?(注3)
(注1) 実際にこのデータに属する情報かは不明
(注2) 5バイト目はほぼ必ず値が入っている。1〜4バイト目はnullであるデータが多い
(注3) 実際にこのデータに属する情報かは不明
学習結果3(表記対読み)の例
[1] 08
[2] 00 00 00 20 00
[3] 90 B8 90 5F:精神
[4] 00
[5] 04
[6] BE B2 BC DD:セイシン
[7] 00
[8] 09
[9] 04
[10] 20
話変わって申し訳ないが、
辞書の構造部分って、メーカーにとってそんなにも重要秘匿事項なの?
どんなささいな情報も一切外部に流出厳禁!!!とかw
過去にもメーカーが(サードパーティーはもちろん)ユーザーレベルまで
情報を公開した例は何度もあったような記憶があるんだけど。
キングジムに聞いてみた?
そりゃ、一般論で言えば普通に部外秘
データ構造と言うのはそれを操作するプログラムと密接な関係にあるから
フォーマットに関する資料が提供されてれば
プログラム側がどのように作られているか想像しやすくなる
特に学習結果の場合、データがどのように格納されるかは
変換のノウハウに直結してるだろう
その意味では以前、その時点で古いverの物だったとはいえ
ジャストシステムがATOKの一部資料を公開したのは凄い事だった
無論ポメラ用ATOKの場合権利がどこにあるかも重要になるな
キングジム?ジャストシステム?両方?
と言う訳で言いだしっぺの法則
>>55が問い合わせてみてくれ
もし色好い返事が来たらスレの皆に感謝されるぞ
>>55 重要秘匿事項について
キングジムの自社開発のIMEならキングジムの判断で公開できますが、
ATOKは他社の持ち物ですので『重要秘匿事項』にあたる可能性があります。
(要するに、atokの使用契約に「ジャストシステムから提示された資料を他に漏らすな」と書かれている可能性)
この条項は一般的なので……
面倒なのが「守秘義務の存在すら漏らしてはならない」って項目。
これがあると『その件につきましてはお答えできない事になっております』以外の回答ができない……
まあ普通だわな
で結局55は問い合わせたの?
本当に切羽詰まって必要ならアクション起こすよな。
つまりその程度の必要度ということなんじゃないの?
コマンドライン版ならあるらしい
>>63レスありがとう
コマンドラインはよく分からないのでいいや
そのうちMacのウインドウ版が出て来るのを期待しよう
中沢新一が使ってるんだね
ポストモダン時代に中高生だったものとしてはちょっといい気分
最近使ってないわ〜
test
スーパーポメラ(DM100)が出たけど、すぐに飽きるため気にしなくなった。
こんなもんただのツールだろうに
必要もないのに買うなよ
買えないのね?かわいそうに
72 :
名無しさん@お腹いっぱい。:2012/05/30(水) 18:57:13.68 ID:RlcR0pu/0
んふっ♪
ポメラ買おうか迷ったあげくノーパソに落ち着いた
dvorakチンチン☆⌒ 凵\(\・∀・) マダァ?
76 :
名無しさん@お腹いっぱい。:2012/08/16(木) 19:42:29.20 ID:Tbk1piY/0
あげ
77 :
名無しさん@お腹いっぱい。:2012/12/13(木) 15:44:07.73 ID:AJkDJxPx0
乾電池以外にプラグでの使用ができる
プリンターに接続できる
78 :
名無しさん@お腹いっぱい。:2012/12/30(日) 23:32:19.41 ID:RnwLJlTN0
ポメラのことワープロって言ってる奴がいた
ワープロってそれ単体で印刷できるイメージのが強いわ
>>78 じゃあ、テプラのことワープロって言ってる奴がいたら?
ワープロはタイプライターを少し便利にしたものというイメージ。
タイプミスしても取り返しがきくし、
入力した文章を保管しておいて、何枚でも印刷出来たり。かなり出来る子。
ポメラは今の環境に合わせたワープロといってもいい。
81 :
名無しさん@お腹いっぱい。:2013/01/03(木) 17:40:40.27 ID:wtHoNh7a0
チンコパッドusbキーボードと手持ちsc-05dにお試しATOKいれたら快適でワロタ
俺もポメラって何?って言われたらちっさいワープロって言いそう
やべえ一年くらい前のレスだったどこだここは
ワロタ