プロ棋譜の話ではないが、KGSの棋譜をダウンロードしたとき、CR[jo]やWL[547.73]、BL[275.386]などのゴミが混じっている。
それで、sgfファイルがむやみに大きくて扱いに困るとか、例えばポケゴの表示がへんとかいうことがある。
ゴミを取るなにか良い手段がないかと思って探したところ、次の方法でなんとかゴミ取りができるようになった。
<KGSの棋譜からゴミを取る方法>
1.次のフリーソフトRepl-Ace(リプル・エース)を使う。
http://www.sirmiles.com/software/repl_ace.htm (Repl-Aceが窓の杜【編集部員の“今年のお気に入り”】(2004年)に掲載されました)
2.Repl-Aceをダウンロードして起動。
(Repl-Aceの画面の左下の”設定(L)”から、”バックアップを作成(B)”にチェックが入っていることを確認。)
1)”検索文字列(F):”の窓に、BL\[.+?]を入力し、”置換文字列(R)”の窓に、半角ブランクを入れる。
それを”追加(1)”のボタンで、置換計画の窓に登録。
2)同様にして、
”検索文字列(F):”の窓に、WL\[.+?]を入力し、”置換文字列(R)”の窓に、半角ブランク
”検索文字列(F):”の窓に、CR\[.+?]を入力し、”置換文字列(R)”の窓に、半角ブランク
を入れる。
3)これで、置換計画のまどに3種の置換が登録された。
4)Repl-Aceの画面の上方の”探索場所の指定”で、棋譜sgfを保存しているディレクトリを”探索ディレクトリ:(D)”の右の”参照(G)”をクリックして入力。
5)”探索開始(S)”をクリックして、ファイル一覧を出す。
6)対象の棋譜sgfを選択する。
7)Repl-Aceの画面の下方の”オプション:”の”正規表現を使用する(E)”にチェックが入っていることを確認して、その下方の”選択実行(Y)”をクリックし、置換を実行。
これで、ゴミ取りができているはず。
(置換文字列は、半角ブランクだが、半角ブランクはどういうわけか残らない。)
なお、もとファイルはバックアップとして.rpoの拡張子で残っている。
注:
1)BL\[.+?]などは、Perl の正規表現です。
興味のある人は、Repl-Aceのヘルプや次をご参照。
http://www.sixnine.net/regexp/index.html 2)上の置換はコマンドとして保存でき、呼び出して使うことができる。
Repl-Aceの画面の”置換計画”の右横のフロッピーのアイコンをクリックして名前をつけて保存すれが良い。
拡張子は、.RPL になるが、中はテキストファイルで、上の置換コマンドは、次のような内容。
1BL\[.+?]○×××選択
2WL\[.+?]○×××選択
3CR\[.+?]○×××選択
これをメモ帳にコピペし、拡張子.RPL で保存して使うこともできるが、まあ、上のやり方の方が分かりやすいだろう。
3)その他は、Repl-Aceのヘルプをご参照。
以上