取りこぼし
いちもつ
もう少し分かりやすくまとめられないものだろうかね
新スレでも元気に取りこぼし
またつまらぬものを取りこぼしてしまった
>>1乙
UnDup速くて良いんだけど
チェックボックス小さくて大変だな
用意されてる条件を使わず自分でやる場合数が多いと手間がかかる
複数チェックが簡単にできればいいのに
そして取りこぼし
がんばれ町の取りこぼし
15 :
名無しさん@お腹いっぱい。:2009/10/31(土) 04:15:18 ID:lEGHwjpt0
重複確認を最近使ってる。Md5比較できる。あとはGRIDみたいに異なるフォルダごとの比較ができればいいなと
マルチスレッドで、計算速くしたやつ作ってるけど。
GUIが苦手。
UNDUP形式のファイルが読み込めるGUI作ってクレオ。
重複リストだけDLLに任せて他の機能はGUIで処理する。
現状のソフトで何が不満って、
GUIが使いにくい事が一番、
検出後の処理が自由きかなかったりするのが二番
だからGUIは頑張ってほしい
個人的に一番マシなのはGraphicsCompare
GUIなんてVB6で簡単に作れるじゃん。
VB6からDLLコールする様にすればOK。
取りこぼしたら合格
作ってクレオ
苦手とか言ってると、いつまでたっても得意にならないんだよ!
とりあえずDLL公開しちゃいなYo
類似やデータベースに対応するかとかはどうする?
DVDのデータを蓄積して検索できるようにする。
あと似た画像、似た文書の検索など。
フォルダ(たち)を渡したら、テキストを出力するのでいい?
え?画像を比較するんだから、比較する2つの画像の
フルパス文字列へのポインタが引数なんじゃないの?
そしたらGUIの負担が増える
フォルダ丸ごと渡したら、類似画像をまとめて返すのがいい
GUIに任せる部分が多いのはダメだろw
2つの画像のパス受けて比較するだけのDLLって・・・
というかどういう比較をさせるかの細かい指示も
パラメータで渡すとか考えるとDLL作るのも面倒そうだな
比較の部分が一番重要なんだから、後はGUIでいいだろ。
VBだったら一日もあれば出来るし。
各人がそれぞれのDLLの入出力作ったら対応が大変。GUIの人がやりやすい方法がいい。
でも進まないから、仮仕様でDLLをうpするか。ちょっとまっててくれ
>>29 > 各人がそれぞれのDLLの入出力作ったら対応が大変。GUIの人がやりやすい方法がいい。
え?
DLLを書くのは 1NJHQ7nOP だけなのでは。
UnDup使って完全一致の重複ファイル消してさらに他の近似画像検索ソフトで
重複ファイル探して消して、そこからファイル振り分けソフト使って整理しようと思ったが
UnDupで45万ファイル190GBって出たのを見てそっとタスク終了を押した
整理とかいう次元じゃない、もう色々と手遅れのようだ
どうせ見ないんだから丸ごと消しちまえよ
pico久しぶりに立ち上げたら、途中で落ちるようになってしまった...
で他にいいのを探してるんだけど、1.複数フォルダの比較可、
2.フォルダをD&Dで登録できる、
3.エクスプローラの右栗「送る」からフォルダを登録できる、
の条件だとしたらどれが良い?(2,3はどちらかでもおk)
ディレクトリ(フォルダ)を一つ指定して、その下全部のサブディレクトリ含めて
全ての画像ファイルを比較するソフトって、どれが良いでしょう?
別のディレクトリを2つ指定して比較するんじゃなくて・・・
>>31 重複とか画像類似とかCRCとか文書類似とかデータベス対応とか
いろいろDLLの可能性がある。
ひとりで全部作れない。
立案者がトリでもつけてやらんと話がわけわかめ
嘘ッパチだし
類似画像自動分類は速度的に時間かかりすぎる。
まずはデータベース生成して、
あるひとつの画像を与えたら類似画像みつけてくるほうがいい。
どういうのが理想なの?
>>40 確か、ThumbsPlusで出来たような
データベースのファイルサイズに制限があるけど
結局何もなかった
取りこぼしてスレ終了
ディレクトリ関係無しにフォルダ内の画像全部比較してくれるソフトってありますか?
出来ないソフトあるのかい
何もなかった何も
Undupってgifだけは関連付け関係なしに違うので開くな
エロ画像はpicasa→AbleCV→SimPixやってるわ
GRIDまだかな
a
>>48 1.5gで再現しない。
どんな手順でやればいいんだ?
[95]sage: 12/04(金)23:34 ID:*h
画像チェック専用じゃないけどXnView使ってる。
ttp://www.xnview.com/en/download.html 左のフォルダで右クリックして「類似したファイルを検索」ね
ファイル数に制限は無いし、ファイル形式も問わないからjpgとpngが混ざってても良いし、
単純に回転させたファイルでも類似と見てくれる。
個人的には上のsimpixやImage Compareよりも良いと思う。
便利そうだな
精度や速度、重さはどんなもんなんだろ
固まってしまったよ。
XnViewはexifに不整合あると無言で落ちるから使いにくい
リスト表示しただけで落ちてたらどのファイルか特定できねえだろ
デバッグダイアログくらい出せよ^^;
XnViewは1個1個確認してやるにはいいかもしれないけど、
一括で削除とか出来ないし、表示順も類似性の高さ順じゃなく名前順だから、
類似性が高いのだけ確認とか出来ないから、全部確認しないとならないし
とてもいいとは思えない
ThumbsPlus使えよ、有料だけど
さらに言うと英語だけど
250万ファイルの重複をUNDUPでやったら1日-2日ほどかかる。
これを10倍速以上の3時間以内で出来るやつ作ったら人気出るか。
いま作ってるところ。
23万個ほど重複出て、削除するにも2-3時間はかかるな。
GRIDの人のやつ(名称わからん)DB使ってmassモードにすると結構速いよ
釣りにマジレスしなくてもw
しかし検索後の処理がもうひとつ
数が多いから類似検索ソフトを使うのに、
数が多いのにあまり向いてないんじゃ本末転倒
Duplicate Cleaner良いかと思ったけど
日本語ファイル名が文字化けして駄目だわ
削除対象オプションが豊富っぽいのに残念
類似検索の鉄板ソフトみたいなのってない訳?
あるよ
↑のやつなんでundupでやってるのに類似の話になってるの?
スレで○○作るは99%当てにならない法則
どういうGUIならいいのか漠然としすぎてて結局よく分からんから
キャッシュ生成と比較処理書いた所で投げっぱなしになってる
私の場合は・・・
あるディレクトリ(フォルダ)以下、サブも含めて全部の中で、同一の画像を調べる。
あるディレクトリ(フォルダ)と、別のディレクトリ(フォルダ)を、サブも含めて同一の画像を調べる。
あるディレクトリ(フォルダ)と、別のディレクトリ(フォルダ)を、サブは含めず同一の画像を調べる。
この三種類が出来ればいいな。
一致した画像一覧のフルパスファイル名をクリックすると画像が表示されて、即消せるように。
スレで○○作るは100%嘘
75 :
名無しさん@お腹いっぱい。:2009/12/23(水) 22:22:47 ID:LrzztUh90
えろ画像とネタ画像を巡回ソフトで集めてる
気に入ったのは適当なディレクトリに移動 いらない画像はlogディレクトリに移動
nauなんたらで重複削除
見たことない画像だけ残る
みたいな感じで整理してるんだけどもっといい方法ないかね
logディレクトリがパンパンでディスクアクセスだけでしねる
いらないなら残さない
似たような方法だが、ファイル名をmd5に変換した後、
重複ファイル名で削除という事をやってた時があるな。
本当にいらない画像は、0KBの名前だけの存在になってた。
ファイル名をmd5で管理するのは定番の手法だから
nautilusも重複ファイル名比較が出来ればいいのに。
ファイル名をmd5
これ笑うところかな
何が笑えるのかわからない
ファイル名のmd5だとでも思ったのだろうか
ファイル名をmd5
これ笑うところかな
Vectorにそれっぽいのがあったので試してみる
javaいれるのめんどい
ファイル名をMD5に変換するリネーマは結構あるから割とメジャーな方法だろう
笑うところとか
お前が笑われるべき存在
あれじゃね?
「今更md5とか馬鹿だろw」って意味じゃね?
md5も極稀に衝突するからなぁ
84 :
名無しさん@お腹いっぱい。:2009/12/24(木) 15:01:42 ID:VAmgPQin0
ファイル名をmd5
これ笑うところかな
ファイル名をMD5に変換する、って意味が分からん・・・
ファイル名を、ファイルのmd5ハッシュ値の文字列に、変更する。
って意味だろ
中身が同じなら同じ名前になるんだし。
ID:VAmgPQin0
なんでこんなに必死なの?
イブなのに他にやることが無いからです
コリジョン起こして関係ないものまで削除してそうだなw
そんな簡単にコリジョン起こしてたらWinnyとかここまで流行らなかっただろうに
nyなら初期からコリジョン起こしてたよ
アニメスレで報告されてたし
つかnyはコリジョン起こしてもキャッシュ削除するわけじゃないから別に問題ない
コリジョン起こしてるキー配布してるノードが消えれば普通にDLされる
MD5に関しては俺はクローラに使ってるだけでHDDの方には使ってねぇなあ
nyのコリジョンはキャッシュ変換時に全体ハッシュ不整合エラーを引き起こしキャッシュが削除がされる。
しかし拡散しているので時間が経過するほど正常なファイルを落とせる確立が減る。
winny使ったことないから知らんけどv4,v5,v6っちゅう独自ハッシュじゃないの?
md5はそんなに簡単に衝突しないはずだけど
v4は独自。ただしハッシュねつ造が可能なので、
v5でmd5採用。v6はbbsに使われただけ。
個人的にはSHA-256とかSHA-512(とかの通称SHA-2)でやった方がMD5よりは安全だと思うが
如何せん処理速度の問題がなぁ
ちゅうことは
>>91の衝突はmd5関係ないってことかな
画像なんて落としても
もう二度と見やしないことに気付いて全削除余裕でした^q^
確かに90%超は2度と見ていない気がする
残り10%はEROですね
わかります
ああああああああああああああああああああああああああああああああああああああああ
Detail表示だと視認性に難有りだしLargeIcon表示だと領域食い過ぎのうえ情報足りない
ホッシュ
nautilusで拡張子フィルタをEnableにするとヒットしないんですが
…ってgnomeのファイルブラウザじゃないすか?
gnomeに聞いてくださいよ
検索対象と検索結果(サムネ)が別ペインで表示されていて、
検索結果は類似度・画像サイズ・ファイルサイズ等でソートできるような奴をこれから探すつもり。
undupは操作性さえ良ければなぁ
えっ
フォルダ比較ウィンドウを開いている間は
本体の操作を一切受け付けないのはキツい
いちいちフォルダ比較の窓を閉じなきゃいかん
ずっとundup使ってたけど、
SDFにちょっと浮気してみようかな
undupは全然更新ないし
フォルダ比較できないのかSDF
いや、出来るだろ
誤解を招く言い方だったすまん
>>110で言ったフォルダ比較ってのは
undupのように比較対象のフォルダ内のファイル数なんかを表示する機能のこと
それは必要なのか?
必要に決まってるじゃん
ぼうやはママのおっぱいでも吸ってろや
(^_^)
現在のところundup最強
しかし更新がないのが欠点
今日も元気に取りこぼしっ
FileManyっての見た目が好みなんだが
いかがかしら
そんな事聞かれても、ダウンロードの直リンクURLが貼って無いから、試す気にもならん。
>>112 俺もそれが無いからUndup使ってる。
でも俺の環境だとフォルダ内ファイル数比較のウインドウが開くとき、ウインドウサイズの指定がおかしいらしく、最下段のフォルダが隠れた状態で表示される。
コレを直すのが面倒で仕方ない。
マルチスレッド対応でお勧めの擬似判別ソフトある?
i7とか8スレだからフルに発揮させたいんだが、そんなのないと思うんで最低2スレ以上でお願いしまつ
ファイル数やフォルダの階層数も指定できると嬉しい
GRIDはマルチ対応じゃなかったか
>擬似判別
判別したように見えるだけか
>>124 そんな擬似画像処理ソフトってあったっけ?
>>125 判別じゃないな、すまん
識別ってところ?
擬似って何だ類似じゃねえのか?
そしてこのスレくらいレス抽出しろよw
擬似だから画像っぽいものを探すんじゃね
同じ画像と判断したファイルの一覧で、それぞれをクリックしたら
その画像を表示してくれるやつが少ないよな。
一応確認してから消したいのに。
見た目は嫌いじゃないけど機能が少なすぎで話にならん
>>130 > 見た目は嫌いじゃないけど機能が少なすぎで話にならん
どれが?
作者に要望してパーフェクトなものにしてもらおうぜ
zipの中身まで比較する方法ってないの?
UnDupを紹介されて使ってみたのですが、
6時間ほど検索した時点で検索終了という小さなダイアログが真っ白になり暴走してしまいます。
何か暴走させないポイントなどありましたら教えてください。
データサイズは6Tぐらいありますが、できたら分割した検索はやりたくないです。
メモリが少ないんじゃね
>>139 いえ、RAMDISKに3G割り当てるとCドライブへのアクセスが劇的に減りますよ。
詳しくはGavotteでぐぐってください。
www
別のを使おう
>>136 どうせ一回やればいいだけなんだから
分割でやりなさい
>>140 32bitアプリだと1プロセスで4GB以上確保できないからって意味でしょう
プロセスの制限なのでRAMディスクに64GB割り当てても意味がない
実際UnDupはメモリ食いすぎで落ちているのだろうし
ハッシュ作成ソフトとRDBソフトでやればいけるだろうけどね
ハッシュ作成ソフトでハッシュ値とファイルサイズを作成してインサート(ファイルフルパス、ハッシュ値、ファイルサイズ)
あとはSQLでハッシュとファイルサイズでグルーピングしてカウントが2件を超えるレコードをテンポラリテーブルに出力
で、出力されテンプラリテーブルのハッシュ値とファイルサイズを元のテーブルから出力すれば完了
ハッシュテーブルと弱参照使ってる検索ソフトなら解決できる気がする
あるのか知らんが
>>144 ためしにタスクマネージャーを起動してもそこまでメモリは消費していません。
100Mも使っていないので違うと思うのですが。
じゃあキャッシュ登録してるテーブルが上限値越えたんでね
>>148 ファイル数1000万やそこらで上限超えるものですか?
その辺は作者じゃないと分からんよ
もしくは例外の処理がうまくいっていないとか
単にフリーズしただけだと考えられる原因は無限にあると言ってもいい
ファイルアクセスに追随してバックグラウンドスキャンしていたアンチウイルスソフトがフリーズしたりしてるとカオスだよね
Easy Duplicate Finderでぐぐった時に見つけたDup SameFiles Searcherを試してみた
インストーラーexe版はアーカイブ版があれば出来るだけ使わないようにしてるのでzip版使用
D:1.63GB 9614ファイル (少ないのはご勘弁)
UnDup Ver.1.5g 完全一致1pass検索時間 1分06秒 簡易検索CRC32検索時間 1分08秒
重複45ファイル(21タイプ)
Dup_Same_Files_Searcher163.zip 検索時間 5 秒 めちゃ早!
※ スキャン時のチェックは念のためすべてはずした
重複255ファイル(UnDupとまったく同じファイル)
※ 使ってみた感想
UnDupに比べて明らかに早く軽かった
日本語のこの位長いファイル名
一騎当千 Dragon Destiny 赤壁温泉大決戦 第1話 成都の爆乳 [一騎当千 Dragon Destiny] 0001-17.jpg もエラーなく検索
検索後のファイル名 パス サイズ 日付はUnDupに比べて確認や視認性がよかった
検索後のファイル名ダブルクリックで関連付けアプリで画像等確認はUnDupと同じ
日本語化パッチがあるがでデフォの日本ランゲージでも何故か文字化け等はない?
※ 結果
30分位しか試してないので検索漏れ等がまだわからないのでとりあえず
UnDup FileMany Image Compare PiCo sias SimiPix 重複画像カッターと兼用しようと思う 以上!
5秒はすげえな
>>152 ファイルの種類聞いてもいいか?
UnDupにはJPEGヘッダを無視する設定があるからそれにチェックついてれば
異なるサイズでもチェックの為に読み込みしてる可能性もあるよ
>>155 その通り JPEGヘッダを無視にチェック入ってた・・・・・・ orz
※JPEGヘッダを無視のチェックをはずした検索結果
UnDup Ver.1.5g 完全一致1pass検索時間 02秒 簡易検索CRC32検索時間 01秒
たまたま見つけて検索使ったらUnDupより早かったので普段レスすらしないのに稚拙なレポしたらこのありさま・・・スマン
これは酷い
>>156 どんまい
ただそのUnDupの結果ってログが残ってる状態なんじゃないかな?
>>158 うん残ってる
※ログ削除後(Del.log UnDup.CFGも削除)の検索結果
UnDup Ver.1.5g 完全一致1pass検索時間 07秒 簡易検索CRC32検索時間 01秒
ログがあるから早いと思ったが9614ファイル程度だとそんな変わらんのかも、念のためUnDupを全削除してDLし直して見たけど
UnDup以上の速さと思い稚拙なレポと設定でなんか疲れた 旅に出ます 探さないで下さいOo。. (´-`)
誤 UnDup Ver.1.5g 完全一致1pass検索時間 07秒 簡易検索CRC32検索時間 01秒
正 UnDup Ver.1.5g 完全一致1pass検索時間 02秒 簡易検索CRC32検索時間 01秒
またなんか間違えてる・・ サヨナラ
キニスンナ
otu
>>149 マニュアルに「10万ファイルにつきおよそ6MBのメモリが必要となります」ってあった。
これが事実とすると1000万ファイルで100Mも使ってない時点で不可解。
イレギュラーなデータがあってうまく読み込めてないとかじゃね。
あと、既知の問題点に「●Unicodeのファイル名には対応していません」とある。
この辺も怪しいかも。
とりあえず、問題が発生したらマニュアルぐらい目を通してもいいんじゃないか…。
このジャンルの作者の人たちは、
速度や精度よりUIが重要だと何故わからんのだろう
精度がどんなに高くても、100%でない以上、
意図しない結果が出てるのをすぐに確認できなければ安心できないし、
検索の速度がどんなに速くても、削除等の処理に時間がかかるんじゃ何の意味もないのに
逆に言えば、それらがしっかりしてれば、
多少の速度や精度は問題にならないのに
じゃあその理想の UI を細かく定義してみて
>>166 > じゃあその理想の UI を細かく定義してみて
少なくとも、一緒だと判断した複数画像のサムネイルは表示して欲しい。
類似でサムネでないやつなんかあるか?
Nauなんたら使ってるけど出るわ
169 :
名無しさん@お腹いっぱい。:2010/02/09(火) 20:58:40 ID:cq1pYp/Y0
神眼を持つ俺参上
細かく定義しろって言われてすくなくともほにゃらって舐めてるの?
UIの定義なんだから、ペイントでもGIMPでも使って画面プロットしてみろ。
ペインのレイアウトとか、どこにどのペインを置くとか、メニューの階層や設定画面はどうたらと。
バカクライアントが言い出す「ビビっとくるWebサイトを作って下さい」とレベルが同じだ。
自分じゃ何も出来ないからこのスレでピーピィー騒いでるんだろどうせww 可哀そうだからほっとけw
類似ならフルパスのログ吐いてくれたらあとはビュアー使って目で確認するからUIとか
ぶっちゃけどうでもいい
言ってることは凄くよく分かるがなぜID:92EvGTBw0がキレているのか
何か嫌な案件でもございました?
UIは大事だよな
細かいフォルダにたくさん分かれてるのは面倒だし
重複が100や200ならまだ作業も楽だが
数千を越えると確認作業にかかる手間を一つでも減らしたくなる
大変ですねw
マメに整理し無いからそういうカオスに陥るんだと思うの
>>168 > 類似でサムネでないやつなんかあるか?
幾つか試したけど、ファイルのフルパスのみ、ばっかりだった。
類似と重複を勘違いしてそうだなw
試しにソフト名挙げてくれよ
爆笑できそうだ
まったく表示できないことはないけど、
リストを表示、選択で画像表示って形式のは少なくないように思う。
SimiPixあたりがそうじゃなかったっけ。
ひとつの画像に対して、類似画像がひとつ。確認はできるけど、本当に最低限。
重複が10個くらいなのが前程じゃないかって作り。
GRIDあたりは少しマシになって、ひとつの画像に対して、複数の画像が表示される。
だけどこれも結局、重複が検出された回数だけ、確認処理をしてやらないといけない。
100、200と検出されるとやってられない。
GRIDがどうだったかは忘れたけど、類似検索の中には、逆引き・・・
1=2を類似として結果表示した後に、それを無視すると2=1を類似として出す奴がたまにあったように思う。
そうなってくると更に無駄に時間がかかる。
全体の結果を、一覧として表示できるソフトは、多くないね。
整理しないのが悪いって意見は、正しいが、
正しすぎてこの種のソフトの存在を否定する意見だ。
だからGUI案書けるもんなら書いてみろ低脳
口しか出せない癖にガタガタうっせーんだよ
嫌なら使うな
手作業で処理してろ
おちつけ
有料だけどThumbsPlus使え
ID:hRwf0XGE0
www
結果を1画面に表示するってのは検討したんだが、どうしても上手く行かなかったんだよねぇ。
実際に書いてみると分かるが、比較結果は十中八九親子関係の集合で管理することになる。
ツリー状のデータ構造はシーケンシャルには表示しにくい。
ABCDEFのよく似た画像を比較することを考える。
必要な組み合わせは
A-BCDEF
B-CDEF
C-DEF
D-EF
E-F
になる。
ハイフンの左が親(基準画像)で左が子(類似している画像)になる。
GRIDなんかがいい例で、親の中から1つを選択して子を別領域に表示するような形になっている。
これを線形に表示しようとするとABCDEF BCDEF CDEF DEF EFを1画面に1度に表示することになる。
被ってないのはAだけで残りはどこかで被ってる。Fなんか最悪で1画面に5個表示される。
これって見やすいか?色分けしたり区切るくらいはできるけど。
かといってここから情報を削るのは不味い。
状況によって検出されなかったりするのはUIの不備以上に悪だ。
他に上手い表示方法ある?検討に値するものがあったら教えて欲しいわ。
あ、期待はしてません。
おそらく
>>181くらいの頭だと理解できないでしょうから…。
undup風にして操作性良くすりゃ全部OK
Undupは走査対象の中で同一のファイルがあった場合ズラズラ列挙していきますが、
ファイルAがファイルB〜Zのどれと同じなのかっていう情報を提供していません。
とにかく重複であることは保証されているので必要ないからです。
そのため検索結果は1次元で管理することが容易になります。
しかし類似だと前述の状況からそういうわけに行きません。
「何と何が似ているか」を無視したら使い物にならないからです。
おそらく操作性しか言えない九官鳥さんには理解できないとは思いますが…。
>ファイルAがファイルB〜Zのどれと同じなのかっていう情報を提供していません。
これに関してはしてるだろ
色分けもされるし
類似なら%表示で親子関係にするのが一番見やすいだろ
>>192 それは失礼しました。
親子関係の話になると
>>188に戻ります。
以降ループですね。
お疲れ様です。
重複だとABCDEFの例でいった場合
A=BCDEFが成立した時点で後続のB〜Fを基準とした比較をしなくて済む様になるのも構造的なメリットですね。
A=B、A=CならばB=Cも自明に成立しますが、
A≒BCDEFだとA≒B、A≒CではB≒Cは成立しない可能性があります。
平均明度を評価基準にし、類似の条件を誤差5%とした時
A=50、B=52、C=48とすると、A≒BCは成立していますがB≒Cは成立していません。
だからなにって話を延々としてるな
実装しにくいんだってことですよ。無能。
しにくいから諦めたのか無能
あなた方が少ない頭で考えることなんて検討を重ねた上で廃棄してるんすよ。
アドバイス求めてんだから解決してくださいよ。ピシッと(´・ω・`)
似てると判断した画像サムネイルは全部表示する必要があるだろ。
どれを消すかの判断に必要なんだから。
っつーか
誰コイツ?
>>199 全部表示するのはいいのですけど、1画面に表示するようにすると
ABCDEF BCDEF CDEF DEF EFみたいな感じで同じ画像を同じ領域に何度も表示することになるのですよ。
これは本当に見やすいですかねっていう話なんですが。
どうしても検索結果を1画面に表示するってのをご所望なようなので。
AからFまで全部表示させて
後はてめえで判断しろやって丸投げしちまえよ
能無しに吠えられてイラッと来るのは分かるが
テメエも能無しだろ吠えてんなよ能無し
simipixのワンクリックで即ファイルを移動できる手軽さが気に入ったのですが
どうやらjpgファイルしか判定してくれないようです
これでpngを読めるようにできませんか?
>>201 > ABCDEF BCDEF CDEF DEF EFみたいな感じで同じ画像を同じ領域に何度も表示することになるのですよ。
サッパリ意味が分からん。
ABCDEF の6種類が似てると判断したのなら、その6画像だけ表示すればいいだろ。
>>202 > AからFまで全部表示させて
> 後はてめえで判断しろやって丸投げしちまえよ
それでいいのに何故駄目なんだ?
>>205 補足すると、例えばA〜Z迄26個の画像があったとして、
Aから順番に比較する訳だが、Aに似てる、と判断された画像は、
もう他と比較する必要はない、って事。
だから、画像が何万あろうとも、似てると判断した画像は
どんどんその後の比較対象から外せる。
Aに似てるのがDGHZなら、ADGHZだけサムネイル表示すればいいだけ。
「ABCDEF BCDEF CDEF DEF EFみたいな感じで同じ画像を同じ領域に何度も表示することになる」
って、どうやったらそんな異常なアルゴリズムになるんだよ一体。
BがZに似てる可能性とかどうすんのその場合
補足
AがBに似ていると判断され
BがZに似ていると判断され
AがZと似ていると判断され”ない”場合がある
ここでAがBに似ていることで後の比較対象から外される場合
BがZに似ているっていう情報は消えてしまうわけだけどこれは問題ないんか
さらに補足
>ABCDEF の6種類が似てると判断したのなら
6種類が似ているという表現は正しくない
AはBCDEFと似ている、だ
この場合BとCが似ているとは限らない
だからBとCDEFが似ているは別枠の比較になる
つーか理解できてもいない癖に楯突かないでくれ
ウザイ
>>208 現実で考えると、
Aに似てるBに似てるなら、Aにも似てないわけないんじゃね、と思うけど、
実際には似つかない画像も混ざるんだろうし、
Aに似てる画像だけどんどん肥大しちゃうな
>>211 AからZの順で比較するならAが一番類似してる数が最初は多く見えるが
結局は逆のB→Aなんかは飛ばされるわけだからどの画像も自分以外と全て比較するのは一緒だよ
>>211 あー、その検索方法だとAとの類似と判断された画像が一番多くなって表示が困るってことか
失礼した
まぁ俺は
>>202でいいと思う
>>188ではFが何枚も表示される事を危惧して、
色分けすることなんかを考えたりしているようだけど、
使用する側からすると、Fが何枚表示されてようが、どうでもいい事だと思うわ
基本的に横軸でしか考えないしね
Fという画像が、他にどんな画像と似てると見られているかなんて事は、知ったことじゃない
似てる画像が1枚でもあれば、消すなりするんだから
画像を見ていちいち確認しないなら
全類似ファイルの関連性が必要かもしれないが
閲覧して確認するんなら細かいことは要らない
見れば分かるから大雑把にコイツらなんか似てんぜ?って情報くれればいい
ややこしくなれば別フォルダに移して後で好きに検証すりゃいいしな
>>211 > 実際には似つかない画像も混ざるんだろうし、
それは、似てると判断するアルゴリズムが間違ってるだけでは。
>>214 > 似てる画像が1枚でもあれば、消すなりするんだから
まさにそれだよね。
似てると判断されて表示されて、実際に見て確かに似てるなら、
一枚残して残りは全部消すだけの話。
>>215 > 画像を見ていちいち確認しないなら
> 全類似ファイルの関連性が必要かもしれないが
その場合、似てない別画像なのに、似てると判断されてる恐れがあるから、
> 閲覧して確認するんなら細かいことは要らない
こうなるんだよね。
> 見れば分かるから大雑把にコイツらなんか似てんぜ?って情報くれればいい
だから結論はこれなんだよな。
自動で画質悪いほうを捨ててくれる類似検索ソフト誰か作ってくれないかな
>>217 セミオートなのはあるな
画像サイズ、ファイルサイズ、日付みたいな条件で出来る
たとえばちょっと表情が違うだけで後は全く同じ構図の絵があったときに
ほぼ同じだから片方あればいいと思うか
この表情の変化が良いんだよと両方必要と思うか
結局見て判断するしかないんだよな。
あとは一度必要/不要と判断した類似画像を次に整理する機会に覚えていてくれればいいのだが…
それは消さずに不要フォルダでもつくってまとめておいて
それと類似するファイルをまとめて消すのが楽なんじゃね
不要ファイルをハッシュ判定で削除するソフトならあるけど類似も消してくれるのは今のところないなあ
不要フォルダにある画像と99.9%一致したものを自動削除!ってできればいいけど不要ファイルが多くなってくると計算量がすごそうだw
こういう作業をやりたい人の数だけ、専用のソフトが必要だな。
画像は同じでjpgの圧縮率の違いによる劣化、微妙なサイズの違いとか見分けるのは流石に人力になっちゃうよなぁ
>>225 A(100x100,100KB)の画像をリサイズして圧縮率も変えて保存したとして
B(125x125,75KB)
C(75x75,125KB)
の3つのファイルを比較した時に
>>218みたいな単純な比較じゃ分からないからね
まあ画像の「顔」部分を抽出するアルゴリズムもあるくらいだから、どこかにあったりして…
重複してたっていいじゃない
人間だもの
みつを
>>221 GRID の場合…
検索対象のルートフォルダを「検索パス1」、不要ファイルの入ったフォルダを「検索パス2」、
検索2の方の「検索開始>>」ボタンで検索
結果が表示されたら上段の、グループのサムネで右クリックメニューから
RV_Special > Delete > all without 1st images で一応削除できる
(「検索パス2」のファイルは常に一番左に来るから「検索パス1」のファイルだけ消える)
>>122 あーそれ、俺の環境でも再現するわ。
多分だけど、フォルダ比較ウインドウの下に横スクロールバー出てるだろ。
カラムの長さを調整して、スクロールバーが表示されない状態にしてみな。
それでピッタリのサイズになるはずだ。
Undupはフォルダ比較ウインドウにスクロールバーを表示する事を想定してないんだろうな
うんこだっぷんの取りこぼしの理由知りたい?
233 :
名無しさん@お腹いっぱい。:2010/02/24(水) 08:57:40 ID:CBKxfRbc0
SmartEyeの新しいの発見!
234 :
名無しさん@お腹いっぱい。:2010/02/24(水) 09:58:33 ID:AIrA+V2g0
GRIDは64Bitに対応してないの?
ImageCompare使いやすいわ
他におすすめとかある?
GRIDは個人的におすすめ
数が多いと面倒かもしれないけどね
俺の環境の場合ImageCompareが浮動小数点エラーで落ちて使い物にならないんだけど
XPのSP2とかSP1だとまともに動くのかね?
フォルダ内の重複を総当りでチェックするのではなく、
こちらが指定したファイルに対して特定のフォルダから重複(類似)を探すソフトはないでしょうか?
GRID
ありがとう
見てみます
うんこだっぷんの取りこぼしの理由知りたい?
3次エロ画を整理したいんだけど結局どれとどれがおすすめなのよ
243 :
名無しさん@お腹いっぱい。:2010/03/07(日) 14:57:57 ID:fGdbyaLN0
真眼と神眼と信眼
245 :
名無しさん@お腹いっぱい。:2010/03/19(金) 07:51:49 ID:7vPcMn650
一番手軽で使い勝手いいのってどれ?UnDupでいい?
UnDupは重複ファイルしかムリなの?一部合致ってのは?
246 :
名無しさん@お腹いっぱい。:2010/03/19(金) 15:26:30 ID:c7X7KO/x0
一部合致ってどういう意味があるんだ?
画像だとして上はノーブラが合致で、
下がぱんつはいてないとと縞ぱんで不一致ってやつか?
なんじゃそりゃw
GRIDのキャッシュフォルダから
存在しないフォルダのキャッシュを消したいのだがどうすりゃいいんだ?
それらしいボタンを押してるのに全然数が減らない。
249 :
245:2010/03/19(金) 20:00:40 ID:7vPcMn650
>>246 俺もよくわからん
でも完全合致と部分合致とやらがある
>249
使い方に書かれてない?
部分一致検索(ファイルの特定範囲のみを比較します。)
ってオプションじゃないかと思うんだけど
簡略化して高速検索するための物だと思ってるけど、
テキストみたいなファイルだと指定範囲によって類似近似シリーズ物を探すこととかも出来そうだな
251 :
名無しさん@お腹いっぱい。:2010/03/20(土) 05:03:08 ID:jmY7iE8P0
そういう意味なのか
部分一致検索だともしかしたら完全には同じでないのがヒットすることもあるかも、ってこと?簡略化ってことは
破損してるファイルだけどサイズも一緒で破損箇所までバイナリも一緒
っていうの探すんじゃね?
部分一致ってJaneのキャッシュみたいにヘッダがあるファイルのヘッダだけを比較とかに使うんじゃない?
まあ、可変長だからJaneのキャッシュは無理だが…
>>251 例えば1TBのファイルの中身を頭から尻尾まで調べ上げるのと、100kBのファイルを調べるのではかかる時間が違うでしょ?
DNA鑑定をする時にすべての配列を調べたりしないのと同じ
プレーンテキストなんかは無理だろうけど普通のファイルはある程度の範囲がバイナリ一致すれば同一とみなせる物がほとんど
範囲の指定は自分でできるからヘッダだけ比較することも頑張れば可能かもね
逆にJPGだとヘッダを無視するオプションもあるみたいだけど(純粋に画像の中身のみ比較したい人向けに)
こんな認識してる
1.完全一致検索 ( 1pass )
同じサイズのファイルをリストアップ
リストアップされた同じサイズのファイルどうしを先頭から最後まで比較する(以下全比較)
同じサイズのファイルが10個あったら9*8*7*6*5*4*3*2回全比較する
(全比較中に違いを見つけたら中断)
2.完全一致検索 ( 2pass )
同じサイズのファイルをリストアップ
リストアップされたファイルのCRCを計算する
最後に同じサイズで同じCRCのファイルがあったら全比較する
3.簡易検索 (CRC32)
同じサイズのファイルをリストアップ
リストアップされたファイルのCRCを計算する
4.サイズを無視(部分一致)
1〜3は同じサイズのものがあったファイルしか開かないのに対し、これは指定したサイズ範囲の上限
以上の大きさのファイルを全て開き部分一致チェックする
※1〜3は「部分一致検索をする」にチェックを入れても無視される
2と3は拾い集めた画像フォルダ等、同じファイルが多数存在する可能性がある場合に有効
拾い集めた画像フォルダなら3で十分
サイズとCRCの両方が万が一一致してしまうのがいやな完璧主義なら2を使う
1はファイル構成が同じはずもしくはほぼ同じ(バックアップとか)のフォルダ同士を比較する時等に有効
同ファイルが基本的に1対1ならCRCの計算と全比較の両方やるのはムダ
それ以前にフォルダ比較ツールでも使った方がいい
拾い集めた画像フォルダでもまめに一致検索をしている人は同じファイルが多数存在している
可能性が低いのでこっちを使った方がいいかも
256 :
255:2010/03/20(土) 23:13:57 ID:VvY3CR4s0
4は1〜3のどれかで同ファイルを処分した後、一部破損で不一致になったファイルやダウンロード
ミスで途中で切れてしまっているファイルを探したい時に有効
指定したサイズ範囲以上の全ファイルを開くので大量にある画像フォルダより、でかいゴミとなる
動画等の大きなサイズのファイル向き
より完璧にしたいなら比較範囲をずらして2回やる
その際、指定した範囲が動画等のヘッダ部にかぶってしまうと違うファイルでも一致してしまう
可能性があるので、多少先頭からずらした位置を指定する
拾い集めた画像の場合一度目で見てキャッシュになっているものを保存するので途中で切れている
可能性はまず無いし、ヘッダのみが違っているファイルはたいがいファイルサイズも違うので無意味
(ヘッダを無視を使った方がいい)
257 :
255:2010/03/20(土) 23:23:25 ID:VvY3CR4s0
訂正
×9*8*7*6*5*4*3*2回
○9+8+7+6+5+4+3+2回
>>255 とりあえず、その1から4はそれぞれ比較方法の一つであって(UnDupには7通りの比較方法がある)
オプションである「部分一致検索をする」と同列に話すのはどうかなあとは思う
あと、「サイズを無視」には「部分一致検索をする」オプションが必ずセットでついてくるだけの話で、
基本的には(おそらく)全てのファイルを対象にCRC32での簡易検索をするものかと
他の比較方法の時はしたい人だけ「部分一致検索をする」にチェックを入れればいいよと
正直「部分一致検索をする」の使い道があまり思いつかなかったんだけど、確かに破損ファイルは探せるかもねえ
一度比較して重複をなくした後、部分一致検索してもし一致するファイルが有れば破損・不完全ファイルの可能性はあるね
少量の動画ファイルくらいならエクスプローラ上でファイル名やサイズでソートして人の目で確かめた方が速い事が多いだろうけど
259 :
名無しさん@お腹いっぱい。:2010/03/21(日) 04:15:23 ID:M0W9f3rM0
難しい
CRCもよくわからんから読んでも理解できんわ
260 :
255:2010/03/21(日) 04:24:24 ID:KXz/0NQ40
>>258 >あと、「サイズを無視」には「部分一致検索をする」オプションが必ずセットでついてくるだけの話で、
>基本的には(おそらく)全てのファイルを対象にCRC32での簡易検索をするものかと
>他の比較方法の時はしたい人だけ「部分一致検索をする」にチェックを入れればいいよと
全て違うサイズで1対だけわざと部分一致したファイル(サイズは違う)を入れたフォルダに対して
「サイズを無視」検索をやると当然1組の重複として表示されるけど、1〜3は「部分一致検索をする」に
チェックを入れてもヒットしないし、File Monitorで見ても1ファイルも開いてないよ
だから、 「>基本的には(おそらく)全てのファイルを対象にCRC32での簡易検索をするものかと」 は×
(「サイズを無視」は全ファイル開いてる)
1〜4以外の名前とかサイズとか日付とかのオプションを選択した時は「部分一致検索をする」がグレーに
なって使えなくなるから「部分一致検索をする」は「サイズを無視」以外では無効ってことだね
も1度訂正
○9+8+7+6+5+4+3+2+1回
261 :
255:2010/03/21(日) 06:30:52 ID:KXz/0NQ40
すまん、間違ってた
1〜3で「部分一致検索をする」にすると、同じサイズのファイルがあったらそれらの部分比較をするみたい
ファイルをコピーして片方の一部を意図的に変更して比較実行すると1〜3ともヒットする
1は指定範囲のみの完全一致
2は指定範囲のみのCRCと完全一致
3は指定範囲のみのCRCの一致
ということかな?
ファイルサイズが同じものだけしか比較しないから一部破損とかフォーマットが決められたサイズ固定の
データの部分比較とかに使えるかな?
でも上限値がキロバイトでしか指定できないからデータ等には使いにくそう
なるほど
重複画像検索作り出した。どこかに良いサンプルあるか。
重複だったら自分でコピーで作ればいいがな
>>263 > 重複画像検索作り出した。どこかに良いサンプルあるか。
途中のやつをガンガンUpしてくれ。
自分の画像でテストするから。
重複画像検索作り出した。どこかに良いサンプルあるか。
重複=ほとんど同じっていう意味。類似だ。
わかったアップする。ちょっとまっててくれ。
イラネ
これはひどい
UnDupって画像の中身判別してくれんの?
サイズ・拡張子に関わらず
Undupは近似類似じゃなくて重複だよ
設定や状況次第では類似や近似的な使用法もできるけど
そこはやはり専門のソフトでやったほうがいい
273 :
名無しさん@お腹いっぱい。:2010/04/19(月) 00:21:37 ID:/2hhSVE20
近似類似をみつけるのでいいソフトはどれ?
274 :
名無しさん@お腹いっぱい。:2010/04/19(月) 19:46:35 ID:+J6FlOsL0
ここで使われている「近似画像」とはどういう意味なんでしょうか
275 :
名無しさん@お腹いっぱい。:2010/04/20(火) 02:00:11 ID:RqjatjVA0
俺もそれがわからん
たとえば少しコラージュされてるのを見つけてくれないよな?w
井口と宮里藍の顔画像は類似
宮里藍と爆弾岩の画像は近似
マナとカナ
誤用だろ
ファイルのヘッダ部分を読み込んでBB2Cの画像を一括削除するようなツールありませんか?
BB2Cに貼られた画像は画質があまりよろしくないので全部消してしまいたいんですが・・・
そもそもBB2Cって何か分からん。
281 :
279:2010/04/21(水) 23:18:37 ID:Vz1SAT3J0
BB2Cも知らないとか……(^^;)
マカーw
BB2Cはわかるけど特定できるもんなのか
284 :
名無しさん@お腹いっぱい。:2010/04/22(木) 07:39:26 ID:lgT1B45H0
近似類似をみつけるのでいいソフトはどれ?
心眼
BB2Cってソフトか。
ファイル形式でないなら無理だろ。
287 :
279:2010/04/26(月) 06:36:40 ID:gyNPIVbx0
>>281は別人です
16進検索できるツールで事足りました、スレ汚し失礼しました
288 :
名無しさん@お腹いっぱい。:2010/04/26(月) 09:46:49 ID:+Z/cyf4M0
類似動画検索ソフトはないの?
心眼
スレほとんど読んだけど、
結局類似画像をマルチスレッドで比較処理して、さくっと削除できるソフトってないの?
スマン!どれがいいか分からん
とりあえず、今は、
@Duplicate & Same Files Searcher (同一ファイル削除)
↓
Aimage compare (類似画像を自動削除)
↓
BSimiPix (類似画像を手動削除)
みたいな流れでやってみてるんだが、AとBがどう見てもシングルスレッドだと思う。
画像1万枚比較するのに5分くらい掛かるし
あと数万枚くらいあるので、最後の手動の手間を和らげたいので、助けていただきたいです。
やっと4coreに変えたのを 活かしたいのでよろしくお願いします。
293 :
292:2010/05/14(金) 06:49:08 ID:j98b+Aa90
ご理解していただけているならば失礼かもしれませんが、
SimiPixの場合、3枚、4枚と同じ画像の類似画像がある場合、
手動で削除したあともう一度比較検索しないとちゃんと削除できたか、
分からない仕様ですので、3回も4回も検索する必要があり、
1万枚だと20分くらい比較するだけで時間を取られてしまいます。
今後の手間もありますので、良い方法や速いものを探しているというわけです。
どうぞよろしくお願いします。
HD なんて安いんだし、どれだけ重複しようが気にせず集めろ。
エロゲとか同人CGの差分ファイルは判別するの難しいようですね
DupDetector、Grid、SimiPix、ImageCompareで
それぞれ、設定どノーマルでためしてみたけど
差分を類似画像として検出してしまう。
それって類似してないの?
むしろ差分を探すときにこそそういうのを使うのでは?
そう言われてみれば、確かにそうですね
画像の解像度の小さい物を一掃しようと思って
色々ためしてみたのですが
自分の目的に適った物はなさげですな。
300 :
名無しさん@お腹いっぱい。:2010/05/24(月) 02:57:53 ID:Cy90NISH0
差分ってどういう状態?
類似がリストアップされるからそこから目視で解像度見てけばいいんじゃ・・・
差分イレブンいい気分
差分い事言うなよ
305 :
名無しさん@お腹いっぱい。:2010/05/25(火) 07:27:48 ID:R7oRvQbx0
んで差分ってどういう状態?
北島差分朗
差分は動画ぽくできるからいいと言ってみる
だが1500あるとやっぱり8割程度削りたくなる
差分もわかんねーのか?
挿入・中出し・ぶっかけのことだ。
子分が進化すると差分になるよ
312 :
名無しさん@お腹いっぱい。:2010/05/31(月) 14:26:24 ID:+ojIE8/j0
んで、差分ってどういう意味?
ほ
しゅ
しゅ
あるけど使い物にならないといっても過言ではない。
カタログ上で、似たもの同士でソートしてくれるだけでいいのに
こんなシンプルな機能がAbleCVしか無い…
ThumbsPlusにもあるぜよ、シェアウェアだけどな
数万の近似画像検索ってsmartEye以外は使えんな
まぁ、Ver1以外は糞だがw
よさそうだけどフリーで欲しいな
323 :
名無しさん@お腹いっぱい。:2010/09/07(火) 23:43:01 ID:VHlyKuru0
>>316 ツールに内臓のビューアで類似画像が並んで表示されるんで比較しやすいんだけど
こっちの画像を削除したいと思ってもこれがまた削除しにくいんだよな。
パッと見て比較出来ていらん方をパッと選択して削除出来るようなツールはないもんかねぇ
>>324 つかsimpixで間に合うような気もする
って使ってみたけど一度検索掛けたらキャンセル出来んし
対象ファイル数に制約あるしでしっくりこんな
このスレ参考にいろいろ試させてもらいます
simpixはini書き換えで検索ファイル数増やせます
久しぶりに来たけど定番は変わってないみたいですね
simpixが一番性に合ってたけど
字が小さくて見辛いのが年寄りにはキツイですじゃ
>>327 > simpixはini書き換えで検索ファイル数増やせます
書庫に .Ini が入ってないので、書式が分からん。
>>329 一度起動、終了させるとフォルダ内に作られるはずですが
書き換えるところは見ればすぐわかるよ
unDupみたいな重複処理ソフトってハッシュで判断してるの?
>>331 バイナリ比較・ハッシュ比較などいろいろ。
unDupは比較の方法がreadmeかどっかに書いてあったはず
最近拾った画像ってPicasa通してたりで画質も画像の大きさも一緒なのに重複反応しないのが多くて萎えるわ・・・
ハッシュ値だと1画素が1輝度変わっただけで全くの別物だからな
Picasaってタグ付けかなんかで書き変えるんだっけ?
picasaよりbeebee2see画像がうざいわ
exif情報削除ソフト的なモノを使えばいいんだっけ?
あんまり気にしないので分からんが
FileHammerに類似画像検索が付いたらしい
重複でしか使ったことないからどんなものかは知らんけど
UnDupの更新が途絶えて久しいので他のソフトも試してみるかと思ったけど、どれも検出したファイルの処理においてUnDupにはかなわない。
具体的に言うとUnDupマニュアルの
4-8.フォルダ比較(Ver.1.5dから)
(1)削除すべきフォルダの選択を補助するため、対象となるフォルダ内のファイル数を表示します。
なお、フォルダ内にある[無視するファイル]はファイル数にカウントされません。
(2)ダブルクリックすると、エクスプローラでフォルダを開き、フォルダの中身を確認できます。
(3)[フォルダ選択]で、そのフォルダ内の重複ファイルを全て選択します。
なお、下位フォルダ内のファイルは選択されません。
(4)[直ちに削除]で、そのフォルダ内の重複ファイルを全て削除します。
(5)[フォルダごと削除]では、そのフォルダ自身と内部のファイルを全て削除します。
下位フォルダがある時はこの機能は使用できません。
(将来的には選択的にして下位フォルダごと削除できるようにする予定)
にあたる機能がない。
この機能が便利すぎて他のソフトに移行できないぜ。
移行できるような自分にとって更に使いやすいソフトが出てきたら素敵やん
結局ただのおねだりかよw
CheckOverlap
http://space.geocities.jp/checkoverlap/ CheckOverlap - 同じファイルを何度も違う設定で圧縮した書庫を整理する奇特な人向けアプリ
CheckOverlapは指定されたフォルダ内の書庫の内部を検索し、同じファイルを内部に持つ書庫を削除する事が出来ます。
例えば同じ画像ファイルを異なる圧縮率で圧縮すると、これまでのアプリケーションでは同一であると判別できません。
本アプリケーションはそれを可能にし、HDDの節約とファイルの整理を可能とします。
書庫内部が完全に同一でなくとも、重複ファイルの割合が指定した値を超えた場合に削除する事も出来ます。
なぜか同じようなファイルを圧縮したファイルを大量に扱う人がいたら、有用でしょう
同人誌の重複を減らせるので、整理に便利かもしれませんね
また、検索時に以下のような無駄な書庫を削除できます。
・内部に実行ファイルか書庫を持つ書庫
・破損したzip書庫
・パスワード付きzip書庫
機能としてはUndupの補完になるでしょう。
↑犯罪者御用達
せっかく見つけて紹介したのに即そういうレス来ると一気に萎えるな…(´・ω・`)
書庫ファイルの中じゃなくて、普通に jpg bmp png gif を検索して欲しい。
画像処理用のスレで書庫の重複を紹介するような馬鹿犯罪者は萎えてた方がええ
なんかこういうソフト使うとシステム?がメモリ使いまくってスワップまで発生するね・・・
4Gで1.5Gは空いてたのにあっという間に使い切ってる。Win7 64bit
351 :
名無しさん@お腹いっぱい。:2010/10/02(土) 20:55:13 ID:dO3y4DAv0
拡大して見比べないとほとんど差が分からない類似画像を整理してるんだけど、
それぞれの画像をフルスクリーンでプレビューして比較できるソフトってないですかね?
Vectorにあるソフトをいろいろ試したんだけど結局pickpix2で類似画像を検索して
ビューアソフトのLinerで表示して比べるっていうめんどくさい方法で今やってます。
拡大しないとわからないような画像は
PICOで検索してVIXで同じ位置に開いて拡大してから
タスクバーで素早くウインドウを切り替えて差を目視確認してるな俺
ところでお主らファイルのリネームとタグ編集は誰を雇ってあるのかのぅ
わしはファイル名の一括変換や通常のソフトには出来ないような多段階リネームには練馬さん
そしてメディアファイルのタグ情報を高度に編集してくれる練馬さんの相棒ことタグエディタの田吾作どんを
5年前に雇ってからずっと仕事してもらっておるぞ
思いのほか仕事がはかどるのでもう誰も雇わんでええんくらいじゃ
二人とも名前はダサいかもしれんし多少気難しい所もあるがいい仕事しよるよ
こやつらはまさによい相棒じゃな
354 :
351:2010/10/03(日) 16:26:44 ID:Ueod4pHY0
>>352 PiCoはビューアを指定して表示できたんですね。
かなり作業が楽になりました、ありがとうございます。
ちなみにいろいろ調べたらpickpix2単体でフルスクリーン表示が
可能だと分かりました。
でも使い勝手が今一つ悪いのでPiCoでの作業の方が楽みたいです。
355 :
名無しさん@お腹いっぱい。:2010/10/03(日) 18:44:43 ID:kA2aHdlA0
JPEGより性能悪いらしいけど
UnDupのJpegのヘッダ無視するにすると33万いくつかくらいまで列挙したとこで止まってしまう
その状態になるとCPU負荷が上がるので暴走してるのか?
MaxBufSizeが小さいとかかねえ
画像拡大してなめらかにするソフトで一番のオススメありませんか?
かっくかくになるのは仕方ないですか?
>>360 ありがとん
フリーでこんないいのあるんだ助かったよ
でもやっぱ見えない
当て逃げした車の画像手に入ったんだが拡大するとひらがながきついな
元画像に依存するからどうしようもねえよ
映画みたいな拡大を期待してるんだろうか
>>361 「当て逃げした車の画像手に入った」ってどういう状況なんだ????
>>357 JPEGヘッダを無視するって使った事なかったんだけどもしかして使うとPicasaとかの影響で同じ画像でも別物扱いになってたのが検出できるようになる?
>>365 Picasaなどによって書き込まれたタグだとか
デジカメ画像なら機種やレンズの情報、サムネイルあたりを無視して
本体画像を比較するようになる
ヘッダを読み飛ばすためにファイルを読み込む量が増えるので遅くなるが
チェック中はほかのことをしてればいいので個人的には非常にお勧めする
でも取りこぼすよね
類似検索ソフトじゃねーからな
画像を登録して、以降そのファイルがあれば削除するソフトってないかね
ろだから大量に落として見てるんだがチェックだけで時間が過ぎてゆく
平均1枚2秒でチェックするとして、1月で1万枚くらい=2万秒=333分か
胸が熱くなるな
ジャンルでいうと脳=hdd間の重複削除
意味が分からない
>>371 名前が重複するから以下略
そんな管理ソフトもあったな
またファイル名をハッシュで揉めるのか
1年前のことをまだファビョってるのか
>>366 試しにJPEGヘッダ無視オプションを付けてやってみたら・・・
今まで重複扱いされなかったのが出るわ出るわで驚いた
勝手にタグ付けるソフトは死んで良いと思う、PicasaとかフォトショとかHP作るソフトのタグ・情報が多かったな
取りこぼすけどな
>>376 その取りこぼすファイルとやらを
検証用にアップしてみろよ
また取りこぼしの話かwwwww
もう、画像を256x256x16bppのbmpに変換してそのハッシュをファイル名にしちゃえよ。
取りこぼすってのは仕様
取りこぼし厨が未だかつて検証用ファイルをうpしたことがあっただろうか?
いや、ない
おしえてあげないよ
付けられたタグやソフト情報って消せないのか?
てかどうやって見てるんだ
シェアウェアになったらしいが使用制限は無いんだとさ
SimiPix.exe Ver1.03 2010/10/17
計算の一部間違いを修正
アルゴリズムに変更はないがほんの少し精度が上がってるかもしれません
キャッシュを使用するようにした
移動先としてごみ箱を指定できるようにした
スキャンを中止できるようにした
ウィンドウサイズを変更できるようにした
パラメータに類似しきい値を追加した
類似画像の並びに優先度をつけた
MD5による完全一致を判定するようにした
関連付けられたアプリで画像を開くことができるようにした
他に比べて足りなさ過ぎた機能が増えていい感じ
フォルダ選択のときにカーソル合わせが反応するとこ小さくね?
優先度が複数選択できるとより便利なんだけどな
しきい値150まで上げると100でピックアップされなかったトリミング画像がいくつか検出された
ビューワへの関連付け設定するとこが見当たらないwin7 64bit
「開始」の下のボタンが表示されてないけどこれか?
ファイラからsimipixに送る時uwscに仲介して貰ってるんだけど
コマンドラインつけて欲しいな
ここで言っても意味ないか・・・
オマンコライン
まんこ
389 :
名無しさん@お腹いっぱい。:2010/10/30(土) 23:48:37 ID:C/kU2aXi0
ほしゅ
加工済みの画像をデータ解析できるソフトありませんか?
元の撮影日時が知りたいんです。
Exifでは出ませんでした。
EXIF以外に日付とかの情報持ってる場所なんてあるの?
392 :
名無しさん@お腹いっぱい。:2010/11/03(水) 09:54:26 ID:v30gtWTJ0
ない
Undupってメモリリークかなんかしてる?
使ったあとメモリの空きが元に戻らないんだけど
半分の2Gは空いてたのに
OSのキャッシュじゃなかろうか?
メモリリークがプロセス終了後もそのまま残るんならOSが糞すぎる
>>395 こういう馬鹿たまにいるよな
メモリリークについて無知すぎる
まあ答えも出せないなら黙ってろってこった
プロセスが使ったメモリーはプロセス終了時にOSが解放する。
これはOSの役割だから、プロセス終了後にメモリリークしているならWindowsの不具合です。
もしかしてメモリリークが取りこぼしの原因?
>>399 ですからプロセス終了時にメモリリークは普通起きません。
メモリがぶっこわれている時だけです。ECCでも使ってくださいwww
壊れててリークとかプッ
メモリがぶっ壊れてるとメモリリークするってすげぇ発想だな
プログラミングのプの字も知らずにECCの機能から
適当に推測するとそういう結論が生まれるんだろうか
おまいら、Win98のことわすれてないか。
>>399 その程度でメモリリークが発生しないのならどうやったってメモリリークなんて発生しないだろアホか
プロセス起動中に発生する。
落とせばなくなるというだけで。
取りこぼしは仕様だからメモリリークと関係ない
408 :
名無しさん@お腹いっぱい。:2010/11/06(土) 03:37:31 ID:RNmW7IVk0
エロ画像収集家以外で使ってる人って何に使ってんの
エロじゃない画像収集
デジカメで撮った写真をどんどんPCに転送してると普通に重複してしまうのでこの手のツールは必須
SimiPixが良い感じなんだけど
消したいファイルのほうがまともなファイル名だったりすると悩む
DupDetectorがお気に入り
Undupはこぼさない
今日もどこかで取りこぼし♪
明日もどこかで取りこぼし♪
>>405 プログラムが悪さしてるだけで今時OSレベルのリークなんかしねえよw
XPSP3の安定度は異常
>>417 XPはwindowsのシェアの6割以上をしめているわけだが
さらにXP以降はこれといって機能拡張などなく、見た目や内部構造の変更ばかりで、
余計にリソースを食う以外に特徴なんて無いと思うが
DX10・11を忘れてもらっては困る
なにそれ美味しいの?
ものすごい数の機能が追加されてるんだが
ID:7kdgdPxn0にとってそれらは機能とは呼ばないのか
それがあると具体的に何がどうなるのか、判りやすく教えてくれ
XP っつーか、98 だろう。
Win5 カーネルの時点で
デバイスドライバとかが起こさない限り
そんなメモリリークなんておきねーよ。
いやMeかもしれんぞw
>>424 何言ってるか意味ワカランが、条件によってメモリリークするんだな
絶対メモリリークしないとか言い張ってる馬鹿は何を根拠に大ボラ吹いてるんだろうな
427 :
名無しさん@お腹いっぱい。:2010/11/08(月) 21:40:16 ID:BDRMSKmx0
>426
具体的に条件を書いてくれ。
俺メモリリークって言ってた人じゃないんだが
プログラム立ち上げて終了したふりをして終了していなければメモリリークに見えると思う。
お勧めのメモリリーク、重複、類似、近似画像処理ソフト3
だからメモリリークなんてのはどうでもいいんだよ
svchost.exeってのが900,000KBほど占有してたよ
これ開放できないの
ほかでやれや
条件:情弱OSを使っている
Vistaや7はメモリリークなんて絶対しない(キリッ
>>430 SuperFetchかWindows Searchが頑張ってるんだよ、切るかそのままほっとくかしとけw
初心者質問スレでもいってこいよwwwww
ここ初心者スレじゃないのw
ここは取りこぼしスレだよ
そうだよな 7はともかくVistaなんて使ってる情弱が何ほざいても負け犬の遠吠えだよな
【情弱】
・厨がとりあえず使ってみたがる単語
・使うと頭良くなったような気がする(ヒント:脳内)
初めてこの類のソフト必要になってSimPix使ってみたけどいい感じでした
>>438 なんで急にvistaの話なんかしてるの?w
vistaすきなの?wwwwwww
まあVistaも、SP2+爆速パッチで結構快適よw
裏を返せば、それ位手を入れないと快適に使えないと言うね・・・・(^^;)
すぐブルーバックするOS以外なら何でも良いよ
末尾Pはアホばっかりだな 全部同じ奴か?
末尾pってだけで全部同じ奴とか・・・
頭どうかしてるぜ?
末尾Pに碌な奴いないのは確か
ヒント:XP厨にはキチガイしかいない
XPってサポートまだされてるんだ?
末尾Pの奴ってどこで見てもp2を買うハメになるような言動してる奴ばっかりなんだが
そんなことより取りこぼししようぜ!
また取りこぼしたでござる
馬鹿なのにしつこいって最悪だな
またメモリリークしたでござる
ここがメモリリークスレだ
取りこぼしのたびにメモリリークするね
undupでフォルダを開くとエクスプローラーの
GDIオブジェクトがどんどん増えていくのは確認した。
undupの問題か微妙だけど。
PiCoすげー気に入ったんだけど、pngで5MB以上あると収集でオープンエラー起こすな
picasaの重複処理はなかなか優秀だと思う今日この頃
あの操作性で判定基準の設定ができればもっと良くなるのだけどね
picasaは取りこぼしソフト
SimiPixは使いやすいんだけど、何でドラッグとか ..SimiPix.exe C:\hoge みたいな記述で
検索フォルダを指定出来ないんだろう
毎回ダイアログから指定するの面倒なんだが・・・
SimiPixはトリミング画像を類似性高いとして上位に挙げられるようにしてくれ
下位に出てくるので大量の誤検出の中から探すのが面倒だ
Undupを使って重複画像を見ようとしたのですが、登録したはずのMassiGraで開かずに
Air草紙っていう青空文庫読むソフトで開いてしまう。……何が原因なのやらさっぱり
gifだとそうなるな
enterじゃなくてショートカットキーのvから開けば平気なはず
俺の場合はそれで開けば関連付けたので開いた
>>466 あ、本当だ。助かりました。ありがとうございます。
こっちはjpgでもpngでもAIR草紙みたい。
Undupって稀に自分でファイルをロックしておきながら
ロックされてて消せないっていってくるけどどうにかならん?
タスクマネージャを開いて、
プロセスのリストから
Undup を見敵必殺
Unlocker使え
GRIDでzipやlhzの中身を検索したいのですけど
やり方がわかりません
対応したdllを実行ファイル(Grid16.exe)と同じフォルダに置けとサイトに載っているのですが
書かれているままUNLHA32.DLLをGrid16.exeと同じフォルダに置いてGRIDを起動し検索パス1にzipを放り込んでみても検索できません
やり方が間違っているのだろうと思うのですがどこが間違っているのか訂正してもらえれば嬉しいです
ちなみにdllはulh3267a.exeをインストールせず解凍しdllを取り出してgridフォルダに入れました
ぜってー釣りだ
ttp://www.katsakuri.sakura.ne.jp/src/up48818.jpg FileHammerで時たまにタスクバーのタスクボタンを右クリックすると上記画像のように
「元のサイズに戻す」とかが途切れて表示されたり、「閉じる」が文字化けしてしまうんだが、漏れの他にもなる香具師いない?
このソフトには1.14.3からお世話になってるんだが、1.14.3でも最新版の1.15.1でも起こる
設定を初期化しても起こるで参ってるんだ。ちなみに漏れはXP SP3使用中
475 :
名無しさん@お腹いっぱい。:2011/01/06(木) 03:03:15 ID:WJPD+hWt0
c:\master\A\画像.jpg
d:\slave\B\画像.jpg
というような同じファイルがあり、masterとslaveをフォルダ比較した時、
slaveの方の画像.jpgを重複と判定し削除できるツールはありますでしょうか?
undupを使用していたのですが、フォルダ構造が違うと重複と判定しないようなので
え?
色々浮気して結局Dup Detectorに戻っちゃったw
比較方法が全画像、フォルダ指定、画像指定と3種類使えるところが良いね
特に1枚の画像を指定して検索できるフリーソフトは少ないので重宝する
10万枚の画像で実用性あるのってどれかな?
smartEyeみたいにデータベースファイルを作ってくれるようなもの
十万三千枚の画像ファイルを全て記憶すれば円満解決。
P2使いに健常者無し
>>477 ちょっと面倒だけどリネーム出来るところが良い
SimiPixにリネーム機能が付けばベストなんだけど
>>478 ThumbsPlusとかどうよ?
MySQLを使えるので実質的に億単位でデータを扱えるが
シェアウェアだし、最新版は日本語版出てないから使うならよく検討した方がいい
ver7(最新の一個前)なら日本語化した状態で動かせる
実際、俺はver7+MySQLで動かしてるが
ファイル数的には200万は超えてると思う
そんなにエロ画像収集して何するの?
いえ芸術です
久々にGRIDを使ってみたら
ResultView下段の画像上で右クリすると応答無しになって固まっちゃう
右クリしない限りは異常無いから使えちゃいるがなんでだー?
問題なく使えてた旧バージョンを引っ張り出してきても同様だから
俺の環境に問題があるんだろうが見当がつかんぜ
486 :
名無しさん@お腹いっぱい。:2011/01/17(月) 02:23:26 ID:ack2X1pg0
「これだ!」ってソフトがなかなか無いから、自分で作ってみた
ベータ版でバグ残ってるかもだが、よかったら感想を聞かせてほしい
ttp://www1.axfc.net/uploader/Ne/so/99852.zip ・ウィザード形式
・ファイル/フォルダ/ZIP内エントリ単位で個別指定可、2フォルダ相互比較可
・検出アルゴリズムは外部プラグインで追加可(プリセットで類似判定/完全一致判定)
・検出後はルーペつき画像サムネイルでチェック可、条件指定で削除・移動
・マルチスレッド、キャッシュ対応
操作にややもっさり感があるかもしれないが、ぼちぼち修正してく予定。
487 :
名無しさん@お腹いっぱい。:2011/01/17(月) 02:31:44 ID:ack2X1pg0
自環境での簡単なベンチマーク結果
ファイル数 5,300、2.14GB
読み込み キャッシュなし 9:02 / キャッシュあり 0:10
比較 1:11
生成されたキャッシュは 547KB
比較用:同じ環境でSimiPix
読み込み(初回) 6:41
比較 0:07
undup、意外ととりのこしがあるのな。
類似じゃなくて、完全重複での話。
Nameryというソフトに近似画像検索がついたソフトか
ImageCompareにリネームがついたようなソフトはないですか?
>>486 > ベータ版でバグ残ってるかもだが、よかったら感想を聞かせてほしい
「処分するファイルの選択」で、何を選んだら良いのか分からんのだが。
「類似ファイルの存在するファイル」に同じ画像が出てくるし、
類似ファイルクラスタ、ってのも何なのか分からん。
やりたい事は、重複画像をどれか一つ残して残りを処理したいだけなんだけど。
オールjavaやだ。遅い。
画像フォルダ選択して「次へ」を押すと落ちるわ
XPSP3
>>486 win7 32bit
画像がいっぱい入ってるフォルダを開くとかなりもたつくね。
画像6600個のフォルダを展開するのに70秒、12000個のフォルダだと4分以上かかった。
やっとこさ開いたところで終了、再度起動させたら起ち上がるのにも同じくらい時間かかったんで、
終了時に開いていたフォルダを記憶するかはオプションで選べるようにしてほしい。
そんで画像を選んで「次へ」をクリックしたらまた固まっちゃったんで、そこで使用を止めてしまった。
せめて対象選びの段階くらいはサクサクやらせてくれないととても使う気になれない。
オールjava
お兄ちゃんこれはjavaね
サイズが同じやつだけ調べて、全く同じ画像だったら消す、って事だけがやりたい。
どれを使えばいいんだ。
単純な機能でいいのに。
それ重複ファイルだろ
いっぱい書いてあるじゃないか
bmp と gif で縦横サイズ一緒、ピクセルデータ一緒とか検出したいんだろ。
殆どが不可逆圧縮なんだからピクセルデータが一致するわけ無いじゃん
>>488 取りこぼし言ってるはまず勘違いだからさ
実際にそのファイルあげてくれないと話にならないよ
取りこぼすよ。
比較処理がいくら早くても、OSのファイル検索が足をひっぱる
最初のバージョンにしてはUIがよくまとまってる
いまんとこ完全一致だけ欲しいからスピード上がったらいいかも
ピクセルの完全一致なら
画像のRGBデータからハッシュを作成してリストを出力する自作ツールを使ってるな。
「検出された重複ファイル」が入っているフォルダ内の、ファイル数比較が出来るのってUnDupだけ?
重複ファイルのうち、ファイルが沢山入っているフォルダに入っている方を優先的に残したいということがよくあるのだが。
FileManyで重複ファイルの削除始めたら8コア(i7-870)フルに使われてしばらくなんも出来なくなってしまった。
CPU97〜100%使われるなんて初めてだわw
Win7-x64のごみ箱に入れる処理(システム)のせいみたいだけどね。
大量の重複ある時はごみ箱使うのやめたほうがいいな。
単に使うコア数を減らせばいいんでね
509じゃないけどそんなこと出来るの?OS側で設定するの?ソフト側で設定するの?
>>510 Process Explorer常駐させてるから、再処理させたときは半分だけコア使わせるようにしたよ。
それでもメモリ1Gくらい使われるから重くなるのは仕方ないねw
あとでバージョンアップしてみよう
更新しました。バージョンアップお願いします
えー作者さんすか。
どっちかてーとOSのせいじゃねーの。
なに変えたんだろ?まあいいや。
スレッドわけました。
アーカイブにバージョン?
Explzh使ってますができますかね
UnDupの先頭1Mだけ比較で止ってたファイル数でも比較出来るのはいいね>FileMany
>>517 FileMany1029.zip
みたいにしてくれ
>518,519
どもです。
何かありましたらHPの掲示板にもご連絡頂けると参考になります
ファイル名はリンクや外部サイト登録の関係もあるのでこのままでお願いします
そうか
486じゃないけど、そんなに速度重視なら、ということで
C++で類似判定テストツール書いてみた。
ttp://www1.axfc.net/uploader/Sc/so/197880.zip 自分の環境だとSimiPixと比較して以下の感じ。
元データ:2500ファイル(720MB)
SimiPix(キャッシュ無し初回構築):60sec
俺テストツール:32sec
てことで2倍弱の速度がSimiPixと比較して出せる感じ。
テストなので類似判定はするけど削除処理は怖いので一切搭載してない。
まずは速度と精度でお前らを納得させられないと二度と使われないだろうから
2回目以降を見越したキャッシュ機能も搭載してない。
自分の環境だと結構良い感じの精度なんだが、
お前これ取りこぼし酷すぎるわor誤判定多すぎって場合は出来れば具体例
上げてもらいたいが、まぁ、物好きな人数人にコメントでももらえれば幸い。
サイズでっけ
>>523 もし俺のことなら、サイズでかい点はすまん。
GUI自分で書くの嫌だったからwxWidgets使ってるんだが、
これがデカくてね……これだけで1.5MBくらい食うんよ……
ということで、使い方書くの忘れてたが、類似チェックしたい画像の入った
フォルダをD&Dしてやると勝手に処理を始めます。
wxWidgets 使いつーと、meeyaスレのあの人か。
一般物体認識用のデータセットって書いてあるでしょ
用途が全く違うよ
何かよく分からんけど使うので、最新版のダウンロード直リンURLを貼ってくれ。
529 :
522:2011/01/28(金) 22:59:34 ID:WfpKiZJQ0
>>525 まぁそうなんだけど、wxWidgets自体はなんだかんだで使われてるケースが
結構あると思う。専用スレで質問すると速攻で回答付くくらいだし。
>>526 テストデータの紹介ありがとう。
ただ、527が指摘してるように、これって同じような構図、同じような被写体の
類似度判定のためのヤツなんだよね。
このスレで要求されてる類似性って、bmpとpngとjpgでサイズ違いの同じ
画像を「同じである」と認識する程度でいいんじゃね?というので自分は
今回のを作ったので、ちょっと用途が違うんだ。すまん。
>>528 ttp://www1.axfc.net/uploader/Sc/so/197880.zip てことで、予想よりたくさんの人に落としてもらってるっぽいのは非常に
ありがたいのだけれど、速度or性能が使い物にならないならならないって
書いてもらえると……
外部から使えるように
コマンドラインなり DLL なりに
切り分けてくれるとうれしい。
FileMany て、いつまで経っても終了しない
完全一致ファイルを探したいだけならLightningって検索ソフトに付いてる重複チェック機能も早いよ
115万ファイルの重複チェックしたらFileMany 56分37秒 Lightning 8分53秒だった
両方とも最低サイズ1MB以上 先頭1MBのチェック時ね
両者の重複チェック結果が一致しないから調べてたら
FileManyってシンボリックリンクも気にせず読み込んでるっぽいね
C:\ProgramData\とC:\Users\All Users\の中身が全部重複扱いされてたわw
これ非常に怖い
どちらか片方だけ削除したつもりでも両方消えちゃうよ
534 :
名無しさん@お腹いっぱい。:2011/01/29(土) 11:32:35 ID:9MewXHLF0
使う気ないからどうでもいいや
てかシンボリックリンク使ってるようなとこに画像データとか置いとかねーしw
スペック書く意味無いような
FileManyって最初の検索対象フォルダの列挙に時間がかかるから、たくさんのフォルダを検索するような場合は総合的には早くはないね。
使う気ないからどうでもいいや
誰かundupパクってバージョンアップ版作っちゃえよ
541 :
名無しさん@お腹いっぱい。:2011/01/31(月) 07:56:44 ID:s7FmG7wX0
言い出しっぺの法則、自分でやれ。
っ FileMany
イラネ
完全重複ファイル削除系のツールなんて
再帰(かなり基礎)だけ知ってればあとは作るの簡単だから
自分で作れと。
プログラム何も知らない奴でも多めに見積もって1ヶ月あれば
そこそこ動くものがつくれるんじゃないか?
画像での重複、類似となってくるとまた話は違ってくるけどな。
undupレベルに使いやすい奴を初心者が作れるの?
C++でHello worldできるだけだぜ
出来るさ、少なくともベーシックな重複に
関しては544が一ヵ月ででやってくれる。
コマンドラインで動いて、
バッチを吐くだけだったら今すぐ出せるぜ。
C# のソースで 185 行。
でもお前らイラネっていうとおもうんだがw
549 :
名無しさん@お腹いっぱい。:2011/01/31(月) 14:34:34 ID:MBFRXpRe0
イラネ
ほらな
C#でバッチ吐くだけならいらないな
重複削除じゃなくて、重複した画像を別の場所に移動したいんだが。
544が言う様に完全重複の検出はそれほど高度なことではないだろう。
重要なのは多少のスピードより、リストアップされた重複ファイルをいかに効率よくさばけるかだ。つまりUIだよな。
俺にはとてもUnDupに匹敵するものは作れそうにない。
(どうせ重複ファイルの検出なんて時間のかかる作業は放置プレイなので多少の速度差は気にならない。)
554 :
名無しさん@お腹いっぱい。:2011/01/31(月) 23:21:34 ID:vY6FJiOl0
複数の画像データが同じかどうかを調べるソフトはどれになるんでしょうか
画像のデータ部分だけの一致・不一致が分かればいいです
更新日時だとかExifとかそういう内部は無関係で
ただ画面に見えてる画像のデータ部分だけでいいです
undupの進化したやつが欲しいんだって
ビットマップ読み込んでピクセルデータのバイナリで比較するだけだから
C# のソースで 185 行で作れるな。
>>554 undupのjpgヘッダ無視か、類似画像検出で頑張れ
UI 考えたけど、
A と B はにてる
B と C もにてる
A と C はあまりにてない
というとき、どう表示すりゃいいんだろなー。
A C
\ /
B
完全に一致
>>558 Aに似てる物を列挙
Bに似てる物を列挙
Cに似てる物を列挙
・
・
・
でいいだろ別に。
Aからのリンクをどこまで辿るか決めさせれば良い。
Aに似てる物を列挙(深さ1) → A, B
Aに似てる物を列挙(深さ2) → A, B, C
AとBは似てる
BとCは少し似てる
CとDは老眼の人にとってはそっくり
DとAは似てる
兄は父に似ている。
妹は祖父に似ている。
重複を削除するやつばっかりだな。
重複したのを別の場所に移動したいのに。
ゴミ箱じゃなくて移動も出来ます、ってソフトも、結局出来ないし。
?
移動したいしたい
騒いでるのは一人だけ
スルーで良いでしょ
open FH, "<dupfile.dat"; #undup の結果ファイル
open TF, ">temp.dat";
my $a;
print TF "\t";
foreach my $line(<FH>) {
if ($line =~ /^([^\t]+).*/) {
print TF "$1\t";
}
else {
print TF "\n";
}
}
print "\n";
close TF;
close FH;
open FH, "<temp.dat";
open TF, ">2.dat";
foreach my $line(<FH>) {
while ($line =~ /^(\t([^\t]+))(\t.+)(\t([^\t]+))\t/) {
toHardLink ($5, $2);
$line = "$3$4\t";
}
if ($line =~ /^(\t([^\t]+))(\t([^\t]+))\t/) {
toHardLink ($4, $2);
}
print TF "\n";
}
close TF;
close FH;
unlink "temp.dat";
sub toHardLink {
my ($a, $b) = @_;
print TF "\"$a\" \"$b\"\n";
chdir "$b\\..";
if (link ($a, "_")) {
unlink $b;
rename "_", $b;
}
}
674 名無しさん@お腹いっぱい。 [sage] 2008/09/01(月) 00:12:17 ID:UFqaSWYv0 Be:
な、何が起きても責任なんかとらないんだからねっ!!
ゴミ箱に入ったのを手動で移動すりゃいいんじゃね?
>>570 > undupできるだろ
削除ボタンしかない。
どうやるの?
[オプション設定]で[削除にはゴミ箱を使用]のチェックを外して、
後は同じように
574 :
名無しさん@お腹いっぱい。:2011/02/02(水) 21:08:34 ID:7jxo4tog0
ゴミ箱の容量制限とかで消えるよね
>>573 > [オプション設定]で[削除にはゴミ箱を使用]のチェックを外して、
それ外したら、普通は「ゴミ箱には捨てず、直接削除」だと思っちゃうよね。
確かに、その後削除ボタンを押下したら、メニューが出てきました。
チェックを外したら、「削除」の文言も変えて欲しいな。
>> [オプション設定]で[削除にはゴミ箱を使用]のチェックを外して、
>>それ外したら、普通は「ゴミ箱には捨てず、直接削除」だと思っちゃうよね。
まあ本来はその為の選択項目だしな
というかただ単にマニュアルを読めばいいと思うんだ
オンラインソフトのマニュアルなんて、
UWSC みたいなスクリプト組む奴ぐらいでしか
読んだことないぞw
あとは、アンインストールするときぐらいか。
大量に画像があって、重複を整理したらかなり容量が空くな、
って思ってやったんだが、たったの 1G 分しかなかったぜ・・・
FileMany使ってみたけど早いなこれ
UnDupとNautilusをなんとなく使ってたけど、乗り換えてもよさそうだ
582 :
名無しさん@お腹いっぱい。:2011/02/03(木) 23:00:47 ID:J5PFnD2c0
イラネ
約30万ファイル、約130GB、重複数約2000ファイルのフォルダでチェックしてみた。
UnDup 4971秒(完全一致 1pass)
SDFMach 2887秒(デフォルト)
FileMany 8159秒(1バイト単位で比較)
FileManyは、終了するのに10分くらい掛かった・・・
条件によって違う結果になるんだろうけど、遅くね?
書き忘れ。
FileManyの時間は2回目の結果ね。
1回目 ハッシュリストが作成されたはず
↓
PC再起動
↓
2回目 ←ここで計測
1回目の時間をメモするのを忘れたから、再起動して2回目を仕掛けたんだけど、
ハッシュリストって有効に使われてるのかな・・・?
>>585 ハッシュリストはかなり下手糞な使い方してるから
ハッシュリストが膨れるほど遅くなるよ。
>>583の場合ファイル列挙中にパス文字の線形サーチで
ザックリ10〜20億回無駄な文字列比較してるはず。
この酷い無駄を見つけた時点で追うのを止めたけど
まだまだ最適化されてないね。
@FileMany開発です。お疲れ様です。
バイナリ比較、終了時速度、の順で対応します。
特に速度が求められる所はC++で書き直します。
現状でも【終了時のハッシュリフレッシュ】をOFFすれば少し改善されるかも
わかりにくいのでここは削除予定です。少しずつ改善していくのでよろしくお願いします。
UI が糞だからどうでも。
バイナリ比較速度が劇的に改善されますた
終了時のウィンドサイズと位置位覚えてくれよ・・・
おk把握
自分のサイトでやれ。
特定アプリの話はサイトでやるのがいいんだがきてくれないんだよな
なるべく登場は控えるようにするけど
名無しさんでいいならサイトの方でも気軽にレスできんだけど
>>591 > おk把握
作者氏?
削除だけじゃなくて、移動機能も付けてよ。
FileManyバージョンアップしました。v1.0.3.0
>>583 終了時のハッシュリフレッシュ廃止したので少し早くなりました。まだ改善途中ですがとりあえず
>>590 覚えましたがFrameworkの不具合なのか左上方向へのリサイズ時、変な挙動します。後日修正
>>594 レンタル掲示板が名前必須ですが適当でおkです。
>>595 移動先でファイル名が衝突した場合など(リネーム?)単純ではなさそうなので要検討です
今回からDLLが増えたのでexeと同じ場所に置いてご利用ください。
バイナリ比較が高速になったと思います。ハッシュは管理方法も含めて後日
乙
使ってみようかな
ほんと申し訳ない。必要なdllを静的リンクしました。今現在アップされているzipだけで動作するはずです。
600 :
名無しさん@お腹いっぱい。:2011/02/05(土) 11:18:01 ID:QBaFcxz70
私用でスレを使ってんじゃねーよ
悪かったよ。話題に挙がってたから。でも早くなったろ?
>>601 は女子トイレに突貫して
「悪かったよ。でも、紙必要だったろ?」
とか言って目的の女子には感謝されつつ
周りの女子に「でもねー(ヒソヒソ」と
永遠にいわれ続けるタイプ
いやこうふんするな
604 :
名無しさん@お腹いっぱい。:2011/02/05(土) 16:41:08 ID:ywi2ED1y0
陰口も言われていることに気づかずに、
表向きの賞賛だけを聞いていれば、少なくとも本人は楽しいしなあ。
それに「聞こえないものはないもの」だし。
むしろ>602のほうが「俺は本質を見抜いている」と無意識の知ったかぶりで、
周りの鼻についていそうだ。
>>596 > 移動先でファイル名が衝突した場合など(リネーム?)単純ではなさそうなので要検討です
取り敢えず、そういうのは全部スルー(移動しない)でいいです。
後、直リンURLも貼って欲しい。
>>596 >>583と同じ条件でやってみた。
1回目:6744秒
PC再起動
2回目:3002秒
3回目:起動せず
1回目は前回と比較できないけど、遅いとしか言えない。
2回目は速くなったね。終了時に待たされることもなくなった。
バイナリ比較の処理時間が異様に短く感じたけど、
ハッシュ作成時にファイルを読んでるからキャッシュにヒットしてる模様。
大きなファイルだとやっぱりそれなりの時間がかかるね。
バイナリ比較は途中終了出来るようになってない。
GB単位の巨大なファイルが一致してしまっている場合、
いつまでも終了できないよ。
3回目は起動しなかった。
ハッシュリスト読み込み時に、ArgumentExceptionで終了。
Dictionaryを使ってるっぽいけど、追加する処理が手抜きなのかな?
hash.txtにファイル名を書き出しているのにUnicodeじゃないのも解せない。
とりあえずhash.txtを削除して起動させたけど、
数回使ったらまた起動しなくなった。
UIも使いにくいし、まだ使い物にならないよ。
名前の衝突ならwhileを回すだけで解決できると思う…
static void fileMove(string source, string dest)
{
string buf = dest;
int index = dest.Length - Path.GetExtension(dest).Length;
int count = 2;
while (File.Exists(buf)) buf = dest.Insert(index, string.Format(" ({0})", count++));
File.Move(source, buf);
}
v1.3.0.1アップしました。まだUnDupの品質には遠いですがコツコツやります
>>605 http://codepanic.itigo.jp/soft/FileMany.zip 移動の目的や移動先で何をやるかですが
念のため保持って定期的に消すだけであればリネームで移動しちゃっていいかもですね
>>606 詳細どもです。バイナリ比較のキャンセルは今後対応します
Dictionaryはキーが衝突するとその例外が発生しますね。
キーとなるのはハッシュ元のフルパスファイル名なので
基本衝突があってはならないんですが例外処理しておきました
UIは特に結果が見づらい、選択しづらいのでUnDupみたいにListViewでもいいかも
>>607 コードどもです。移動の実装で名前が衝突したらリネームで対応したいと思います。
>>608 zip ファイル名は FileMany1_3_0_1.Zip みたいにすべき。
>>608 パスをキーにしてるなら、やっぱりhash.txtがUnicodeじゃないの原因だろうね。
俺が試したチェック対象にはUnicodeのファイル名のがあるから。
Unicodeじゃないと表現できない文字は、「?」に変換されて書き出されてるから、
Unicodeだと区別できるファイル名が同じになってしまう場合があるし、
存在しないパスを書き出してしまっていては、そもそも書き出す意味がない。
原因を取り除くのが先。
例外処理で安易に対策しては駄目かと。
611 :
名無しさん@お腹いっぱい。:2011/02/06(日) 02:15:48 ID:x3eu0+jH0
うわ最悪
>>609 そうしてみる
>>610 ファイルサイズ膨らむからS-JISと思ってたけどそれが原因か
試しに外国語のファイル名にしたらあっさり落ちたw
Win32の方はLPCTSTRで受けてるから大丈夫かな。こっちも確認するよ
非常に参考になった。ありがとう
そういうのって自分のサイトか専用スレで
やってくれませんかね。
>>595 移動機能つけたけどWin7で動かない人が居るらしい
バイナリ比較ちゃんと機能してる?
>>614 自分の欲しい機能を注文できるいい機会だってのにw
最近、話題も無くなってたし、別にいいんじゃないか。
いい暇つぶしだ。
もしかしたら神ツールに成長するかもしれんしなw
要望の取り込みや更新にやる気のある人の出現で、俺は期待してるよ
undupみたいにボタン一つで登録したアプリケーションで開けたり
フォルダを開けたり、フォルダ比較ウィンドウを出せたりする?
どうもD&Dで登録するタイプじゃないみたいね
ツリーからチェックって面倒くさいなそりゃ
>>619 ToDoへ入れておきますね
>>620 ExplorerからD&Dで検索対象フォルダへ登録できますよ
.netなのがネック 3.5までしか入れてないからなあ
最近、重複ファイル検出ソフトはFileHammer以外
更新なかったし、積極的に更新しようって姿勢に好感
がんがってくれ
まだいたの?
>>601に代表される勘違いっぷりがすごくうざったいです。
つーか自分で話題挙げたんだろ。
なにが「話題に挙がってた」だ。
配布サイトのtwitterプラグインみれば
「有名になりたいんですぅ〜」がみえみえだっつの。
いまはどうだかしらんけど。
作者も要望出したい奴も別スレでやってください。
わざわざそこまで突撃したりしないから。
人格障害のゴミが紛れ込んだか
でもまぁどう考えても
>>505は作者だよね
一ユーザーとしては初見でFilemanyが早いとは思えなかったし、実際
>>505以外はほぼ全員が速いという感想を持ってない
私用しすぎといわれても、「俺は自分のサイトでやりたいんだよ?でもお前らが来ないからしょうがねーだろ」と言う態度で居座ったり
なんかもういい加減にしてください
これ以上のでしゃばりは悪評しか溜まらないよ
悪評とかどうでもいいよ
ソフトの出来が全て
現状の出来は酷いと言わざるを得ない
64bitでバイナリ比較すら出来ないバグ
シンボリックリンクで誤削除ファイル消失バグ
初心者向けサンプルコードのような最低速の比較アルゴリズム
意味の分らないTreeview
まぁ後は自分のサイトで頑張ってください
630 :
名無しさん@お腹いっぱい。:2011/02/08(火) 03:50:34 ID:WTBRTnZM0
うん、うん、そうなんや、ふーん、なるほど、おー、んー
というか、悪評しかできない奴ばっかり残っても楽しくない。
何かシフトJISからユニコードに変更したから云々ってメッセージが出て、
位置とサイズがまた初期状態に戻ってしまった。
しかも、終了時の位置とサイズをまた忘れる様になってるし。
折角育てようと思ったけど、もう付き合うのやめた。
ひさびさきたら荒れてるな
634 :
名無しさん@お腹いっぱい。:2011/02/12(土) 00:13:00 ID:2o0+UQBh0
undupないじゃん
近似画像のほうかなこれは
637 :
名無しさん@お腹いっぱい。:2011/02/12(土) 00:57:59 ID:2o0+UQBh0
近似画像です
書いてなかったスマン
そのうち気が向いたら完全一致もやるかも
自動でサイズ違いを削除してくれる類似ソフト無いかな?
640 :
名無しさん@お腹いっぱい。:2011/02/13(日) 00:09:43 ID:sg/s8PeM0
自動で画質悪いほうを削除してくれる類似ソフトが無いかな?
どうやって画質の良し悪しを判断するんだ?
類似検索で
重複でも大きさかサイズだけでなくややこしいってのに
PSNRを応用すれば
SmartEyeは類似検索エンジンはいいんだが、UIが・・・
ver.1が一番よかった・・・
ろだからramdiskに2000ファイルほどDLしてNautilusで重複消そうとしたんだが
10秒くらい固まったと思ったらramdisk内の全画像消しやがった
ありえんわ
比較対象にあてたhddの方は消えてなかった
毎回ディレクトリ指定しなきゃならんしundupの方が安定するかな
うんこ
お勧めの重複・類似・近似うんこ処理ソフト
javaな時点で試す価値すらないキエロカス
それを消してしまうなんてとんでもない
うんこだっぷん
類似近似ででかくプレビュー画像表示されるソフトないですかね
Unique Filer
虫めがね
655 :
名無しさん@お腹いっぱい。:2011/03/02(水) 16:54:04.44 ID:EpnyeFtF0
>>645 同意
元々高い金額じゃないので開発協力の意味でドネーションする意思はあるし要望をかなえてくれれば倍額払ってもいいよ
だが今の方向の発展は間違いだと思うので全額払ってしまうと作者に誤ったメッセージを与えてしまう懸念がある
そのことを伝えた上で半額払う方法ってあるかな
ドネーション=全肯定と理解されるとお互いに不幸だ
相談です。
現在XPで類似画像のファイルサイズの小さい方を削除するためにPicoを使ってますが
ファイルの数が多いフォルダを読み込ませると不正終了します。
Picoの不正終了を防ぐにはどうしたらいいでしょうか?
または、同じことができるソフトのお勧めを紹介していただけないでしょうか?
Picasa以外で類似画像の検索結果にタグ情報も表示してくれるソフト無いですか?
picasaのタグはpicasaでしか表示できない
いやいやPicasaのタグはエクスプローラでも見れるし、Windows Live フォト ギャラリーだって見れる。
ファイル埋め込み型かよ
ハッシュ変わっちゃうから好きじゃないな
圧縮ファイル内のファイルも含めて、重複チェックできるものってあります?
aikowin でできるらしいが、実行するといつもエラーが出ます。
俺が作る
いや俺が作る
SimiPix、リストで複数ファイル表示と選択ができるんだから
選択したファイルの右側or左側を全て処理 みたいな機能があればいいのに。
画像差0のファイルだけ一気に全部削除できるだけでも効率がぜんぜん違う
あああるかもな
それと併用してるImageCompare
unicode対応したらいいと思う
>>667 先にundup でまったく同じファイルを削除しておく
全く同じ使い方しててワロタ
俺もだ
ハッシュが同じファイルとかSimiPixで見るまでもないよな
俺は使ってないけどSimiPixだけで完結するなら一部で作業の効率化になるのは確かだろうな
あとはPicasaとか使ってる人か?
同じ画像でもハッシュ値変わるからな
使えるのがねえなあ
俺的にDupDetectorのほうが使いやすい
SimiPixいいと思って、一回スキャンかけたあと手動でフォルダ眺めたら、
明らかに同じ画像が結構残ってて悲しかった
埋め込み式のタグデータって
jpegcleanみたいなのでクリアにできるの?
undupは長いファイル名、ユニコード未対応が痛い。
落ちる。
Image Compare
もユニコード未対応だな
>>678 日本語ファイル名、日本語フォルダ名でもあれ?
ということがある
コレとコレはは類似画像だけど差分なんで削除したくない とか
コレとコレはデータ的には類似画像だけど肉眼ではまったく別画像なんで処理しなくていい とか
そういうファイルのパスを「類似候補から除外」とかのボタンでtxtとかに記録しておいて
次回以降のスキャン時にリストに上がってこないようにする機能とか欲しいな
画像はタグ管理にしろフォルダ管理にしろ一度振り分けたファイルはその後ほぼ動かさないから
スキャンするたび毎回リストに上がってこられると邪魔、でも別に重複フォルダ用意してソコに移すのも振り分けルールを乱されるんで困る
エロ画像か
エロ画像さ
必死チェッカーもどき ソフトウェア > 2011年04月20日 > EcpPOyR20
http://hissi.org/read.php/software/20110420/RWNwUE95UjIw.html 418 :名無しさん@お腹いっぱい。[sage]:2011/04/20(水) 00:54:48.70 ID:EcpPOyR20
なんかシナ人が紛れ込んでるな
53 :名無しさん@お腹いっぱい。[sage]:2011/04/20(水) 12:53:56.10 ID:EcpPOyR20
>>50 「〜してください」は口調は丁寧だが、事務的でやや命令的です。
とても、見ず知らずの人にお願いする言葉ではありません。
社会性を身につけてください。
http://hissi.org/read.php/software/20110420/Q1NmelE2SVEw.html 59 :名無しさん@お腹いっぱい。[]:2011/04/20(水) 13:19:18.88 ID:CSfzQ6IQ0
見透かされると開き直った態度を取られるのも不愉快な話です。
核心を知る人間が思いつく限りの遠まわしな回答をぶらつかせて人を試す、という光景は幾度となく目にしてきました。
あなたもその一人だったようで、遺憾に思います。
自分ははじめから、理解できる範囲のアドバイスならそれに応える覚悟は十分にありましたので。
63 :名無しさん@お腹いっぱい。[]:2011/04/20(水) 13:23:34.96 ID:CSfzQ6IQ0
>>61 いかに下手に出ていようとも、あなたたちの不誠実な対応に変わりはないと断言できますので。
>>49のような揚げ足が入るのも承知の上でした。
simipix使ってみたんだけどフォルダ毎に_cache.spxが作られちゃうのがウザイな
俺だけじゃなかったか
キャッシュoffにしたら、下の階層まで見てくれなくなったしまるで使えなくなったから
Image Compareに乗り換えたよ
この手のツールは漏れなくエロ画を削除してくれんで好きくない
なんだそりゃ
逆だろう・・・。
好きくないとか、キモいから可及的速やかに死ね
わざわざ忍法帖を表示するとか、テストのついでに発言しとるみたいで好かん
あと、
>漏れなくエロ画を削除
ここのソフトに元々そんな機能はないし、どう見てもスレ違いやね
むしろそれ向けのソフトを紹介してくれとったほうがよかったと思う
スレの流れ的には自動で処理がメインのようなのですが、その機能に加えて手動での利便性が高いソフトを探しています。
以下の機能を持ったソフトを教えてください。
要望
フォルダ1にa,b,c,dという四つの画像ファイルが、フォルダ2には、A,B,C,Dという四つのファイルがあるとします。
(機能1)
例] aとAを同時に表示した状態で、右キーを押すと、bとBが。もう一回押すとcとCを表示。そのように順々に表示してくれる。
なおかつ、片方の表示をロックし、もう片方だけをすすめたり、そうした状態から、(機能1)を実行可能。
同一フォルダ内でも同様の操作ができるともっと望ましいです。
例] Aの表示をロックし、aのほうだけbに進める。そして、ロックを解除し、bとAを同時に表示した状態から、右キーを押すとcとB、もう一回押すとdとCのように順々に表示。
http://sufirico.orz.ne.jp/のPhotoStageProの 「画面分割(最大4枚表示)で複数画像との比較も楽々。指定画像をロックでき次々に快適比較。」
が似たような機能かと思いましたが、同一フォルダか、コレクション(別フォルダのファイルを、仮想的に同一フォルダ内にあるかのように扱える機能)したものでしか表示できないようなのと、
同一名称のファイルがあると片方のファイルしかリストされないようなので、希望する動作はできませんでした。
よろしくお願いします。
undupでふたばから保存した特定の画像を重複チェックにかけるとそこで処理が止まってフリーズするんだが誰か原因に心当たりの無いか?
100GB超の画像持ってるが今までこんなことなかった
>>695 特定の画像っての貼ってくれないと確かめようがない
100GB超の画像ってのもすごいね
俺のHDDには収まりきらない要領だからこっちが原因かどうかはわからない
過去に俺の遭遇したパターンだけど
ファイル名に中文の文字とかハングルとかつかってね?
Undup も古いソフトだから
あまり Unicode 対応とかしてないので、
それで落ちることがある。
ふたばの画像ファイル名はオール数字だからUnicodeではなさそうだけどなんだろな
699 :
695:2011/05/04(水) 21:31:15.61 ID:wVGtNDbQ0
原因が分かった
プロパティ見たら全てにPicasa 3.0の文字があったから
いつもチェック入れてるJPEGヘッダを無視するを外したらフリーズしなくなった
でもこれ外すとちょっとしたタグの違いで同一ファイルだと判定されなくなるんだよな?
UnDupがフリーズするjpegファイルなら一つ取り置きがあるな
やはりPicasa 3.0で作成されたらしい
JpegAnalyzerで表示される
”APP13:Photoshop Image Resource Block(IRB)”の領域の前の
FFで埋められた29バイトを取り除くと問題はなくなった
picasaが絡むとロクなことないな
タグのせいで同一なのが別と判断される事も多いし
タグってjpgの余計なデータをカットするツールで削除できないの?
picasaで画像いじらなきゃ何も書き換えられないんでないの?
なんか情報を記述したサムネイル?ファイルが1フォルダに付き1つ出来るだけで。
とりあえず、二ヶ所にコピって重複対象にもしてみたけど普通に検出された。
固まることも無し。
706 :
699:2011/05/08(日) 18:16:43.92 ID:8IGXutmD0
708 :
705:2011/05/08(日) 19:28:11.43 ID:kE1MLIBc0
スマン、見逃してた。固まるね。
>>704 確かに固まった
こんなふうにヘッダに異常があると駄目なんだね
ヘッダ無視がデフォだから俺にはあまり関係なさそうだな
ありありじゃないすか・・・
はらへっだ
>>710 デフォルト設定はヘッダも含めた完全一致だから。
チェックを入れるとヘッダを無視して画像領域のみの比較ができるが、
ヘッダ部分がどこまでか解析するので今回のようなトラブルが起きる。
当然解析が入る分遅くなる。
結論:Picasa死ね
同意
タグなんていらんかったんや!
タグは便利だとは思うけど、
勝手に色々やるのと他のソフトとの互換性が低いのが悪い>Picasa
タグ管理はいいけどファイルにタグ埋め込むのはやめてほしい
719 :
名無しさん@お腹いっぱい。:2011/05/14(土) 17:08:44.49 ID:zA2uKwjC0
重複画像チェッカーは入れれば入れるほど遅くなるからまとめてやるのは不向きだな
フォルダ分けしてみるか
>>718 `¨ − 、 __ _,. -‐' ¨´
| `Tーて_,_` `ー<^ヽ
| ! `ヽ ヽ ヽ
r / ヽ ヽ _Lj
、 /´ \ \ \_j/ヽ
` ー ヽイ⌒r-、ヽ ヽ__j´ `¨´
 ̄ー┴'^´
でも埋め込み型じゃないとかなり弊害生まれるよな
Windowsは大変だね
BeOSなら拡張属性があるから
それ、ゴミファイル作ること無く他のPCにもってけるの?
Windows(っていうかNTFS)にもあるんだけどね。
BeOSの拡張属性は無限につくれるんだっけ
適当なワードを複数設定して検索に使ってたわ
BeOSの拡張属性はファイルに影響を与えないよ
BeOS最強伝説
だからゴミファイルができるじゃん
今のハードディスク容量を考えると無視してもいいのかもしれんが
ういんこちゃんは大変ね^^
731 :
名無しさん@お腹いっぱい。:2011/05/20(金) 20:45:17.46 ID:8u9bkeBM0
BeOSバカ
ファイル埋込みじゃないタグ管理ってAtPictureぐらいしか知らない。
やっぱBeOS最強
もう諦めて画像に埋込めよ
埋め込みは重複処理の敵だ
タグだけ明確に除外処理できるんならともかくなー
画像を作った際にユニークな識別番号とか埋め込めるんだったらそれはそれで重複類似判別に使えるんだろうけど
現実性がないしなー
業界全体で規格を決めて、画像が作れる全てのソフトにその機能を追加して、
新しく画像を作るたびに使っていい番号かどうか中央サーバに問い合わせて……とかw
過去の画像には適用できないしやはり無理があるな
そこで東のエデンシステムですよ
>>739 乙乙〜
環境に合わせた使い方は各々が考えるとして、
以前ここで上げられてたUnDupが異常終了ファイルでも問題なく画像のハッシュ値を計算できること
付属情報を書き換えてもハッシュ値が変わらないことは確認した
これがUnDupに組み込まれれば……とかおもったりw
イラネーヨ
重複画像がぽぽぽぽーん
>>739 の作者だけど、
I/Fを急ごしらえしただけあって酷いツールだな、これはww
でも、ファイル名にRGBのハッシュ付けて
重複検索とタグ埋め込みを両立させるのは
半年ぐらい試行錯誤してこの方法に落ち着いた結果だから
管理する手段としてはそんなに酷くないと思うよ。
あっそ
埋め込むならNTFSサブストリームに埋め込めと
肝心のMSがNTFS副ストリームを扱わせない方向に動いてしまったが
smarteyeの公式ページあぼーん
リダイレクトされた先のドメインのトップは情報ページに見せかけたヤル気のない広告サイト
作者がケツまくったようだ
ドネーション払ってサポート期待してた人がかわいそうです!
未完成なアプリをシェアにするんならどっかのヴェンダーにエンジン売ったほうが金になったろうに
日本じゃそういうビジネスモデルは成立しないのか、それとも作者には敷居が高かったのか
オススメありますか?
Geeqie
下痢ピーに見えた
dreはバージョンうpしてたのか
未だにUnique Filer なんて使ってるのは、日本中で俺くらいなのかな・・・・(^^;)
Undupみたいに探すディレクトリがピックアップできるやつで類似近似のやつってないのかな
なんでvisipics使ってる奴いないんだ? まとめて消せるのがいい。
ちょっと比較画面が小さいけど、他の機能も豊富でいいとおもうんだが。
UnDup
>>699の症状が初めてでた、定期的に重複チェックをしてたんだが今回が初めて
原因の画像がどれなのか特定できない・・・
DHFiNDは更新やめたのかと今迄思ってたんだけど続けてたんだな
>>755 一つのフォルダ(フォルダ内ではない)だけ検索してUnDupが何ファイル目で止まったか調べればいい
例えば5個目で止まったらエクスプローラ上の上から5個目が原因
オリジナル画像とトリミングした画像を検出するツールってあるかな
googleさんならトリミングされた画像から
オリジナル画像を見つけてくれることもあるが
これローカルで使いたいな・・・
そんで勝手にタグ挿入されると
秘蔵のエロ画像を勝手にgoogleに吸い上げられるんですね。
FileMany 1129bです。
検索結果を手動で、プレビューパネルで内容を
確認しながら削除しているんですが、
プレビューパネルが削除の度に閉じられて
非常に面倒です。1000枚以上あるので。
まさか削除のたびにプレビューパネルを閉じる
という仕様の訳はないと思うので、設定その他で
プレビューパネル開きっぱなしにできると思うのですが
やり方がわかりません。
教えていただけないでしょうか。
よろしくお願いします。
FileManyってメモリ喰いな上に、長時間かけて結果出る前にエラーで死んだりしてイマイチ使いにくい。
DRE使ってみたけどマルチスレッド対応で早いな
感謝感謝
大学の情報工学科に在籍してなきゃ作れないよな…
ディスクがボトルネックになりすぎててマルチスレッド対応でも違いが判らん
最近のSSDだと違うの?
今だにSmartEyeの1.13使ってる。ファイル数5万で実用レベルのソフトってあるかな?
データベース化して初期登録したら次回起動以降は軽くなって、
類似検索のレベルを95%とか自分で設定できるソフト
SmartEyeはそんなに性能高いの?
結果
ソフトウェア 読み込み 比較 全体
単位: 秒
DRE 0.2.0 307 14 321
GRID 000w4 375 5 380
Dup Detector 3.201 439 46 485
FileHammer 1.15.1 - - 493
SimiPix 1.03 515 25 540
PickPix2 2.80 576 10 586
Image Compare 1.3 693 116 809
Visual Search Pony 6.1 1045 180 1225
ImgSearch 3.0.8 - - 1238
PiCo 0.16a 実行時エラー
ソフトウェア 読み込み 比較 全体
単位: 秒
DRE 0.2.0 873 61 934
GRID 000w4 434 8 442
Dup Detector 3.201 960 83 1043
FileHammer 1.15.1 - - 795
SimiPix 1.03 1058 45 1103
PickPix2 2.80 1302 18 1320
Image Compare 1.3 1130 758 1888
Visual Search Pony 6.1 未測定
ImgSearch 3.0.8 未測定
PiCo 0.16a 実行時エラー
考察
DREはロー対ハイスペックエンドの速度の減少率が非常に大きくなっていますが、
これは並列化がもっとも効果的に現れているからと考えられます。
ロースペックエンドでの速度は凡庸ですが、並列コンピューティングが一般的になってきていることを考えれば、
選択肢として有効となりうるでしょう。
全体としてみれば、Image Compare がやや分が悪いものの、上位ソフトの所要時間はおおよそ2倍以内で収まっているので、
速度的には大差なしと
見るのが妥当だと思います。 海外勢のVSP、ImgSearchの2ソフトは、他に比べてかなり劣ってしまっています。
またPiCoは既知の問題として不安定であると言われており、今回の実験でも実行途中でエラーにより終了しました。
考察
ソフトによって大きく差が出ました。
実用に足るレベルに達しているのはDRE、Dup Detector、SimiPixあたりでしょうか。
DREは100%純検出を達成しています。
もっとも、サイズ変更・圧縮の検出はDRE: Similar Imageパッケージの得意分野なので、よい結果はある程度期待できるのですが。
GRIDは速度が非常に速かっただけに、取りこぼしが多いのが非常に痛い。
FileHammerはしきい値設定の粒度が荒く、ベストな精度の調整がしづらいという問題があります。
Image Compareはパラメータの調整次第でよりよい結果が出せそうですが、デフォルトでのエラーが大きく、またパラメータが複数あり結果への
影響が複雑なため、実際に使うには少し不便を感じます。
海外勢2ソフトに至っては問題外で、本当に類似検出ソフトと呼べるのか、非常に怪しいレベルです。
DRE作者乙
DREは画像ファイル以外(Thumbs.dbとか)を読もうとしてぬるぽで落ちるので困る
FileMany1130.zip使ってみたけど画面が新しい目ですっきりしてて好みなんだけど
せっかくある画像プレヴィュー画面を出しぱなしに設定できんみたいだ
いちいち何の画像か確認するのに右クリから選ばないといけないのは大変だとオイラ思った
それ以外は画面レイアウトや色も見やすく使いやすかった
777
5万ぐらいで軽快なのSmartEye以外である?
データベースファイルを1回作ったらあとは楽にできるの。
ん〜・・・スレを検索したけど無さそうだな。
画像のデータベース化ってそんなに難しいもんかね?
登録しちゃったら段違いの速度なのに
画像9分割の代表色と全体の輪郭を抽出したデータベースを検索する奴を作ったことがあるけど
あまり凝ったモノにすると作成に時間がかかりすぎてね
ハッシュだけなら作りやすいかもしれないけど全く同じ画像しか見つけられないからなぁ
普通にできるよ
ただ、使うたびに差分の更新処理は動かさないといけない
不使用理由チェック削除済みソフト
Image Compare Ver.1.3.lzh(040708)[近似画像を抽出]Vector ※階層ファイルを読み込まない
DRE 2011-02-12 バージョン 0.2.1[類似画像検出ソフト]類似画像検出ソフト DRE ※Javaをインストール
重複確認 ver 1.50 重複ファイル比較管理ソフト ※プレビュー画面が何回も表示
重複画像チェッカー 0.0.1 ImgChk001.lzh 2003.10.6 ※階層ファイルを読み込まない
重複画像カッター ver 1.5.3 2011/04/26 重複画像チェッカー ※階層ファイルを読み込まない
Easy Duplicate Finder 重複ファイル検索ソフト ※ setup.exe インストール
画順化計画(簡易版) 1.14 ※フリー版 setup.exe インストール hfImgCmpK114.exe
Gcomp Ver. 0.10 gcomp.lzh 画像比較ソフト ※
日本語で
DREはパラメータの設定がわけわからん
画像以外を読みに行って時間を食うし、サブフォルダまで追いかけるし
なんだかんだで3万ファイルでも追いかけてくれる
Simipixを高速化64bit対応してくれるのが一番いい
>>786 作者さんはもう亡くなったし、ソース公開されてないしなあ。
一からそれっぽいもの作らなきゃならないし、無理じゃね?
既存の奴から近い操作感のやつ探したほうが。
作者亡くなったのかPickPixも夭折してるし
アルゴリズムに何か原因でもあるのかな
ホムペがLINK切れだた
SimPixは、コマンドライン対応してないのと、キャッシュファイルを勝手に作る仕様なのが惜しい・・・
SimiPixは10000枚以上比較すると画像表示されないんだよなぁ
いや、1万枚以上でも出るだろ
最初の頃のは設定変更しないと10000枚上限だったと思う
iniファイルに上限枚数の記述があってそれを変更する必要があった
今のは最初から無制限のはず
うん、それは知ってるし、制限のないバージョン使ってるはずなんだが
なぜか分からんが出ないんだw
自宅の7Pro64bitでも会社の2000でも同じなんで、実行ファイルに
問題があるのかと思ってDLしなおしたけど変わらんし_| ̄|○
7ProならXPモードでやればいいんじゃないか
windows 7で動かないソフト多すぎだな
しかも超便利なソフト、代替ソフトがない場合が多すぎだ
>>797 ありがとう、でもXPモードでもvmwareでも駄目だったんだ
実行ファイルの置き場所とか画像ファイルの場所とか関係あるのかなぁ……
俺も7x64にしたら下の階層まで見てくれなくなったから他に乗り換えたよ
今はVisiPics使ってるけどSimiPixより良いわこれ
ビシィ! ・・・たはは
取りこぼし
ファイル名無視で指定オフセットから指定バイト数のハッシュを取ってそれで比較
ファイルサイズが指定オフセット+指定バイト数以下ならファイル全体のハッシュを取る
でもってハッシュで最終的に重複確認
こんなソフトってある?
数TBのファイルでの重複チェックしたいから速度と正確性それなりにほしいんだけど
なかなか満たすものがなくて結局時間ばかり浪費してしまった
とりあえずUnDupを仕掛けてあるけどいつ終わるのか皆目見当がつかないw
UnDupはある条件のものにあてはまるものはヘッダを読み飛ばしても取りこぼすよ。
>>804 「指定オフセットから指定バイト数の」というのは、何を意図したものなの?
数TBのファイルっていうのが何なのかも知りたい。
>>806 ファイル先頭のヘッダや文書の共通部を無視して指定サイズの範囲を比較したいから
ファイルは会社のNASにあるファイル
ファイルの種類は解像度が高くて容量の大きい画像とPSD、AIファイルが中心で
その他PDF、オフィスドキュメント、プログラムソース+デバッグ情報+実行ファイルのアーカイブ
重複は主に素材系
ヘッダって固定長なのかい
完全に固定長でないのは勿論承知の上
ということで検索ファイルに興味はあってもツールの話にはならないようなので
この辺でクローズさせてもらいますいろいろありがとうございました
>>810 何をやりたいのかわからなかったんで訊いてみたんだけど、
結局何をやりたいのか良く分からなかった。
だから、ツールの話をしようにも出来ないよ。
だな
なんでそんな条件付けなのか理由もよくわからないし
最終的にやりたい事と、対象物だけ最初に書いたほうが分かりやすかったかも
どちらにしろ、ファイル管理ソフトか画像管理ソフトを入れて管理をしっかりしたほうがよさそうな気がするな
ちなみにうちの環境でUnDupのハッシュによるチェックだと
約2TB 約164,000ファイル(動画・書庫メイン)で33分15秒もかかった
UnDupもそろそろ時代遅れになって来た感はあるけど、それでも他のソフトより使いやすいからなあ。
DupFileEliminatorってどうよ
Simipixでフォルダの中に数千枚あるはずなのに、700枚くらいしか画像処理しないんだよね。
なんでだろ。
Everything並に素早く重複検索できるソフトはないものかな
心眼
上のほうにファイル名にハッシュ付けるやつがあっただろ
819 :
名無しさん@お腹いっぱい。:2011/11/05(土) 09:28:37.99 ID:sgePLYgi0
一つの写真を選んで似た写真をリストアップしたいのですが
重複を整理する目的ではなく、構図や色などが似ていたら全く違う写真でも検出される、
ウェブ上の「類似の画像検索」みたいなことをPC内でやりたいのです。
この場合、使い勝手の良いソフトってありますか?
判定の精度の調整などもできたら最高です。
エロイ体位や綺麗なオマンコでも探すのかな?
Undup
win7 64bit で固まるんですけど…
他のソフトを使え
>>815 上の方に書いてあるが、OSが7だから。
固まるのはjpegヘッダの読み飛ばしONにしてるからじゃ
826 :
名無しさん@お腹いっぱい。:2011/11/09(水) 19:59:20.08 ID:4Y0xrgO40
Aの画像の上半分を切り抜く Bの画像の上半分を切り抜く
この2つの画像を1つの画像にする
この程度の画像編集で良いので
とにかく誰でも簡単に使えるフリーソフトの紹介おねがいします。
>>829 スレ違いだけど、pixiaとかでいいんじゃねーの
っペイント
830 :
名無しさん@お腹いっぱい。:2011/11/10(木) 22:10:50.99 ID:Wkwg/Obl0
>>829 ありがとうございますJTrimを勉強してます。
この手のソフトを初めて使うんだけど、初心者ならとりあえずこれを使っとけってあります?
undupで重複バッサリ
simpixで類似画像を比較しながら処理
simpixの最近?の更新でまとめて移動が増えて1や2を見ないでバッサリ消す事ができて便利になった
俺も割と最近まで勘違いしてたんだが
SimiPixなんじゃないカナ
SimiPixフォルダ内にキャッシュファイル作るようにしてくれたら最新版使う
スレ違い気味ですまぬ。
破損画像を調べるソフトはJpegCleaner以外に何かある?
スレ違い気味どころか完全にスレ違い。
同じ作者のJpegAnalyzerが高機能だね。
>>835 ありがとう。
落として設定項目を見たんだけど、JpegCleanerより高機能なだけに簡単じゃないね。
ぼちぼち覚えていくよ。
DREの人見てるー?
0.3だけどDLリンク先404になるぜ。ファイル名違ってる。
URL削ったらディレクトリ見れたから頂きましたけども。そんな報告です。
取りこぼしの無いソフトないかな
それは無さそうだな
840 :
名無しさん@お腹いっぱい。:2011/11/16(水) 13:37:07.71 ID:R3cW3mrG0
7x64環境だと最新のSimiPixはフォルダを見てくれないんだな
「画像ファイルが見つかりません」とか言って、んなアホなと
1.02ならまともに動くのに残念
アホはキミ
842 :
801:2011/11/16(水) 17:41:42.81 ID:cKbXmJFV0
>>840 同志よ俺もアホ仲間だ
下までちゃんと見てくれる上に対象にするフォルダがピックアップできるVisiPicsいいよ
まあまあ似てる二人(ウッチャンとジャッキー・チェンくらい)の顔写真を、自然な仕上がりでどちらにも見えるように加工するのって可能でしょうか。
おすすめのソフトがあれば教えてください。素人には無理ですかね
モーフィング フリーソフト とかで検索してみたら
>>844 ありがとうございます。さっそく調べてみますね。
846 :
名無しさん@お腹いっぱい。:2011/11/20(日) 11:45:44.41 ID:cTzoJYm40
DREはオープンソースソフトウェアにしてくれればいいのにな。
最近のオススメは何よ
FileMany
心眼
850 :
名無しさん@お腹いっぱい。:2011/11/23(水) 00:31:22.19 ID:ovC51Rf10
歌の動画に飛ばされても困る。
ソフトに関係がないなら説明を添えるか、もしくは貼るなよ。
かまってチャンのあらしに反応するなよ
気になるか?
まあ、お前ごときどうせ株なんか知らんだろうし、どうにも出来んし説明してやろう。
崩壊してんのは、株取引のほうだ。
すでに年金すら韓銀砲で溶けてる。今なお溶かし続けてる。
後、多分だが金持ってる外国人や富裕層はとっくに韓国から亡命(まあ似たようなもん)してる
どこまで持ちこたえるか知らんが、ウォンは貧弱だから安くなりすぎても、高くなりすぎても死亡
すると紙クズと化したウォンを、ハゲタカファンドに捨て値でおもちゃにされてゲームオーバーだ
そしたらまず銀行が閉鎖されて、預金が降ろせなくなるだろうな。
そこからがパニックの引き金になるだろ、あとは想像に任せる。まあしたくもないくらい地獄だろうが
韓国がIMF入り以外で、自力で浮き上がろうとしたら、これら問題をどうにかする必要があるのだが
首脳陣がそこまで脳ミソ使ってるのかまでは、知らん。
あとそうなったらおそらく円持ってる在日強制召還。これはお前らの問題だな、日本人?復興にいそがしいからまた今度な
これくらいだな、まあ後は勝手に調べてくれ。
SmartEyeって20万枚ぐらいでも全然いけるからすごいな
DRE作者です
>>837 あわてて直したよ。thnx
>>846 そう思ってsourceforge.netにリポジトリを置いてる。しばし待たれよ
ところで、今後の参考のためにちょっと聞きたいんだが、もしよかったら解答を張ってくれ。
1. ふだん、何枚くらいの画像を処理しているか?
2. どの程度の検出レベルを使っているか?ピクセル完全一致か、画質劣化までか、テロップやトリミング編集までか、それ以上か?
3. 検出したファイルを処分するのに目で見て比べるか、条件付きの自動処理を使うか?
4. 目で見て比べるときに使うビュアーは、組み込みか外部ソフトか?外部ソフトの名前は?
あと、そろそろ第2回ベンチマーク大会をやろうと思うので、前回以降更新のあったDRE・FileHammerと、前回なかったVisiPicsのほかに、測定してほしいソフトがあったら教えてくれ
上から目線ワロス
DupFileEliminator
FileManyって、検出はそこそこ早いんだけど、リストアップしたファイルを実際にゴミ箱に入れるときにエライ時間かかるんだよな。
ログを見ると重複ファイルのあるフォルダを行ったりきたりしてるような。
フォルダA-ファイル001を削除
フォルダB-ファイルαを削除
フォルダA-ファイル002を削除
フォルダB-ファイルβを削除
って感じで。
どんなに精度が上がって類似画像を見つけるのが容易になっても、
その後の削除なんかの作業に手間がかかるんじゃ、何の意味もないってことに
この手のソフトの作者はいつ気がつくんだろう
ヒント:精度が低いから自動化できない
車の免許と一緒やな。
目視でやるよりマシだって
>>860この手のユーザはいつ気が付くんだろう
自動削除が必要な人は、類似の精度なんて必要ない。
ネット巡回してて、気に入った画像を保存した後
まったく同じ画像をすでに持ってたかどうかさえ分かればいいんだよな。
画像成分の完全一致で十分。
今のところ自動削除については大体そうだと思う
画像成分どころかファイルのバイナリ一致でいい(画像成分の抜き出しは速度が犠牲になるうえ効率悪い)
ただ類似画像の処理は完全自動化が難しい以上、どうしても時間がかかるのが現状
時間のかかる手動処理の部分を飛躍的に高速化させない限り、
自動処理の部分だけ高速化したり精度を上げても全体的な処理速度はあまり上がらないんだよねえ
仮にツール製作者が全体の見えてない人の場合、いつまで経っても片手落ちなツールにしかならない
この手のタイプは細かいとこにこだわって効率を意識しないから困るね
ヒント:自分でソフト作る
画像を9分割して色を比較するやつと
二値化して輪郭を比較するやつ作った
>>866 まずはキミの手順を全部文書化してくれ。
24bitRGB成分を保ったままPNGをTIFFに変換するやつを作って
画像はすべてタグ埋め込み管理してる。
ハッシュで見分けるにしてもどこの画像を残してどこの画像を消すんだ?
ハッシュで見分けるとはすごいな。
俺は目視だけど。
>>872 ワロタ
自分は壁紙収集なので、見た目はほとんど同じで画像サイズがまったく違う、というのが結構ある。
となるとやっぱりハッシュじゃダメで、ピクセル見ないといけないんだよね。
いま自分がやってる手順は、
粗めの精度で多めに検出
→ 結果リストを見て、誤判定のない適当な類似度を探す
→ 「その類似度以上のグループの中で、一番圧縮率の低いファイル以外」で自動チェック
→ チェックされたファイルを目視で確認、削除
というかんじ。
消したいファイルはあらかた自動チェックのときに選択されてるから、
目視確認は基本↓キー連打になって、類似が1000グループくらいあっても5分くらいでさばける。
となると、個人的には検出と自動チェックの精度は、やっぱり重要。
結果をいっこずつ見ながらチェックをいれるのは、それは効率悪いよ。
875 :
873:2011/12/10(土) 17:57:47.88 ID:8jhkUC890
>>874 すいません、DRE作者です。上のもDREの話。
まあ、今あるツールが検出設定ばっかり凝ってて、後処理がないがしろに
なってるという点では、
>>860や
>>866には同意せざるを得ない。
「じゃあ、どうすれば効率的にできるの?」ってところで、みんな思考が止まってる。
せめて検出結果を外部出力してくれれば、後処理だけ別のツールにもできるんだけど…。
DREはそこはどうなってんだよ
DREは検出ファイル名だけじゃ無くてパスも表示してほしい
検出元、対象としたいフォルダがそれぞれ複数あってそれぞれの
上位フォルダを指定して下層にチェックを入れて検出させる。
その結果に対して一括チェック(検出元・対象・指定フォルダのいずれでも)すると
検出ファイル全チェックかチェックなしとなるので
手動チェックするためにパスも表示してほしい
この現象って一括チェックは下位フォルダは考慮しないとかだったりするん?
もしくは自分だけなのかな
色んなソフトを試したけど、どれ一つとしてマトモに動作しないんだが・・・
数が多過ぎるんだろうか??
あるディレクトリ下の全部の画像の中で、重複したやつだけ別に移動したいんだけど。
サブディレクトリも全部含めてね。
せめてOSかけよ
7でうまくいかないソフトあるんだから
雑魚いな
>>879 > せめてOSかけよ
Vista 32 SP2
ファイルサイズ同じで別名だけど同じ画像、ってのを整理したいだけなんだけどね。
画像数なんて、せいぜい 10 万程度なんだけど。
ざっと考えただけでこれだけ疑問点があるな。
ファイルとして同じか、画像として同じか
画像として同じといっても、bmp を jpg にすると不可逆圧縮がかかって
ピクセル単位のずれが生じるけど、それは違うとして処理してかまわないのか
別に移動するときにファイル名の重複があったらどうするのか
移動するときに、フォルダの構造を保存しなくてはいけないのか
複数の重複ファイルのうち、どのファイルを移動しないのかという選択基準
条件だけ読むとUnDupで十分行けそうだけどな
自動選択できるし自動リネームするし移動できるし
>どれ一つとしてマトモに動作しない
と言うのが具体的にどうなってるのかわからんが、それだけ上手く行かないならやり方が違ってるんじゃないの?
フォルダ単位で似てるのを教えてくれるツールはありますか?
>>882 のリストだと、
ファイルじゃ無くて、画像として同じで、ピクセルのずれとかも同じとして欲しいです。
ファイルの移動とかはしてくれなくて、教えてくれるだけで良いです。
>>876 できるだけ1枚あたりの時間が減らせるように下キーとスペースバーだけで
必要な操作が完結するようにしたり、一括チェックの項目を充実させて
後処理での手作業の部分が減らせるようにはしてるけど…
全部目視で確認したいとなると、1枚ごとに「見る」最低限の時間があるから、
原理的に
>>873の使い方以上の効率化は難しいと思う
>>877 最初に上位フォルダで指定せずに、複数フォルダを直接並べれば?と思ったけど
それは別として、指定フォルダ一括チェックで区別できないのはおかしいな
ちなみにフィルタ「〜\Face」で「〜\Face_easy」のフォルダにあるファイルまで
拾ってくるバグを今さっき直したが、そのケースか?
あとフルパスはプレビューのキャプションで出すようにしたけど、
リストのほうでは表示が冗長になるのであまりやりたくないと思ってる
まあまだ何かあったら、遠慮なく直接メールしてくださいな
UnDupって下のステータスバー、文字の下半分が見えないんだけどこういうもんなの?
Win7 x64
OSの所為
>>886 最新版は
dre-1.0-beta1-win32.zip
これでいいんだよね?
UnDupのコマンドライン指定がうまく行かねー。
どうやったら「新規フォルダを検索、かつリストにそのフォルダを残さない」という操作ができるんだろ?
DREってのを使ってみたが、2日経っても比較が終わらない・・・
ファイル数はどれくらい?
年内には終わりそう?
>>891 下の枠にメッセージ出てない?
○○errorとかNullPointerExceptionとか出てたら内部で落ちてるので
該当ファイルを移動させるとかしてDREに読ませないようにして最初からやり直し
ぬるぽ
>>892 > ファイル数はどれくらい?
十万位かな。
> 年内には終わりそう?
結局応答なしになったので、強制終了しました。
>>893 > 下の枠にメッセージ出てない?
何も出てませんでした。
比較中、とか何とかのままずーっと。
>>889 ya
>>893 ぬるぽ出ても該当ファイルがスキップされるだけで、下枠に「処理が中断
されました (Aborted)」と表示されないかぎり処理は続行するぞ
もし無言で処理が中断するようなことがあったら、俺の睡眠時間が激減する…
>>895 スペックによるけど、10万で2日間はあきらかに異常
実行ファイルと同じフォルダにできるstderrファイルを送ってくれると
何か分かるかも
stderrのファイルサイズが0byteでなかったら、俺の睡眠時間が激減する…
>>896 > もし無言で処理が中断するようなことがあったら、俺の睡眠時間が激減する…
処理中の棒グラフが2つ出るよね?
で、その下のやつが、20%程度で止まったまま、全然進みませんでした。
>
>>895 > スペックによるけど、10万で2日間はあきらかに異常
普通はどの程度なの?
起動して、あるディレクトリ(フォルダ)を追加して、その下のサブディレクトリも含めて全部の重複をチェックしようとしました。
今またやってみたら、30ディレクトリ/146143ファイルでした。
> 実行ファイルと同じフォルダにできるstderrファイルを送ってくれると
サイズはゼロでした。
まぁ、強制終了したからファイルが正常に閉じられなかったからでしょうけど。
> stderrのファイルサイズが0byteでなかったら、俺の睡眠時間が激減する…
ゼロなので、今日はグッスリ眠って下さい。
>>897 可能性のひとつでしかないけど試しにチェックディスク(エラーチェック)をかけてみたらどうよ?
解決する可能性は低いだろうけどなんか異常がある可能性もあるしな
>>897 エラーは強制書き出しのはず…と思ってたらなってなかったorz
実行時間はマニュアルに複数環境・複数データセットでの測定結果が書いてあるよ
ひとまず報告thnx これ以降はチケットでアナウンスします
>>899 「読み込み処理が終了しました。 (134.56秒)」だけ出てるんだけど、
ファイルの比較グラフが、最初の方で止まったまま進みませんです。
これが終わらないと、次へのボタンが有効にならないんだよね。
実用化まであと10年くらいかかりそう
とりあえず作者はトリップなりつけて他者と区別できるようにしてくれると嬉しい
この名無しはいきなり何を言い出したのかと思ったわ
いつものことじゃん
>>890 俺は
F:\Soft\UnDup\UnDup.exe "対象フォルダのパス" -C F:\Soft\UnDup\UNDUP.CFG -F10000000000000 -S
でやってるな。
ただリストに対象フォルダが残ってしまう。
多分これは仕様上避けられないんじゃないかな。
面倒だけど毎回消してる。
>>890 C:\hoge\UnDup\UnDup.exe -C C:\hoge\UnDup\fuga.CFG -S -Q "新規フォルダ"
俺はFileManyのコマンドラインがうまくいかん
-folderオプションを使いたんだけど
ただ起動するだけでそのフォルダが追加されてない
FileManyの自動更新が失敗するのって管理者権限で実行しないといけないのかねえWin7x64
FileHammer の、ファイル削除経過表示ウィンドウ?
ウィンドウの Height を変えると情けないのな。
機能は果たしてるから良いけど。
後処理が一番マシなのは、VisiPicsかなあ
大量にあると、それぞれの結果に対して順々に処理を決めていく、
なんてのはとてもじゃないけど時間かかってやってられない
VisiPicsは、バーッと結果をサムネイルで並べてくれて、かつ条件で自動で削除対象を選ばせることが出来る
あとはサムネをざっと見ながら、明らかに別画像なのに削除対象になってるものを対象から外していけばいい
最初は厳しい精度で、だんだん緩くしていけば、重複チェックミスを大量に見ることも少なくてすむ
残念なのは画像の拡大表示が、
サムネの上でカーソルを少し停止させるという動作だから、そこに関してはサクサク作業できないこと
削除対象の自動チェックも、もう少し詳細な設定ができてもいいかな
>>909 VisiPicsはキャッシュの利用が無いところもマイナス
すでに持ってる画像と新しく入手した画像との比較に時間がかかる
>>910 キャッシュっぽいのあるぞ。プロジェクト保存ってやつ
ただSimiPixみたいにフォルダごとにキャッシュじゃなくて
一つのファイルにすべて詰め込むから容量がでかい
ほしゅ
UnDup 2万程度の2日かけても終わらねえからFileManyに切り替えた
FileManyもいまいち挙動がわかりにくいけど(新規追加分無視してるような)
グラフで進捗見えるだけマシや
FileManyだと重複0だった・・・あれ?
取りこぼしより誤削除が怖い。
UnDupの検出精度はどれくらい?
Undup は類似検索は行わず、完全重複しか検出しないから誤削除はないんじゃないか。
最近、Undup が全ファイルを列挙してないことに気がついた。
なんでだ。
Undupは完全一致検索できないよ
最後のバイトだけ違うファイルなんかも
しれっと重複判断する
だから大事なファイルには使えない
設定どこ?
完全一致1pass,2passいずれもだめなんだが
他にあるのか
>>917 バイナリエディタで書き換えて検索したが当然ながら不一致だった
とりあえずファイルを上げてみなよ
あとは使ってる Undup.cfg と Undup.exe だな。
本人によるファイルのうpは無しか……。
どうせ部分検索みたいなのやってんだろ
ワロタ
ヘッダ除外と見た
やっと類似チェックする気になったから俺と後続の為に定番を列挙してってくれ
時給三菓子で妹に奉仕させるのが一番いい
エロ画像のみ自分でチェック
あとこれはとっておきのステマなんだが(ひそひそ)
DREというのは作者が精力的で期待できるらしい
ただ、俺も正式名称とURLを知らないから使ったことないんだけどなw
visipicsで無視グループみたいにマークグループってできないの?
るいじはやるだけむだ
まりお
マリオに類似してるからルイージなのか
DRE使ってみたら今までUnDupで取りこぼしてたらしいファイルが引っかかるようになった
だけど大量のフォルダとファイル読み込ませようとしたらやっぱり不安定になるんだよな
〃∩ ∧_∧
⊂⌒( ・ω・) はいはい取りこぼし取りこぼし
`ヽ_っ⌒/⌒c
⌒ ⌒
マリオの服を緑色にしたら取りこぼされたし
936 :
名無しさん@お腹いっぱい。:2012/02/04(土) 21:46:13.10 ID:e9EikBHA0
10万超でも余裕なSmart Eyeみたいなソフトあるかな?
一致率95%とか設定できればなおよし
937 :
名無しさん@お腹いっぱい。:2012/02/04(土) 21:53:27.13 ID:e9EikBHA0
類似画像検索ソフトとして必要なこと
*ファイルサイズ、色数、色調が違っても同一画像を検索する
*同一フォルダ内だけではなく全登録データベースから検索する
*データベースが大きくなっても検索スピードが低下しない
三つ目、むちゃくちゃいうなや。
DBが大きくなると検索速度が下がる理由をちょっとでも考えたことがないんだろうか
940 :
名無しさん@お腹いっぱい。:2012/02/04(土) 22:26:59.78 ID:e9EikBHA0
でも、Smart Eyeは5万でも20万でも一回データベースに登録したらほとんど変わらないけど
Oracleも5万でも100万でもインデックスとハッシュでほとんど検索速度変わらんしね
win7(64)だと
どのソフトがおすすめかな?
vistaの時は image compare 使っていたんだけど、
多くない画像は使いやすかったけど、
大量の画像になると処理しきれなくてエラー終了だった
image compare は、たんに重複を見るソフトで
ほかに類似や近似画像を見つけてくれるソフトもあるのかな・・?
類似はずっとDup Detector使ってる。
Win7(64)でも問題なく動いてる。
943 :
名無しさん@お腹いっぱい。:2012/02/07(火) 21:05:23.13 ID:oiNc8m1h0
>>942 たった5万ファイルの比較に重すぎる・・・
しかも、データベース登録してくれないから読み直しになるし・・・
比較エンジンはそこそこ賢いのにな・・・
5万だとデータベース登録できないの?
データベース機能自体ないね
1回取り込んだら、後は差分管理してくれないとね
データベースがない?
Dup Data Fileは違うの?
Dup Detectorはちゃんと差分管理もできるだろう
類似検索はテンプレに載ってるのを一通り試したけどこれが一番精度がいいな
gifが扱えないことと一度に一枚づつしか表示できないのが改善されれば最強なんだが
おれの目視のほうが精度いいぜ
>>1 Dup Detectorリンク切れだ(´・ω・`)
糞古いソフトばっかだなw
> VisiPics
これは完全重複だけ検出するようには設定できないの?
953 :
949:2012/02/11(土) 13:22:44.64 ID:utELlzFC0
>>951 中々いいね。96%以上で検索したらかなり画像整理できる。
>>951 使い方がサッパリ分からん・・・
誰かリソースを書き換えて日本語版にしてくれ。
ウンコ漏れるッ!
誤爆スマソ
ウンコ漏れるッ!
誤爆スマソ
この画像は類似じゃないから次回はチェックしない機能があって10万枚ぐらいでも問題ないのある?
DRE1.0.0のピクセル一致でキャッシュを使用するにしてもキャッシュが作成されない?
作成はされるけど読み込み時に使われてないっぽい
simpixは画像入ってるフォルダーにdb作リまくるけど
はじめは邪魔と思えてたが気にしないようにすると便利の方が上回るんだな
サイズ違いでも検出するし 一度dbつくれば速いし しきい値決めてまとめて移動もできるし
undup使わなくなっちゃったな
D&Dによる読み込み
dbの保管場所をひとまとめにする
別々の場所にある複数のフォルダをまとてできれば完璧なのだが
simipixフォルダ以下にdbをまとめてくれたら何も言う事無い
simipixにこの2つの画像は差分の類似画像だから
今後結果に反映しない っていう機能が欲しいな あと複数選択して右側(左側)まとめて削除の機能
DupDectorってデータファイル作成しても、再度読み込みは時間かかるんだね(´・ω・`)
FileManyのゴミ箱使うで削除するとメモリ不足みたいなエラーがでるなあ
32bitソフトウェアで使える2GB使い切ってんのかね
ファイルをいっぺんにゴミ箱に入れる処理で使う
バッファのサイズって 1+Σ(ファイル名 + 1文字) bytes なんだけど
これが限界を超えたんじゃ無いかな。
数回に分けてゴミ箱に入れれば多分大丈夫。
更新履歴
2012.02.18 Ver1.4.5.2
・Twitter連携(FileManyについて何かひとことどうぞ!)
フイタw
そんな事をしている暇があったらw
>この画像は類似じゃないから次回はチェックしない機能
というかこんなのあるの?
AとBは類似じゃないけどAとCは類似というときどうすんの?
Cを削除すればいいんじゃね?
なにいってるの?類似かどうかは絶対的であるように見栄ながら相対的なんだからチェックしない機能とかどうやってつけるのかきいてるの><
チェックしないんじゃなくて、チェック後に以前に類似じゃないと記憶した組み合わせの分は
類似として表示しないだけでいいだろ
AとBは類似じゃないと記憶してるんだから、
AとBは類似、AとCは類似、BとCは類似と判断した後に
結果表示の時にAとCは類似です、BとCは類似です、でもAとBは類似じゃありません
と表示させる
これでいいんじゃねえの?
要するに「この組み合わせは次回以降検出しない」と言う事を記憶させたいわけどァさ
要するに
ソースネクストのPaintgraphic2 Proってソフトはどうですか?
使える?
どうみてもお絵かきツールです。
さようなら。
980 :
DRE:2012/03/08(木) 23:25:02.66 ID:Mv+D20NX0
>>980 乙!
参考にさせてもらうわ。
ちなみに個人的に気に入ったのはどれ?
ハイスペックエンドって日本語不自由な奴だな
984 :
DRE:2012/03/09(金) 02:35:13.91 ID:gJ8icYAc0
>>981 まあぶっちゃけ気に入ったのがないからDRE作ってるんだけど、あえて言うなら……
速さ重視ならGRID/DFE。この辺はマルチスレッド対応な上に、ちゃんと総当たり比較を避けてるぽいね。
速度と精度のバランスをとるならSimiPix。インターフェースもシンプルでいい感じだと思う。
985 :
DRE:2012/03/09(金) 02:38:34.06 ID:gJ8icYAc0
>>983 改めて見るとハイエンドでいいな。しかもハイエンドと言うほどハイじゃないという。
まあ、気にしないでくれ。
本人か。まあ開発がんばってくれ。
数百フォルダ数十万ファイル数百GBあるようなフォルダにDRE使ったら進行ゲージおかしくなるんだけどちゃんとチェックできてるのか?
お勧の次スレはどれでしょうか
気がついたら自分でたてろばか
梅
次スレ立ててから埋めろよ
バカなのか?
お前が1レスすることでまたそのぶん1000が近くなる
文句を言うならスレを立ててから文句を言えば?
それを阻止するのが俺の仕事。
梅!
埋めるなと言ってるのに…
立てればよろしい。
うめ
埋め
次スレ
1000
1001 :
1001:
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。