1 :
デフォルトの名無しさん :
2007/01/15(月) 22:42:07
3 :
デフォルトの名無しさん :2007/01/15(月) 23:48:00
(p) ってなに?
p2 ってなに?
画像から自動でアスキーアートを作るプログラムを作ってみました どうでしょうか? 丶丶丶丶丶丶温幽籬櫑櫑櫑櫑櫑幽厶雌櫑幽岱垉厶丶丶丶丶丶丶 丶丶丶当櫑欟欟櫑欟欟欟欟欟欟欟櫑欟櫑櫑翻麗謝叱丶丶丶丶丶 丶丶丶覇竃櫑櫑欟欟欟欟欟欟欟櫑欟櫑欟欟欟層櫑艶旨丶丶丶丶 丶丶丶層櫑欟欟欟欟欟欟欟欟欟嬲竃嬲竃竃欟櫑竃覇覇丶丶丶丶 丶丶丶灑嬲欟欟嬲嬲嬲嬲嬲鬻辧卻眉贈幗層欟欟櫑竃櫑廴丶丶丶 丶勹僧層櫑欟鬱綴綴局悦局局拇狐綴綴鋼幗幗竃欟竃櫑廬丶丶丶 丶湘嬲嬲櫑欟辧綴仰災欠災沼卻局綴綴掴綱幗櫑嬲幗櫑廳丶丶丶 丶勺覇欟櫑鬱即卻仰災災沿己卻凹句郊塀獅幗櫑櫑欟櫑勳丶丶丶 丶丶濁幗欟圓扼卻仰災災沱災可沼笳鏑櫑雌彌幗櫑欟櫑欟眦丶丶 丶丶層櫑櫑鬱狐猖旛幽迫己旧卻獅嬲嬲幗幗幗幗櫑欟櫑覇眇丶丶 丶丶櫑欟欟鬱掴嚴憫笥局仰可局綮当踏審綱燒幗層欟櫑欟廴丶丶 丶丶層覇櫑欟即尚旛籬籬枢叫猖鬱幣憫牒憫椹禰幗欟欟欟杉丶丶 丶丶層欟櫑欟抓儕凹沼珱卻旧塀簡紹笳綴僻綴掴幗欟欟鬱丶丶丶 丶丶丶層櫑欟仰卻旧突句己沒笵綴囹卻仰加仰塀禰層欟欟企丶丶 丶丶丶瀰欟欟仰旧句災沼卻卻卻獅雌扼卻卻狐綴綱層欟欟歡丶丶 丶丶丶湧欟欟紀凹句巡卻仰似局綴獅雌卻卻綴掴綱幗嬲覇黙丶丶 丶丶丶丶層眼眼句旧卻卻鍵輔禰層嬲幗囹卻綴掴囃幗櫑歉丶丶丶 丶丶丶丶勺龝圄句沒卻卻卻卻沺禰幗幗雌歳狐掴囃彌欟默丶丶丶 丶丶丶丶丶丶丶句沒卻笳僻把洞雄櫺櫑顧綴鋼囃讃幗嚶丶丶丶丶 丶丶丶丶丶丶丶勺句卻譲嬲霸嫻嬲幗難掴獅幗幗幗嬲艶二丶丶丶 丶丶丶丶丶丶丶丶句旧卻卻綴掴燒辧辧讃幗幗幗幗杉欟欟幽丶丶 丶丶丶丶丶丶丶丶丶刈皿狐卻仰瀉囃雌幗幗幗覇歉勺欟欟欟櫑幽 丶丶丶丶丶丶丶丶丶丶勺牋綴燒雌幗幗幗幗幗鬱三儲欟欟欟櫑櫑 丶丶丶丶丶丶丶丶二旛櫑封贈簡幗難幗幗櫑鬱災三灑欟欟欟櫑欟 丶丶丶丶丶丶澁櫑櫑櫑櫑歡兆卻塀綱幗幗黙冖三消欟欟欟欟欟覇 丶丶丶澁籬櫑櫑櫑櫑櫑櫑置丶筍綴綴諜冖丶丶三瀰欟欟欟欟欟覇 丶誕櫑櫑櫑櫑櫑櫑櫑欟櫑置丶勺朔薪丶丶丶丶勺欟欟欟欟欟櫑櫑 灑櫑櫑櫑櫑櫑櫑櫑櫑欟欟置丶俎幗雛止丶丶丶儲欟欟欟欟欟櫑櫑 欟櫑櫑櫑櫑櫑櫑櫑櫑櫑欟置丶欟攜層櫑幽丶丶灑欟欟欟欟欟櫑櫑
濃度毎に漢字割り当ててるんだろうけど その漢字を複数候補用意してランダムに 抽出するとか等幅じゃないフォントでやるとか そういうレベルのものも存在しますよ
>>10 面白いね、そういうの。
初心者でも簡単に理解できて実装できる
面白いソフトのアイデア集とか欲しいな。
そういうので画像処理で遊んでみたい。
14 :
10 :2007/01/16(火) 14:34:45
今のアルゴリズムは、 使用する文字を用意して幅と高さを計測しておいて 画像を文字と同じ大きさの中程度領域に分割して その領域をさらに分割した小程度領域と対応する文字の領域の 濃度の二乗誤差の和が最小になるように文字を選んでます。 今は文字の幅が一定の物を選んで使ってますけど 中程度領域の分割の仕方を変えれば色んな幅の文字が使えます。
妙にネガティブな字が多い気がしないでもない
機会があったらどこか別のところで公開してもらえたらいいな。 この手のソフトって結構作ってる人がいるみたいだけど、ヒロフのやつしか 見つけられなかったからw
ヒロフwww
アスキーアートだけならだれでもはれるっつーの
19 :
デフォルトの名無しさん :2007/01/16(火) 22:31:54
21 :
19 :2007/01/16(火) 23:43:10
>>20 おおお!ありがとう。遠目で見たら確かにポルシェだ。
贅沢言うと'丶'と'三'の中間色欲しいですね。エンブレムもそれっぽく見えるのが
面白い!
22 :
デフォルトの名無しさん :2007/01/17(水) 00:32:02
若いの オラが村では派遣の問題を口にしちゃなんねーだ お前さんはまだわけぇから言いたいこともあるべぇ だべな、派遣問題を口にするとムキになって怒る者がおるでよぉ 問題の指摘は駄目だっぺぇ 派遣のことは口にしちゃなんねぇ この村みたいな糞田舎で悲惨な生活するためにはよぉ 北朝鮮と一緒でよ、駄目のものを駄目と言ってはなんねえだべさ タブーを口にしちゃいけねぇだ オラ達みたいな田舎者の鉄則だっぺ
ピンク板で この娘誰?のまとめサイトを管理しているものです
重複依頼がないように画像をMD5で照合するシステムを行っております・・・
ほとんどの重複依頼はMD5でチェック可能ですがファイルが少し加工されている
場合は全く意味がありません...
そこで類似画像を検索できるシステムを構築したいのです
詳しい方よろしくお願いいたします・・・鯖の負担を減らしたいので
できるだけ処理はクライアント側で行うようにしたいです・・・
まとめサイト
http://gaibusyou.mine.nu/~syobon/konoko/index.html 長々とごめんなさい...
そんなに簡単に言うなw 加工方法がある程度絞れるなら、何とかなるかもしれないが。
>>24 |ω・`)やっぱり...
類似検索ソフトをローカルエリアではなく
使用できるようにできればいいのですが...
高速検索用のファイルは画像を追加するたびに作ります...
どこかの類似検索ソフトのソースを参考にして作ればいいのでしょうが
なかなか難しいのです...ご意見ご協力よろしくお願いいたします...
>>25 回転を考えなくてもいいなら、大きさを正規化して、チャンネル毎の輝度を0-255で正規化して
特定の大きさの要素に分解して、各要素の密度だの空間周波数だの適当な値の
マトリクスを作って、比較用ハッシュを作っておけば、それなりの精度で検出できると思う。
回転が入ると無力だが、23氏の用途には足りるかも知れない。
なんだったけ、Scale-Invariant KeyPointがどーとかこーとか。 SIFTがどーとか、アフィン変換がこーとか。 いずれにしても、クライアント側で計算させるには、それなりに考えないといけないね。 いまなら、JavaScriptでやっちまうのかな(w
>>25 とりあえず、いきなり高度なことはしないで、こういう方法はどうですか?
1.多少加工されても残る特徴だけを残した画像を作成する。
たとえば、エッジ検出→2値化→収縮膨張 など。
2.オリジナル画像のMD5で比較するのではなく、この作成した画像のMD5で比較する。
26の言うように、大きさは正規化しておく。思い切って小さくしておく。
多少の誤検出は気にしない。
なお、回転やトリミングされていた場合は、あきらめる。
回転やトリミングされている画像の比較処理にはかなりの
時間を食うので、今回は現実的ではないと思う。
というか、想定している加工はなに? アイコラも入るのか?
>>10 もうちょっと画像処理にこだわるなら
イメージからエッジ抽出して線画にしてから
iとかlとかーとか使って線画のAAっぽく変換してくれるものを希望
小さい解像度にして(32*32くらい?) 比較すれば速いんじゃないか? 処理も簡単でしょ。
jpegの再圧縮による劣化なんかも「加工」かな? おそらくもっとも多いパターンの一つだと思うけど。 しかも縮小比較がもっとも効きそうな気もする。
>>31 ウェーブレットつーか画像ピラミッドだな。基本中の基本。
34 :
23 :2007/01/17(水) 18:01:39
みんさんご意見ありがとうございます。
この娘誰?スレ(アイドル画像板)のまとめをやってみてわかったことは
アップロダであがっている画像をそのまま依頼、または実況スレなどで貼られた画像を依頼というのがほとんどです。
なので大体はMD5で解決できます。しかし、画像の流れというものがあり定期的に質問される画像もあります。(類似検索が必要なものが含まれます)
このような画像をどうにかしてみたいのです。見た目はほとんどかわりません。
現在のMD5検索でヒットしなかった時にとりあえず使用してみるような感じで考えています。多少の誤差は気にしません。
すばらしいな検索方法ありがとうございます。どれも実用的ですばらしいです
あまりにも高度なことは全く考えられないしプログラムを組むこともできないので
縮小比較で類似検索をするものを考えていきたいと思います。よろしくお願いいたします!
もっと簡単に類似検索ができる方法をお持ちの方もよろしくお願いいたします。
>>30 ローカル以外でも類似検索できればそのソフトで十分だと思います!
>>30 去年の春ごろ公開停止されていないか?
web.archive には一応まだあるが・・・
36 :
23 :2007/01/17(水) 19:19:46
タイプミスごめんなさい... 類似検索機能付きの画像管理ソフトで画像は管理しています。これもローカルのみ検索可能ですが...
画像の上や右端がカット加工されてサイズが変わってるやつなんかもよくあるな。
38 :
23 :2007/01/17(水) 20:08:14
>>37 そうです!
出版社名が消されるのが多いです。
同じ絵を別の人がスキャナーで取り込んだやつの違いなんかもあるよね? 微妙な回転に開始位置も終わり位置も拡大縮小サイズもぜんぜん違う。 こういうのは相当難しいしアセンブラで書いても遅いだろうなぁ。
エッジ抽出して4x4でもそれなりに動作するよ. マンハッタン距離出せるし
サイズが全然違ってるのを前提にしないといけないんだから、どうせドット単位で比較する しかないと思う。 片方画像の丁度中央32*32を一つ切り抜いて、もう片方の画像の中央部分 4分の1サイズくらいに的を絞って、さっきの32*32と1ドットづつ動かして比較。 ほぼ同じ32*32が見つかれば、同じ画像の可能性アリとして候補にあげて 後はユーザー(人間)に判断してもらう。 拡大縮小回転されたら通用しないけど。
中心部分のカラーヒストグラムをとれば良いじゃないっ
>詳しい方よろしくお願いいたします・・・鯖の負担を減らしたいので >できるだけ処理はクライアント側で行うようにしたいです・・・ これって、クライアント側が画像データベースを持たないと 行けない気がするんだけど。 画像数いくつあるか知らないけど、いちいち画像データベースを転送するの? とんでもない転送量にならない?
44 :
23 :2007/01/18(木) 06:51:19
ありがとうございます
縮小比較の計算するためのソースがなかなかみつからず...
誰?スレでの依頼は基本的にネットで流れている画像なので見ためはオリジナルとほとんどかわらないのです
>>32 さんの言うとおりです。それと掲示板などに貼る際にファイルサイズを変更してしまった画像が主です。
>>43 依頼する画像の処理をクライアント側でしてハッシュで問い合わせるような考えです。
基本的に現行のMD5のチェッカーと同じやり方で考えています。
動画の類似比較できるものってありますか?
そういや TortoiseSVN 1.4.1 で画像差分とれるようになったんだよな… あれ どーやってんだろ?
ぐぐってみたけど、ただのインタフェースだけじゃないかな。 横並びに表示したり、アルファ値を変えてオーバーラップして視認しやすくするソフト。
てんきゅう。 内部はバイナリ差分の保持のまま か。
>>44 それは事前に一定比率で縮小した全画像達をデータベース化しておくってことだよね?
>>44 > 依頼する画像の処理
具体的にどんな処理をする気?
処理によっては、ハッシュ問い合わせ役に立たない悪寒
クライアントの手元にある単一映像 鯖内にある映像群 ファイルの一致性は MD5ハッシュ比較でわかるけど… 映像の類似性を比較できるようなハッシュ関数を求めている っつーことなのか?
53 :
23 :2007/01/18(木) 17:26:30
映像の類似性を比較できるようなハッシュ関数なんてあったっけ?
>>54 だから適当なそれを作ってくれと言うことでしょう。
違いが少ないときに違いが少ない値に収束するようなアルゴリズムを。
それに対する答えが、
>>26 以下なわけです。26が適当な値のマトリクス
と言っている部分の値を何で決めるのか、その前処理をどうするのかが、
以降いろいろ言われているだけです。
ただ、行列の大きさが小さくなればなるほど、原理的に違う画像がmatchする
確立が高くなるわけで、その違いを最終的に検索者に対して選択させる
ユーザーインターフェースを作る方が大変な気がします。
今は画像ファイルのMD5を取ることでこの揺らぎがほぼ0なので、
この部分が不要になっていますが。
56 :
デフォルトの名無しさん :2007/01/19(金) 00:16:21
>>53 >その問い合わせの際に必要なハッシュ(たぶんこれでしていると思います)を計算するのがクライアント側
>問い合わせの処理は最終的にハッシュのようなもので
ハッシュというかMD5で作られるようなダイジェスト値のことを言ってるの?
そんな値だけ送られてきて、サーバ側でどうやって画像類似比較するんだ??
そもそもあまりこの話題に興味ないけど、それでも
>>54 とか
>>56 とかまともに読んでもいないゴミは邪魔くさいなぁ。
おまいら md5 って単語に踊らされすぎだ。 画像特徴量とかに読み替えろよ。
最近SPAMメールに本文がなくて画像のみのが増えてるんですけど その画像類似性からフィルタリングする方法って実用化されてますか?
画像のみって時点でスパムじゃねーの?
すみません 表現が間違ってました 本文が全く無い訳ではないのですが 特徴も意味もなにもない適当な単語の羅列で・・・
本文がそれなら画像の方もランダムじゃないのかよ
>>62 最近よくある、海外の怪しげな広告の類だったら本文は余り意味がない文章で、画像はそれっぽい広告になっている。
>>59 本文が意味不明な段階で、画像類似性なんか判断するまでもないだろ。
>>64 >本文が意味不明な段階で、画像類似性なんか判断するまでもないだろ。
まあ人間が見るぶんにはそうなんですが、
フィルタに自動判別させるときには意味不明で
使われてる単語の切り出しでもランダムなら
本文では判断出来ないのでそれなら
画像で判断したらなんとかなるかなぁと
特徴量の集合を考えるんだろうな。 しかし、回転とスケーリングを考慮した特徴量ってのも難しいな。 単純に映像サイズを同一化するだけじゃすまないしねぇ
画像の含まれるメールは全部ステていいんじゃね(w
DIBをJPEGに変換したいです。 現在はJPEGLIBを使用しています。 モニタツールなのですが、 スクリーンショット撮影→DIB→JPEGLIBでファイルに書き出し →CreateFileでJPEGファイルを読み込み→Socketで送信 という処理をしています。 DIB→JPEGLIBでメモリ上に変換→Socketで送信 と処理を省きたいと思っています。 JPEGLIBでそれが可能でしょうか、もしくは 他のJPEGライブラリで可能なものはありますか?
JPEGLIBでそれが可能
どうやってやるん?
JPEGのライブラリってそれしかないのか?
いい加減ウザいんですけど
74 :
デフォルトの名無しさん :2007/01/21(日) 00:41:09
75 :
デフォルトの名無しさん :2007/01/21(日) 03:33:29
>>23 ただのシステム管理屋さんが踏み込めるほど簡単な問題じゃないです。
類似画像の検索は研究レベルだと数十年前から、それこそ画像処理が始まった当時からなされているものなんです。
いまでは実用レベルに近いアルゴリズムもあるけれど大規模に誰でも使えるレベルにはなってません。
有料のライブラリを買って、数学的な理解を持ってして初めてなんとか動くレベルに持っていけるものだと思うよ。
>>75 案件には要求レベルというものがあると言うことを知らない、
頭がちがちの使えない研究者が言いそうなことだな。
77 :
デフォルトの名無しさん :2007/01/21(日) 08:26:09
類似の程度によるな
風の特効薬はないと言って、総合感冒薬の存在を否定する研究者のようだ。
総合感冒薬が風邪を治す訳じゃないってことは知ってる?
80 :
23 :2007/01/21(日) 09:16:58
なかなか難しいようですね。。。
グーグルのような検索サイトをつくるわけではないので
大学とか研究所などでやっているアリゴリズムは使用するつもりは全くないのです
>>32 さんのカキコのようなものが多いので
その画像を簡単(多少の誤差は問題ないです)な方法で評価できるやり方を教えてください
すみません。。。
>>79 治す手助けをするわけでしょ。
今回の案件は類似画像検索が自動である必要ないのだから、
画像照合支援という点で似ているのかな、と。
1:最初のうちは重複依頼があるたび依頼ごとに手動でカウントしてまとめておく 2:ただし、類似画像は削除するがMD5は残す 3:で、新しく依頼を追加するときにまずMD5でチェック 4:ヒットしなければカウント数が多い依頼のうち上位のものと照合して類似判定 5:重複ならMD5だけ登録してカウントを上げる ※カウントは一定の期間内だけ記録できるといいかも とか考えたけど、単体の画像同士の類似度判定がわかんね
クライアント側で検索したい画像の特徴抽出 サーバへ抽出した特徴を送信 サーバ側で特徴データベースでも作っておいて類似度計算 類似度が高いものをクライアントへ送信 サーバの負荷すごそうだからダメか・・・
2007 の4つの数字の並べ替えで出来る最大の数から最小の数を引く -> 7200 - 0027 = 7173 同様に -> 7731 - 1377 = 6354 -> 6543 - 3456 = 3087 -> 8730 - 0378 = 8352 -> 8532 - 2358 = 6174 -> 7641 - 1467 = 6174
画像は必ず横が長くなるように回転して保存しておく(MD5でのチェックもしやすい) 縦横比率(近似値)の統計をとって分類し、比較量を絞る ユーザーが重複を報告しやすいようにする うーん
>>85 JPEGは回転したら再圧縮だから、MD5比較は使えなくなるよ。
別にjpegで保存する必要はないような
展開したもので比較しなきゃ
だからどのくらいの要求なの? なにか例はないの? 目線あり、なしも同一視するの? モザイクあり、なしも同一視するの? むしろ、同一人物判定までいくの?
>>89 具体的なサイトが上げられていて、用途もわかってるんだからちゃんとやる気なら
そのあたりから察するのが良い人材。
やる気無いけど聞いているだけなら引っ込んでろ。
やる気たっぷりで、かつ完成させたなら土下座して謝る。
つか、簡易比較の方法論とその問題点についてはほぼ既出だろ。
91 :
23 :2007/01/21(日) 12:41:26
92 :
23 :2007/01/21(日) 12:42:37
93 :
23 :2007/01/21(日) 12:43:49
94 :
23 :2007/01/21(日) 12:53:42
95 :
23 :2007/01/21(日) 12:55:56
作ってほしいんだったら他所へ行け
>>86 90*n度なら、ヘッダに回転情報を書き込むだけで対応できるので、必ずしも再圧縮を必要としない。
具体例はJTrimとか。
JPEG画像を書き出すライブラリってどんなのがあるのですか?
重複したって後から提供された画像の方が適切って事もあるだろう。 解像度が上がっているとか、目線が必要な画像に目線が追加されているとか。 それでも弾くのか?
>>23 画像は総数何枚くらいあって
それを何ミリ秒で比較し終えればいいのか。
102 :
23 :2007/01/21(日) 19:16:40
ファイルが違うものは保存します...同じ画像の質問があったのか、なかったのか、それを質問者がスレに書く前にわかれば わざわざ書き込む必要もなくわざわざ答える必要もなくなります! 現在のチェッカーは画像の保存をしなくてもコピーしてkonokoファイルにペーストするだけで検索するのでカキコするよりも 回答が早いです 現在15073枚あります。検索時間は10秒以内 もちろんnamazuのような高速検索するために必要なファイルをあらかじめ作れたらですが・・・
CPUとOSは何?
104 :
23 :2007/01/21(日) 20:04:04
電気代が気になって 省エネ化をしたので玄箱です(しかもHGじゃないもの) 単純な計算なら速いですが複雑な処理は無理です。。。 OSはもちろんDebian 2chのまとめサイトならbanana鯖を使ってもよしとなればいいのですが・・・
YUV形式Packedから各々の成分を別々に抽出する事って出来ませんでしょうか?
どうでもいいけど、いま、ソフト板の類似重複画像検索スレで なんか作ってる奴がいるぞ。 そいつに頼んでみれば?
107 :
23 :2007/01/22(月) 02:04:42
>>106 ありがとうございます。
書き込みしてきました。
今後もよろしくお願いします。
C言語でテンプレートマッチングを使った文字抽出を行いたいのですが調べても資料がまったく見つかりません。 お勧めの書籍やサイトがあったら教えていたけけないでしょうか。コンパイラはc++BuilderXで使う画像形式はBMPです。
作成したソフトウェアに必要な画像や音楽のデータをソースコード内に組み込んで ソフトウェアを起動するときには画像や音楽のデータを不要にしたいんですけどどうしたらいいですか
>>108 raster_scanでsubimageテンプレート比較etcの汎用の枠組みをgil使って作ってみた.
多分もうじきupできるから,使ってみてくれると嬉しいかも
>>111 まじすか!!
俺は108じゃないけど、wktkしながら待ってます!
113 :
デフォルトの名無しさん :2007/01/23(火) 04:35:39
【ネガティブ派遣根性チェック】 3つ以上、思い当たる点があればアナタの性格はひん曲がっており、ネガティブ負け組人生を歩んでいます。 □派遣先の人事権のある社員の意見はたとえ間違っていてもマンセーする □派遣先から「いつまでもここで仕事してくださいね(安い金でw)」と言われている □自社に仕事を持ち帰れるように言われるとムカつく □自社で仕事なんてできるわけがない □派遣労働の問題点の話題が出ると感情剥き出しにする □派遣労働の問題を指摘する人は嫌いだ □派遣先には仕事だけでなく自分のプライベートについても指示して欲しい □自分の月額金額を知らない □派遣先社員より自分の生涯収入が低いのは当然だ □派遣先に尻尾を振り、いつまでも派遣を続けることが大切だ
114 :
108 :2007/01/23(火) 09:29:36
115 :
111 :2007/01/23(火) 18:14:33
116 :
111 :2007/01/23(火) 18:49:45
テンプレートマッチはこれでいけた vec_t target_vec= subimage_to_vector(left_eye_image); gil::transform_pixel_positions( uchar_lena,result_img, boost::bind(ublas_norm_2_distance_fn<double>(),target_vec, boost::bind(subimage_to_vector,//subimage (sub_width x sub_height x n_color) copy to vector boost::bind<img_view_t>(subimage_extract,_1) //extract_subimage each location ) ) );
117 :
デフォルトの名無しさん :2007/01/23(火) 19:12:58
JPEGファイルのSOSマーカ内にデコードに影響のない数バイトを 埋め込むことはできないでしょうか? 何かのタグでくくるとかありそうな気もしますが見つかりません。
なんでSOSに埋めるの?
よく見ろ。ZOZだ。たぶん見た目からは想像できないとんでもない情報量が埋め込まれるんだ。
長門乙
SOSにかまどうまを埋め込む方法を教えてください
序盤に出たAA大人気だなw
素直にCOMマーカーじゃダメなんだっけ? あとは、やったことないけど RSTmマーカーをうまく使えば、ごみを混ぜても復号してくれるかもしれん
125 :
108 :2007/01/24(水) 09:27:54
>>111 さん、ありがとうございます。早速参考にさせていただきます。
男は狼なのよ〜
コンピュータビジョンで、 今これが熱い ってのありますかね? 顔認識やってたんですけど、新鮮味もないしなぁと。
いっそのこと認識から離れるのもいいかなぁとも思っているんですよね。 例えば、Shape from Motion とかってどうなんですかね? 3D 分野が熱いのかなぁと。
>>128 ちょっと脱線するんですけど、そのコンテストって論文で発表されている手法をただ実装したらだめなんですかね?
たとえばモザイク(パノラマ)だと Lowe 先生のやつ。
- David G. Lowe, "Distinctive image features from scale-invariant keypoints," International Journal of Computer Vision, 60, 2 (2004), pp. 91-110.
- Matthew Brown and David G. Lowe, "Recognising panoramas," International Conference on Computer Vision (ICCV 2003), Nice, France (October 2003), pp. 1218-25.
- D. G. Lowe. Demo software: Sift keypoint detector. Technical report, July 2005.
そのコンテスト知らなかったです。いや、ページを見たことぐらいはあったのかな。
131 :
112 :2007/01/24(水) 13:43:00
>>111 ソースが多いので解読するのに時間がかかりそうですが、参考にさせて頂きます。
>>130 関係者では無いが、全くかまわないのでは。
工学は独自性よりも性能、できた者勝ち。
133 :
111 :2007/01/24(水) 14:34:21
>>131 example codeと同様に書くだけでraster scanができるので
このやりかたがいいと思ったのですが
typedefが多すぎるのが見にくい原因でしょうか?
134 :
111 :2007/01/24(水) 14:41:03
gil_raster_scan_01/src/stllcv_vs2005.sln gil_raster_scan_01/src/gil_raster_scan/gil_raster_scan.cpp だけ見れば、あとは解読しないでも大丈夫だと思います
135 :
112 :2007/01/25(木) 03:36:47
>>133-134 レスありがとうございます。
解読に時間がかかるというのは、私自身がGILやBoostの使い方をしっかり把握していない、
勉強不足からのものです。
助言どおり、gil_raster_scan.cppを参照しながら勉強します。
先生方、 できる!ウェーブレット とか、 猿でも判るウェーブレット とか、 どんな馬鹿でもわかるようなウェーブレットの本が無いでしょうか? おすすめの一殺を教えてください。
自分が見た中では↓。基本的な考え方は押さえられると思う ウェーブレットによる信号処理と画像処理
139 :
デフォルトの名無しさん :2007/01/27(土) 23:28:11
フォトショップやベクターワークスで作った点をボロノイ図にする ソフトとかプログラムってない?
>>137 amazonにこんなコメントがあるんですけど大丈夫でしょうか?
ウェーブレットについて初心者なので本書を購入してみました。
・・・が、内容があまりにも稚拙です。
ものの2時間くらいで読み終えました。
数学的に解説が貧弱です。なんら新しい知見が得られませんでした。
変な例を出して解説している部分が多々ありますが、
直感的に理解することの意味を勘違いしているとしか思えません。
筆者の数学的素養が疑われます。
したがって、読み物として買う分には別にどうでもいいですが、
本気で勉強しようという人にはお勧めしません。
そいつが自分に合ってる本かどうか見極められずに買ってしまっただけ。
じゃあ漏れにも必要なさそうだから買うの止めるわ
本は金出せば誰でも買えるし、読んで本人が満足すればそれでいい。
数学も画像処理もバリバリで、今度ウェーブレットを始めてみようと思ってる 「ウェーブレット初心者」と、数学はせいぜい中〜高1レベル、 画像処理はアフィン変換がせいぜいな「ウェーブレット初心者」では、 読む本が違うのはあたりまえ。
>>140 なにをしたいかによる、離散ウェーブレット、高速ウェーブレット変換の
アルゴリズムを理解したいのなら該当の本でOK
ウェーブレットを使う側向けの本と思えばあれで十分
数学的な解説を本格的にしようとしたら、
「関数解析」を理解していることが要求される
とてもじゃないけど、ほとんどの技術者、学生は理解できなと思われる
amazonでコメントしてた香具師が池沼ってことでFA?
いや、ただ自分の意見を言っただけだろ。 読む側がそれらも踏まえて読むだけ。
マザーウェーブレットの構成方法とかはおいておいたとしても、 ツースケール関係とかもなんでそうなるのかが書かれてなかった様な希ガス そこが、「数学的に解説が貧弱です。」なのかなと思うが。 技術者的には解説して欲しい気もするが、それで極端に難しくなるなら なくてもしょうがないと思った。 以前、サポートベクターマシーン入門って本読んだんだけど、 最も基本な「マーセルの定理」が定理だけ記述されていて、 証明がのってなかった。 しょうがないんで、自分で条件付きの概略証明考えたんだけど… まあ、書く方としては読む側のレベルも考慮して書くから、 省くとこは省くしかないんでは?
149 :
111 :2007/01/29(月) 07:14:01
150 :
デフォルトの名無しさん :2007/01/30(火) 13:01:00
ウェーブレットによる信号処理と画像処理 はやめといたほうがいいですよ。 間違いが多いし,全体的に句点の使い方がおかしい. 展開係数からウェーブレットを構成するカスケードアルゴリズムの説明までは書かなくていいけど, どうやって展開係数を求めたかくらい簡単だから説明しろよと でないと,ウェーブレット条件とか正規直交条件やモーメント条件が何のために定められてるか普通の大学生にはわからないと思うよ. ドベシィはサポートが有限で高速に計算できるというメリットしか読み取れない. 卒論で20ページくらい丸写ししたら,先生に国語力は大丈夫?みたいに言われたよ
。 , . を混在する奴に言われたくないだろうよ
>>150 そこまで言って、丸写しなんだからとんでもねーな。
その意見は先生の意見の丸写しかい?
ハーバードからきてた先生の英語論文作文の授業では イントロはコピーしてもOKって言われた 本体はもちろんコピーしないけど
イントロも本体じゃねーの
一般の教養書なんか読むなよw ペーパーをどんどん読むんだ
156 :
112 :2007/01/30(火) 19:47:14
>>149 お誘いは非常にありがたく、また、うれしく思います。
しかし残念ながらスキル不足のためお役に立てそうもありません。。。
>>135 でも言いましたが、GILやBoostについての理解がまだ乏しい上、
C++自体(特にテンプレート)が使いこなせていないので、
正直、いつになったらGILが使えるようになるのか…という状況です。
ただ、
>>111 さんのようにコードを公開してもらえると、私のようなやつには(^^;
使うときに便利なだけではなく、設計面からも参考になるところが大きいので、
公開自体は是非続けて欲しく思います。
また、本来の趣旨とは違うと思いますが、GILの敷居が高い理由のひとつに、
日本語ドキュメントが(ほぼ)存在しないことがあります。
wikiのような形で、日本語ドキュメントを提供する…ということなら、
勉強がてら力になれるやもしれません。
↑
GIL Tutorialの最初に出てくる、imageとimage_viewの違いからして理解してないので、
本当に「初歩的な」ところからになりますが;;;
以上、能無しっぷりを露呈すると共にやらないことの言い訳を延々と書きましたが・・・
そういうわけで、ごめんなさい。
「ウェーブレット実践講座」が好き
158 :
デフォルトの名無しさん :2007/02/01(木) 22:20:57
携帯でしか閲覧できない.jpg.HUFという拡張子のファイルが あるんですが、どうやったらプロテクト解除できるのかわかりますか? とりあえずバイナリエディタで開いてみたんですが全然わかりません。。
>>158 板のトップ嫁
>ウイルス、ハッキング・クラッキングを求めるような発言は禁止です。
160 :
デフォルトの名無しさん :2007/02/03(土) 16:05:15
とりあえずバイナリエディタで開いてどうするつもりだったんだ? Matrixのコードを読めるバイナリアンかwww
x86しか読めません><
スレ汚しすま(自分と同じトラブルにあってサポートに「そんな事例はありません」といわれ 泣き寝入りしている人の為に以下の情報を残します。) J-COMが提供しているマイシールドがバージョンアップされたがそれを適用した所、 ・マシン終了時、ハングアップして終了しない ・次のマシン起動以降、3〜5分でsvchost.exeが死にマシンがまともに動かなくなる。 (マウスカーソル以外動かない状態になる。) またIEなどでインターネットを見ていたとして、見えなくなってしまう。 なんとかマイシールドをアンインストールしたが、それでも挙動はおかしいまま変わらない。 WindowsXPHomeを再インストールしまともに動いている所に、またマイシールドをインストールしたら また同じ挙動になった。 ※ マイシールドが入っている状態で、無効化すると5分以上過ぎてもまともに動いていた。 こんな現象に出会った方、J-COMにちゃんとクレームしましょう。 (クレームが入っていない、と言い張っているが、少なくとも私はクレームしました。)
>>162 スレ違いどころか板違い。はっきり言って荒らし。
もうこのスレ見に来ないだろうけど。
もうこのスレ見に来ないだろうけど。 もうこのスレ見に来ないだろうけど。 もうこのスレ見に来ないだろうけど。 もうこのスレ見に来ないだろうけど。 もうこのスレ見に来ないだろうけど。 べつに宣言しなくても・・・止めてほしいのか? w
??
>>162 が、でしょ?常識的に考えて・・・
(・3・) エェー で?
勘違いするな
(・3・) エェー で?
勘違いするな
(・3・) エェー で?
勘違いするな
みなさん開発にはどんなPCを使っていますか? メモリーは1Gあれば十分ですか? 64ビットCPUだとかなり効率が違いますか? 最近、コンパイルだけで15分近くかかるようになったため PCの買い替えを検討しているのです
その質問は無意味だ
別にいいんじゃね cで書いてRubyでwrapが最高とか思っている人もいそうだし
(・3・) エェー で?
179 :
デフォルトの名無しさん :2007/02/07(水) 00:28:16
すごく高速に処理出来るって聞いたんだけど、 gpuで処理してる人っている?
Linux版のCUDA環境がでたら,さわってみたいなぁ
>>179 まさにその為にPC込みで発注しましたが、未だこれからです。
182 :
デフォルトの名無しさん :2007/02/07(水) 07:40:35
Lempel-Zivについて。
"IM_ULM_UM_ULM_UND_UM_ULM_HERUM"をLempel-Zivで圧縮したらどんな風になるんかな?
↓ここでは最初に全部のアルファベット読み込んでるけど
ttp://en.wikipedia.org/wiki/LZW 上の例では無駄が多くなっちゃうよね?だから、動的に読むことにした。
自分で辞書とコードを作ってみたんで合ってるかどうか確認してやってください。
0 I
1 IM
2 M
3 M_
4 _
5 _U
6 U
7 UL
8 L
9 LM
10 M_U
11 _UM
12 UM
13 M_UL
14 _UL
15 ULM
16 LM_
17 M_UN
183 :
デフォルトの名無しさん :2007/02/07(水) 07:41:43
18 _UN 19 UN 20 N 21 D 22 _UM_ 23 M_ULM 24 _ULM 25 ULM_ 26 LM_H 27 M_H 28 _H 29 H 30 HE 31 E 32 ER 33 R 34 RU
184 :
デフォルトの名無しさん :2007/02/07(水) 07:47:50
原文字=コード I=0 M=2 _=4 U=6 L=8 M_=3 U=6 M_U=10 LM=9 _U=5 N=20 D=21 _UM=11 _UL=14 M_=3 H=29 E=31 R=33 UM=12 ・・・どうでしょう?
186 :
デフォルトの名無しさん :2007/02/07(水) 08:26:21
あれ、じゃ、どのスレに逝けばいいのか誘導してください。
188 :
デフォルトの名無しさん :2007/02/07(水) 08:36:14
vigraの人がBoost.AccumulatorsのReviewに投稿してた やはり画像処理の人はみんな注目しているライブラリーみたいですね
vigraでぐぐってみたら もしかして: viagra って表示されて、日本語解説ページは0なのね。 今、OpenCVを使いまくっているけど、vigraに移る価値とかある?
これからはAdobe.Gilの時代
192 :
nee :2007/02/12(月) 22:49:25
vbで画像を取り込みエッジ処理してから両目を抽出しようと思いハフ変換も用いてやろうと思ってます。
そこでいま問題になってるのが
http://codezine.jp/a/article/aid/153.aspx ここで見つけたjavaのハフ変換をvbに直してプログラムしてみたんですがjavaではループを抜けるのにcontinueを使うんですがvbではありません。
continueの代わりに使うとすればどうすればいいでしょうか?
goto
何でVBスレ行かんの?
>>192 exit forかgotoしてください。
>ループを抜けるのにcontinue あれ?breakじゃね
2005ならContinueがある。
198 :
nee :2007/02/12(月) 23:13:23
ありがとうございます。試してみます。
199 :
nee :2007/02/12(月) 23:29:16
2005でやってみたんですがvb.netにくらべ処理がかなり遅いんです。 なぜでしょか?
2005はコンパイルすると中間コード状態の実行ファイルをはき出す 実行するときはその都度frameworkのライブラリを呼び出して実行されるので遅い
>>200 .netってネイティブコード吐くのか?
まあwin32 apiがしがしつかうプログラムならいっそのこと vc使え というか画像処理でvb, vc#なんてつかうもんじゃない と思ったり思わなかったり
なんで?
205 :
nee :2007/02/13(火) 00:56:54
じゃ2005はあまり使わないほうがいいってことですか?
いい加減スレ違い
>>200 まるでCLRがインタプリタであるかのような書き方だなw
漏れの場合 C# で書いたコードはC++の最大で2倍程度遅いな。 ちゃんと高速化してるつもりなんだけど。 処理中の画像をちょっと表示したり等が楽なので結局C#使ってるが。
あと画像処理というか数値計算でのC#の問題点は、 デバッグモードでの実行時間の素晴らしい遅さ。 問題が発生するまで計算を進めていくのに、 リリースモードの10倍の時間がかかる。
過言だわな。 すれ違いだからもうやめとけ。
>>210 正しいお
vista使えばすむ話だけどやっぱVisual C++にはかなわないお
templateでインライン展開されるからいいや、みたいな前提のコードを バグが出てからってデバッグモードにして実行すると矢鱈と遅い・・・・・・
templateは使わないこと。これ基本
どうでもいいがtemplateとinline関数展開には直接的な関係はないぞ。 クラステンプレートだと普通メンバ関数全部class内で定義するからinline扱いになるが。
スレ違いでわるいけど、リリースビルドの時もそんなに差があるの?
漏れが書いた簡単な動画圧縮プログラムでは2倍くらい差があった。 SSEもMMXも使ってないのに。 どこが遅いのか調べてないのでまぁ書き方にもよるのかもしれないけど。 fixed 多用して C++ 風にポインタを使っても対した改善なし。
ublasは最適化オプションつけてコンパイルすれば cでべたに書くのと、そんなにかわらないらしい
220 :
デフォルトの名無しさん :2007/02/17(土) 16:44:06
SSRフィルターについて教えてください
221 :
デフォルトの名無しさん :2007/02/17(土) 18:20:28
たんけい(?)ってなんですか?
224 :
デフォルトの名無しさん :2007/02/17(土) 21:15:09
226 :
デフォルトの名無しさん :2007/02/18(日) 00:00:10
わかるひといますか?
>>226 くけい、と読みます
たんけい、じゃないよ
うわあああああああ 俺も今までずっとタンケイだと思ってた!!!!!!1
いまどきはもうPSGで矩形波いじって効果音とか作ったことあるヤツって少数派なのかねぇ。
俺も効果音とか作ったことあるけどさ それもタンケイハだと思ってたのよ
ただでさえホウケイだというのに
俺もたんけいだと思ってた
きょけいだと思ってた…
ITKって内部のコードはGILみたいに綺麗で読みやすいの? マニュアル600ページ近くあるので把握するの大変そうだけど
HDRの画像処理について詳しく書いてるところってどこかにない?
なんとかいう有名なHDR用のソフトのサイト
>>236 で、(p) ってなに?あと ImageMagick の URL に , が入る。
さあ?>(p) あ、ホントだね。 , が入る。スペースで区切ったほうがいいな
(p)は公式p2
244 :
4545 :2007/02/21(水) 18:33:25
p2 使ってると、リンクをポップアップで表示する(p)っていうリンクが
URLの前にひょうじされるんよ。
それもまとめて貼ってしまっただけでそ。
特に公式とか関係ない。
ちなみに (p)(p)
http:// 〜 に見える。
それがどうしたんだ?
ふーん、そうなんだ、じゃあなくてもいいな。
なくても、じゃねーや、なくていいな。
ないといいな
OpenCVで、画像を切り出す(トリミングする)関数名ってなに?
ROI設定してコピーしなはれ
256 :
デフォルトの名無しさん :2007/02/25(日) 19:34:17
MISTをUbuntuで使おうと環境設定とチュートリアルのとおりにやってみた リンク時にエラーがでる orz エラーメッセージをみると画像ライブラリのインターフェースと整合とれてないようだが。 困った。
ああそう
またまた質問・・・OpenCVでテンプレートマッチングするとき、 指定範囲で画像を検索したいのですが、ROI設定はどのように設定すればいいですか? CvRect searchRegion; // 探索したい範囲 IplImage *gray; // 探索先画像 IplImage *temp; // テンプレート画像 IplImage *dst; // 結果格納用 cvSetImageROI( gray, searchRegion ); cvSetImageROI( dst, searchRegion ); // これだと実行時にエラーが出る cvMatchTemplate( gray, temp, dst, CV_TM_CCOEFF_NORMED );
OpenCVのROIって 関数によっては無視してる場合もあるみたいだけど ROIはおまけ程度と思ったほうがいいのかな? 確かROI領域だけFFTかけたい、とかできないよね?
ImageMagicをWSH経由で呼び出せるんだね ちょっと感動
つかいにくいけどな。
減色を勉強中なのですが、xPadieのソースって色周りのバグがありますか? 前にダウンしたxPadieのソースを少し修正して、.NET 2003でビルドしたのですが、 一緒にダウンしたバイナリ版 (こっちは正常動作) と動作が違って、綺麗に減色されない感じです。 どちらもバージョンは39.0ですが、アイコンが異なります。 日付は、バイナリ版の実行ファイルが1999/12/13で、 自分でビルドした方の読んでね.txtが2000/08/18でした。
>色周りのバグがありますか? あるよ。 だから、xPadie Proとかがあるんじゃん。
そういや、
>>10 の人のアスキーアートのプログラム、以降どうなった?
また開発続けてる?
>>263 なるほど、単純な落ちバグだけだと思っていました(´・ω・`)
作者のテキストにある「画像横幅に依存し出力画像がずれるというバグがあります」とは
これは別のバグということでしょうか?
あ、ごめん、GPGPUだった。
CUDA拾ってきたからそのうちね。
271 :
デフォルトの名無しさん :2007/03/02(金) 14:43:12
質問させて下さい。 A4サイズの400dpiのオリジナルgif画像(モノクロ中間調)を、 ディザで二値化しようとしています。 今まではThumbs Plus や Photoshop などを使っていた のですが、これらでディザ処理をすると、ディザの間隔が細かすぎて不都合です。 (解像度を100dpiにしてディザ化し、400dpiに拡大するとうまくいくのですが、 この場合は文字や線画が粗くなりすぎます) 大体、0.5mm≒10ドット間隔程度の粗さでディザ化できればと思っています。 そこで、質問ですが、 (1)市販ソフトでこのようなディザ化が可能なものがあれば教えて下さい。 (2)市販ソフトで不可能な場合は、自作したいと思いますので、 適当なライブラリなどを教えて頂ければと思います。 なお、私はC言語は多少使えますが、今まで画像処理のプログラムを組んだことはありません。
2回挫折したのか
>>272 URL入れても、画像を送っても、何も起こらないのだが。
275 :
271 :2007/03/02(金) 18:03:30
すんません。
>>271 は無視して下さい。
(多値画像のまま扱ってよいことになりました)
>>272 opencv にそういう関数があるからすぐできるよ。
すごいのは intel の人
>>277 いや、ruby でも python でもないんじゃない?大抵
ウェブインターフェースを作るから自分の得意なスクリプト言語でラップしたってことでそ?
90年代より前の話だよ Symbolics Lispでググって来るといい
lispチップを沢山並べたpciボードで並列計算とか面白そ
282 :
デフォルトの名無しさん :2007/03/08(木) 18:56:14
VB.NETでDICOM扱いたいけど商用のライブラリしかねぇじゃねぇか VB.NETだけでなんとか解析&表示できないものか・・・
結膜炎みたいなのにかかって(つき目ってやつだと思う) しばらく片方の目はあけたくない。 しかし今月中にマスク画像つくらなくちゃなんないんだけど なにか楽して作業する方法ないのかな
板違いじゃねーか?
おまけにエスパーしろってか
金を出して外注しろや
287 :
デフォルトの名無しさん :2007/03/13(火) 12:36:53
ファイル群の中から同じ画像(80%とか100%とか指定して)探すってソフトあるけど まぁ、ピクセル単位でマップが似通ってるものとか100%ならMD5調べて一致したことにするとか 色々アルゴリズムはあると思うんだけどピクセル単位で調べてると余りにも時間がかかりすぎる これを何とかして早くして使い勝手をあげたいんだが何かいい考え方はないだろうか? やりたい事としてはロダとかで落としてきた画像で重複しているものとか、同じ画像だけどサイズが違うものとかを削除していきたい。 Able CV みたいな感じのを自作して細かい部分の使い勝手を自分好みにカスタマイズしたいわけだが
289 :
デフォルトの名無しさん :2007/03/13(火) 12:52:30
>>288 サンクス!
参考にしてない知恵絞ってくる!!
>>287 どっかのスレで知った アクティブ探索 というアルゴリズムが使えるんじゃないかな。
291 :
デフォルトの名無しさん :2007/03/14(水) 12:58:22
>>290 論文あったんでとりあえずザックリと読んでみた
これはイイ
時間とってやってみる価値はあるな
294 :
デフォルトの名無しさん :2007/03/30(金) 19:19:32
NIST の FERET 顔データベースって、どこかでダウンロードできないですか? 郵便使って DVD を請求しても、個人に送ってくれるのでしょうか? 大学とか企業の名前で請求しないとだめですかね。
なかなか不謹慎かつピンポイントなネタですなぁ. 頭のいいポスドクさんの考えそうなのではあるけど, 元ネタ知ってる人の方が少ないんじゃないかなぁ.
ぐうう、元ネタ全然わかんねorz
>>296 さん教えてplz
GIL2.0になってからHSVとL*a*bの色空間がなくなっちまったorz
301 :
デフォルトの名無しさん :2007/04/19(木) 11:35:14
拡張子が.jpgなのにアニメーションなる画像の作り方おしえてください
>>301 mpegでもmngでもAnimatedGifでも好きな形式で作って、ファイル名を変更。
ありがとう
それでいいのかよw
やっぱりできませんでした
去年秋の大学の課題なのですが、 「対象物が含まれていない画像(背景)と物体を含む画像の 2枚を用いて、物体領域を抽出せよ」 「カラー情報を利用した図形認識システムを作成せよ」 のふたつからどちらか片方をやるという問題が出ました。 プログラムが無理ならアルゴリズムのアイディア、説明、 画像処理・認識システムの構成をブロック図で表せといわれていたのですが 結局最後までわからないまま終わってしまいました。 どなたかこの問題の答えを教えていただけないでしょうか。 自由課題だったので単位自体にはかんけいなく、合格点は取れたのですが 答えを知りたいんです。どなたかお願いします
1.は簡単だろ?基本的には差分取るだけだろ?二つの画像の背景部分が全く同じならそれで終われるし、全く同じじゃないなら smoothing してから差分取るとかちょっと工夫。 2.はつまり色情報を使ってエッジ検出してから、図形認識しろ、だろ?図形認識そのものはちょっと手間取りそうだな。
>>306 答えは何通りもある。
この方法がベストという答えも無い。
その方法じゃだめだろというのは無数にある。
PRMU アルゴリズムコンテストに両課題ともあるな
>>306 >>307 の方法できまり
ただし2.の方法についてはもうすこし情報がないと何もいえない
図形認識と一言で言っても、円とか直線とか認識しやすいものから人間のような非剛体の
複雑なものまで様々
あー追伸 2.のほうは、わざわざカラー画像っていってることと、1. の問題の難易度から考えるに、 単純に、バナナとかリンゴとかいった画像からRGB値で閾値を設定して抜き出すとか そういうやつだと思う RGBでだめだったら、HSVとかL*a*bの色空間を使うとか。
312 :
デフォルトの名無しさん :2007/04/22(日) 09:07:02
C言語で学ぶ画像処理、みたいな本で そういうのを読んだな
その2以降の過去ログって見れない?
サンクス
ステレオカメラを使って物体の形状認識を行いたいのですが・・・何かいい方法ある?
まずステレオで検索して本でも買えや
cairoの話題ってここでいい?
いいんじゃないの 話せる人間はGTKスレの方が多そうな気がするが
領域分割のある点が同じ領域かどうかを判断する方法について質問です ある点はその点が属するグループの平均色を持っていて 隣接するグループで最も近いものを算出してくっつけるってやると 光の加減などで似た色のところがくっついてしまう そういった部分の多くが形状が異質だから形状も判断に加えるといけそうだけど 計算量が膨大になってしまって実用的じゃない 何か良い方法とか一般的な方法ってあるんですかね?
>ある点はその点が属するグループの平均色を持っていて これが悪いということだけは判った
光の加減とか不確定要素を取り除く工夫でもした方が前向き。 デジカメエンジン案件?
>>323 前向きといわれてもそれを聞いてるわけですが
エッジ検出の段階で形状を認識して自動的に補完するようにすればいいような気がするんだけど
そういうアルゴリズムってある?
形状認識っていうか写真なので大抵は曲線になってるけど
途中で線が途切れている場合に自動的に埋めるような
幅の拡張と収縮をしてみる
途切れるって1ピクセルとは限らないわけだが
たとえば、マンガのあるページとあるページが同じ作家で描かれたものだということを認識するアルゴリズムってありますか? それに近いものでも構いません。
画像処理とは違うモノになりそうだけど・・・ 同じ解像度でスキャンしたモノだったら 主線の太さ&使ってるスクリーントーンのパターンが 合致する割合が高ければ同じ作家である可能性が高いとかそんな感じで作るしかないんじゃね? カラーだったら使用している色のバランスも比較するとか。
スペクトル分析とその一致具合を見るんですね
そりゃ無理だ。同じ漫画家でも、20年も経てばまるっきり変わることも少なくない。
>>327 基本的には「認識」系の処理と同じかんじでできたりしないかな。
顔認識みたいなかんじで、クラス分けするときに作家で分けておくと。
まぁよっぽど研究しないと精度は低そうだけど。
特徴抽出手法に何を使うといいかとか研究した人がいるとはあまり思えないし。
とりあえず
>>328 みたいなのとか?
適当に顔認識の場合みたいPCAかWavelet使ってみたらまぁまぁうまくいった、なんてことは・・・ならないだろうなやっぱり。キャラ認識とかなら顔認識とほぼ同じ手法でいけそうな気もするけど。
>>329 そう。
ただ、全体のスペクトル分析でやると単純に場面が違うだけで近似しなくなるから、
「肌色領域」「オレンジ領域」「茶色領域」「水色領域」とか細かく分けて、その中での近似を探す、つう感じかなぁ。
その色が使われてない場合を考えて、各領域の割合が、画像全体でみて一定量より低い場合は
比較の対象から外す、とかそういう処理も居るとおも
画像扱う仕事してるけど、プログラムはnoobなのでご容赦を。
色使いや筆使い(ペン使い)から誰それの作品だな、てのを予想する際の自分の思考を
「プログラムだとこんな感じだろか」という感覚的なもんで書いてるだけなので、この板的には妙な事いってるかも知れん
正面の顔が多い漫画なら
>>331 さんの顔認識も使えるんでないかな
線が命だよ
>>329 コマやページ単位の比較の話をしているわけだから、スペクトル分析方面の手法では
精度が低すぎて使い物にならないと思うよ。
小説などでも、類似の手法に語彙の頻度や文の長さ抽出があるけれど、それらは
あくまでも1作品というくくりだからこそ、ある程度の精度を持っているわけ。
だから、そのアプローチだと、単行本1冊とか、作品全体を通してとかなら、
一定の精度が得られる可能性があるけれども、1コマや1ページでは誤差の方が
大きすぎて使用に耐えないだろう。
1Pや1コマなら、顔の部分に着目した、パーツの比率の分析をはじめとする、
顔認識の応用の方が良い結果を得られるんじゃないだろうか。
エロい話に聞こえる
>>334 でも人間は1ページみただけで誰の作品か瞬時に判断できるよな。
それをコンピュータでできないわけがないんだよ。
なにか方法があるはずなんだが・・・
>>336 分かるときもあるけど分からないときもあるよ
ある点が特定の三角形の内部にあるかどうかを判定する方法を教えてください
>>338 c1 = (y1-y2)*(a-x2)-(x1-x2)*(b-y2)
c2 = (y2-y3)*(a-x3)-(x2-x3)*(b-y3)
c3 = (y3-y1)*(a-x1)-(x3-x1)*(b-y1)
((c1<0)&&(c2<0)&&(c3<0)) || ((c1>0)&&(c2>0)&&(c3>0))
その3点が三角形を構成するかどうかを事前に調べる必要はありますか?
好きにしろ
>>336 脳研究学での画像認識を調べてみるといい、それなりに研究進んでるから。
結論から言うと人間でもそれなりの学習が必要。興味ないモノは全部
同じに見えたりするからな。
食品工場での異物排出なんか未だに目視がメインの世界。
海草類の異物検出とかやれと言われても。
ひじきの中にまぎれている昆布
>>338 ・その1
三角形ABP、BCP、ACPの面積がABCと等しければ内部にある。
・その2
点Pが三角形の辺AB、BC、CA全てに対して右側or左側にあれば内部にある。
・その3
点Pから適当な方向に伸ばした直線が、ABCの辺と1回だけ交差すれば中にある。
・その4
辺ABがX軸、ACがY軸の座標系に変換して、x>0, y>0 x+y<1の範囲なら中にある。
339は2の方法。
>>336 うん。だから、それが、329の後半のパターン認識部分。だけど、
>それをコンピュータでできないわけがないんだよ。
はどうかとおも。
347 :
デフォルトの名無しさん :2007/05/05(土) 08:15:41
>>336 それってほとんどテクスチャ認識だろ?
gabor特徴を抽出するか、
全ピクセルで固有空間でも作れば?
>>347 漫画なんてほとんどが線画だよ??陰影なんて,トーンを含む数段階.
何の意味があるのかわからん.
分からんとすぐ言い訳をする
>>348 じゃあなんで人間は線画見て判別出来てるんだ?
その認識技術があれば筆跡鑑定もできそうだね 他は何に使えるだろ
膨大な外部記憶を持ってパターンマッチだな。 言語系(文字情報)ならもっと処理しやすいだろうけどねえ。
とりあえず鳥山明と漫☆画太郎からだ
>>350 だって,線画に対してウェーブレットや固有ベクトルでの近似を試みても仕方ないでしょう?
ある程度滑らかな輝度変化が存在しないと,特徴抽出なんてできないよね.
線画か,そうでない絵かとかの区別はできるかもしれないけど.
そもそも人間に判別出来ないものは機械にもできない 漫画の見分け方は知らないが恐らく人間はある程度の予備知識を持って鑑定してるのだろう? 単純に絵だけで判断できるとは思えないんだが 誰かにあこがれて漫画家になったような人は画風が似てるもんだし
確かに漫画にあまり興味が無い俺にはほとんど判別できない。 特に少女漫画はどれも同じに見える。
漫画の場合最も特徴的な部分は顔のパーツ構成だろう もっと言えば目のパーツが一番重要だと思われる 何故なら俺自身漫画を見るとき顔のパーツで誰それの絵に似てると思うことが多いから キャプテン翼みたいな高度なディフォルメが行われた絵の場合は判別が楽であろう 特徴的な画風の作者であれば目のパーツをテンプレートとして保存しておいて マッチング取るだけどもそこそこ判別できそうな気がする 背景や風景などから作者の「クセ」によって判別をすることは不可能であると俺は思う
> 輝度変化が存在しないと,特徴抽出なんてできないよね それはない
ニューラルネットワークを使って画像の圧縮をするプログラムをつくりたいんだけど 参考になるサイトはどこかにありますか?
輝度って一番無視すべきパラメータだろ。
知る限りでは最近は漫画を描いてるのは助手
>>360 砂時計型ニューラルネットワーク(Sand-glass type Neural Network, SNN)はどうかな。
画像検索のための砂時計型ニューラルネットワークを用いた情報圧縮の試み
電子情報通信学会1999年総合大会講演論文集(情報・システム2), pp.226, (1999.3)
A Nonlinear Principal Component Analysis of Image Data
IEICE Transactions on Information and Systems 2005 E88-D(10):2242-2248
>>358 そこの1行だけとりだしてレスせんでも…;
輝度変化の無い線画に対して、ガボール特徴や固有値空間が役に立つかと言われれば、結構疑問だけどね。
個人的には,357が言ってるみたいに顔のパーツ使うのが現実的かなとおも。
背景とか風景は複数のアシスタントが書いてることも多いしね。 やっぱ判別するなら本人で書いてて特徴が良く出てる顔でだろう。
367 :
デフォルトの名無しさん :2007/05/07(月) 10:14:12
OpenCVでテンプレートマッチングをやっています。 cvMinMaxLocで結果を取得するとき、マッチした位置が一箇所しか取得できません。 複数の結果を取得するにはどうすればよいでしょうか?
368 :
デフォルトの名無しさん :2007/05/07(月) 11:24:25
>>364 それはおかしい
線が存在すれば輝度変化は存在する
369 :
デフォルトの名無しさん :2007/05/07(月) 14:09:25
これはおかしい
あれはおかしい
どれがおかしい?
みんなクレイジー
CRAY-Z
>>364 不適切な引用で申し訳なかった。
線画に向いた特徴量がいろいろ提案されていると思う(文字認識等)ので
それらが使えるんではないかと思った。
もちろん2値画像の処理だけでは不十分で、例えばトーン貼付箇所の
認識等はテクスチャ特徴など輝度変化を利用することもあるだろう。
実際の人間の顔をマンガ的な顔表現に置き換えてから人物認識
するらしい論文を見つけた。
Generating Discriminating Cartoon Faces Using Interacting Snakes
http://citeseer.ist.psu.edu/572900.html
>>367 matching結果の配列に全ての比較結果が入ってるんだから、自分で探索する。
あるいは、遅くてもいいなら、cvMinMaxLocを呼ぶ度に、最大(小)値を削除して、それを繰り返す。
・・・ぐらいしか思いつかん。
共同作成の漫画作品だと誤認識しまくりだろうな。 画像のノイズ排除処理って厳しいだろう。
作家認識には力不足だけど、同じ作品中でのキャラ認識ならできそう。 先行研究調べようと思ったが"character recognition"じゃ「文字認識」になっちまって分からん。
cartoonとかmangaを足してみては? 作風が似ている作家の相関図とか作れたらおもしろいかもね。 弟子関係とか発見できるかも。
379 :
デフォルトの名無しさん :2007/05/09(水) 20:01:13
380 :
デフォルトの名無しさん :2007/05/09(水) 20:02:38
レポート明日までに投函なので実際使えそうなコードがあったら 教えてください><; 調査と考察書けば自分で書いたコードじゃなくてもOKらしいので。
>>379 色相環の青(0,0,255)より下を黒のグラデーション、赤(255,0,0)より上を
白のグラデーションにするだけだと思うけど。
っていうか、グラデーションになってれば、色なんて何でもいいと思うよ。
実際にそれとは別のグラデーション使ってるサーモグラフィもあるし。
RGBのトーンカーブを↓みたいにすれば(゚з゚)イインデネーノ? 手元の参考書にあったんだけどさ。 ただ、このままだと最小が青、最大が赤になるから。 B  ̄\_ G / ̄\ R _/ ̄ こんな風にすれば最小が黒、最大が白になるかな? でもまあ他の人が書いてる方法の方が良さそうだね B / ̄\_/ G _/ ̄\/ R __/ ̄ ̄
384 :
デフォルトの名無しさん :2007/05/10(木) 12:39:17
面白い!!!!! 技術的にも興味深い
面白いね 上手くやれば一儲けできそう
六角大王みたいなもんか
389 :
デフォルトの名無しさん :2007/05/11(金) 00:44:59
>>384 音楽室のベートーヴェンがこれで動くと恐いな。
>>387 自動でフィッティングするとことかがSF映画っぽい。
ベースになる3Dの人体モデル無料配布してないかな
392 :
デフォルトの名無しさん :2007/05/11(金) 07:30:48
393 :
デフォルトの名無しさん :2007/05/11(金) 10:54:14
えっ?スレ違いか?
違わないね。
2Dロートル現る
板違いだろ
いやお前が気違いだろ
まぁまぁ、誰にだって間違いはあるだろ。
レベル的にはYouTube板だな
お前が来たから平均レベルが下がった
OpenCV の関数にアンシャープマスクってないんですかね?
404 :
デフォルトの名無しさん :2007/05/11(金) 17:36:07
ある
関数名教えてもらえませんか??
つマニュアル
マニュアル見ても分からないのですが…
じゃあ金出して作ってもらうしか。向いてないよ。
409 :
デフォルトの名無しさん :2007/05/14(月) 04:59:35
OpenCVでテンプレートマッチングしてます。 青背景で撮影した顔のテンプレート画像があって、 その背景部分を無視してマッチング計算したいんですが 方法はありますか?
410 :
デフォルトの名無しさん :2007/05/14(月) 07:29:01
m9(^Д^)プギャー
なんのための青背景だwww
顔が青い人がいるかもしれん。
君の画像処理はあの要塞と同じで役立たずだ
マジノ線を馬鹿にする奴はゆるさん
セヴァストポリは知ってるヤシいる?
大航海時代で行ったことある
ベクトル画像を手書き風に微妙にゆがませたいのですが、ナイスなアルゴリズムとかないでしょうか?
ぐぐって美奈代 有名なのがアル
落書き効果ってやつ?
421 :
デフォルトの名無しさん :2007/05/17(木) 20:05:47
netpbmとかでいいじゃん
423 :
デフォルトの名無しさん :2007/05/18(金) 10:04:34
普通のjpegの画像は表示できたので、次はプログレッシブjpegを表示しようと勉強しているのですが、 ずっと悩んで分からないところがあるので質問させてください。 ヘッダーを調べてみて、SOSの(a)の箇所だけを表示してみたところ、モザイク状の画像が表示される ところまではできたのですが、その後の他の箇所と組み合わせて表示するところができません。 インターネットでも調べてみたのですが、どうしても分からないため、質問させていただきました。 ご存じの方がいれば、よろしくお願いします。 -------------- SOI APP0 APP14 DQT SOF0 DRI DHT SOS 0-64 : EOI APP14 DQT SOF2 DHT SOS 0 (a) SOS 1-5 SOS 1-5 SOS 1-5 SOS 6-64 SOS 6-64 SOS 6-64 EOI
425 :
デフォルトの名無しさん :2007/05/19(土) 02:27:05
OpenCVで色空間をLabに変えた画像を、更に横方向と縦方向のそれぞれで Sobelの一次微分のような形で距離『sqrt(ΔL*ΔL+Δa*Δa+Δb+Δb)』を 得たいのですが、自分で書いてみたところとても重くて使えそうにありません でした。書き方が悪くて遅いかもしれないと考えているのですが、 OpenCV内に最適化された関数など用意されてたりしますか?
>>425 単に距離の遠近をチェックしたいだけなら、sqrtするのやめるとか。
427 :
デフォルトの名無しさん :2007/05/19(土) 08:40:38
パターンマッチングで大きさや角度が不特定なオブジェクトをマッチしようとした時に 高速に処理できるアルゴリズムってNNしかないの?
>>427 非常に不思議なんだけど、なんで自分でデバッグしないの?
431 :
デフォルトの名無しさん :2007/05/19(土) 11:54:19
>>431 しかないの?という質問には常に
んなかこたーない
と答えるのが良いだろう。可能性は無限にある
>>431 >高速かどうかは実装に依存するので
>意味のない質問だ
んなこたーない。アルゴリズムの時点で高速がそうでないかの議論はできる
>>433 んなこたーない
計算量が少ないということが高速とは限らない
knuthの本を読んでもっと勉強して
そういう議論ができるかどうか、という話ですよ
もっといえば
>>428 が意味している高速、というのは
アルゴリズムの時点での議論における高速であって、
最終的な実装における高速のことを意味しているわけではないだろう、
ということ。
そしてそのように質問することは、けっして意味のないことではないということ。
パターンマッチングとパターン認識は別のものだと思ってたが違うのか?w
自分でデバッグできないで他人に頼んでる奴他のスレにも居たなぁ。
そいつデバッグの勉強をやる気がなさそうで誰も助けてくれないから
結局プログラム放棄したみたいだけど。
>>427 お前も自分でできないならそれ捨てちゃえよ。
>>427 「ほぼ」「はず」がソースだけではわからんぞ、仕様みせて
>>437 ん?439だが、よく読んでなかった
「別のもの」であってる
すまん
他人の批判しか出来ないのかここの連中は
2chで何を今更
445 :
425 :2007/05/20(日) 03:14:17
427のお陰で流れてしまったので。 OpenCVによって色空間が均等なLabに変えた画像で 『sqrt(ΔL*ΔL+Δa*Δa+Δb+Δb)』による距離を得たいのですが、 こういった処理は一般的に重い物なのでしょうか?
>>445 意味わからん
ローなテクだと2乗のテーブルを用意しておけば掛け算しなくていいじゃん
って想定してるCPUでそんな最適化意味あるのかどうか知らないけどw
さらにsqrtにしても距離を何に使うかしらないけど比較対象の距離を
あらかじめ2乗しおけばルートの計算も省けるわけだから実質最適化すると足し算しかしてないじゃん
何と比べて重いっていうんか知らんけど足し算3回とコンペア1回を重いとは言わんが
そもそもそっちが想定してる前提が俺にはまったくわからん
とりあえずOpenCVって何?って状況の俺が答えてみた
>>445 隣接する画素を参照するだけだし、もっとも軽い部類の画像処理なんじゃない?
これで重かったらなんもできん。
448 :
デフォルトの名無しさん :2007/05/20(日) 12:23:01
旅行に行った温泉の写真をアーカイブしているんですが、 ときに湯煙でもやがかかったような写真しかとれない時があるんです。 デジカメでとった画像を加工することで対処したいんですが、 いい方法はないでしょうか?
画像処理のサンプルとして利用される画像サイズはせいぜい200x200くらいのもの しかし、実際現場で要求される画像サイズは1000x1000を超えるのが普通 そこにギャップが生まれる 学生とかレベルの人は小さいサイズで十分な速度が出るから早いとか言う 仕事や趣味で高画質の処理をしようとしている人にはそれでは不十分 恐らくここでいう早いというのはPhotoshopのフィルタ処理くらいの早さを要求してると思われる
>>448 フォトレタッチアプリでのやり方を聞いてる気がするので
その方向で答える
全体に白モヤってるならコントラストかカラーバランスを変えて引き締めればOK
バッチ処理でやると妙な色合いになることがあるので手で微調整
光の反射を予測して光源による輝度変化を補正して物体そのものの色を再現する方法ってありますか?
>>448 つ[画像編集ソフト、フォトレタッチソフト]
写真一部を部分拡大したのですけど、 もちろん画像が大荒れなんですけど自動で荒れを補正してくれる フリーソフトとかないでしょうか? 今、アクセサリーのペイントでやってるんですけど・・・。 アドバイスお願いします。
>>453 例えば緑のボールを炎天下で撮影した場合に
明るい緑と黒い緑に分かれるじゃない
これを純粋に緑にしたいわけです
>>453 たぶん、
>>451 が知りたいのは、ツヤ有りな物体の撮影画像から、
スペキュラー(鏡面反射、写り込み)を取り除いて、ディフューズ(拡散反射)だけを抽出したいってことじゃないかな。
写り込みが変化していくような動画がソースなら、それを検出して打ち消すことは不可能ではなさそうだが、
静止画一枚だとどうしようもないだろうなぁ
光源だけならそれでもいけるだろうけど、空とか背景が写りこむレベルだと、どうしようもないな。
>>454 荒れってなに手ぶれのこと?
拡大でモザイクになってるということ?
>>454 バイキュービック法が使えるフリーの画像処理ソフトを探してくる
>>453 ,456
池内センセがそういうことをやってたような
手を出す前にどこまでもっていければ御の字なのか決めておいたほうがいい希ガス だって完全にホワイトアウトしてる部分は静止画じゃどうしようもないわけだし 処理する以上そういうところが1つでも残ったらまずいというなら鼻からやる意味ないし
>>454 ローテクだが、ちょっとずつ拡大するとか
463 :
454 :2007/05/20(日) 14:10:47
464 :
454 :2007/05/20(日) 14:15:26
よく、刑事ドラマとかで防犯カメラで犯人の顔だけ拡大して 補正してモザイクをくっきり見えるようにしてるみたいなのが いいのですけど。フリーソフトであったらお願いです。 宜しくお願いいたします。
目を細めるといいと思うよ
マジレスしていいのかな? やっぱダメかな?
>>454 そもそも板違い。
ここが何の板なのか、このスレが何のスレなのか確認するように。
静止しているものはともかく、動いているものの超解像はどうするんだろ
先日ちょっと事故ってしまい一応病院でレントゲンをとる事になった。 技師は眼鏡白衣の若い青年。それだけで心の中は萌えの嵐。 そして正面を撮る時、立ったままかなりの至近距離で向かい合い、 顎に手を添えられもの凄い笑顔で「もう少し顎をあげて下さいね」って… 萌え死ぬるとこだった…相手は仕事でしてるだけなのにorz キスする過程ってこんな感じなのかしら…
ハイレゾ処理は画像修復関係でいろいろアルゴリズムが考案されてるけど 実装したソフトってのはなかなか少ない 論文の横にサンプルちょこっとある程度なら探せばある
473 :
デフォルトの名無しさん :2007/05/20(日) 17:29:58
動画が対象だと前後フレームからノイズパターンを拾って画像を修復するというのが可能だけど 静止画はそれが出来ないから物体の形状を認識して修復するという方法が取られる 防犯カメラは動画ね
>>473 拡大してモザイクになってるくらいだから
拡大率は5倍とか10倍とかでしょ
バイキュービックじゃ対応できないような気が……
つか刑事ドラマのってさ…
刑事ドラマのはもともと高解像度で撮影してるだろうね。 そこから画質を落としたものを原画に見せかけてるだけで。
いや動画なら実際、映画に出てくるような高解像度化が出来る 天体観測なんかではよく使われる技術です
うん。 ただ、ドラマ制作で実際に使うことは無いだろうってだけ。 そういう技術は知ってる。
名探偵コナンの中では撮影当日の気温とか湿度とかも加味して高解像度化してたけど、 あれはただのSFであって意味無いのかなぁ。
>>482 気温や湿度が画像にどの程度影響するかを考えよう
地上からの天体撮影の際は 大気による影響を測定して画像回復を行なうこともあるらしい 温度を加味しているといえなくもない
超解像というと、まずブレードランナーを思い浮かべる
最近はGoogleEarthの中身は 地球儀画像を拡大して解像度補完しているって 考えている人もいるくらいだから
487 :
ひみつの検疫さん :2025/03/23(日) 19:06:38 ID:MarkedRes
汚染を除去しました。
488 :
ひみつの検疫さん :2025/03/23(日) 19:06:38 ID:MarkedRes
汚染を除去しました。
ああ、何?ウイルスバスターでアラートでも出させたいの?
490 :
454 :2007/05/22(火) 13:13:16
本当にフリーソフトで探してます。 元々の画像が少し小さいので拡大すると モザイクになります。 キメの細かいモザイクみたいな状態です。 皆さんのお力をお願いします。
>>490 探してるのは分かったけど板違いだってば
>>490 ここはプログラムを作る人のための板で、
プログラムを探す人の板ではない。
お前親切だな
>>490 CG 板辺りで訊いた方がいいんじゃないか。
そういえば、しーやんあたりがこのスレを見ているはずだから、 藤を自薦してもらえばどうよw
497 :
デフォルトの名無しさん :2007/05/22(火) 18:24:19
フォトショでバイリニア補間しつつ拡大すればいいじゃんw
画像に含まれた文字を抜き出すアルゴリズムを探しています。 文字自体は、決まったフォント、決まったサイズ、決まった色になっています。 条件が決まっているので、最近のOCR技術のような複雑なものではなくて もっと簡易なもので実装したいと思っています。 よろしくお願いしますー!
何をよろしくするというのか
まぁ、この殺伐とした世の中に これくらいの可愛さがあっていいじゃない
だが容赦ないのが2ch
503 :
デフォルトの名無しさん :2007/05/22(火) 20:15:20
画像-背景=文字
素人同士で大激論するスレだから仕方ない。
それが非常に有難かったりするわけで…
506 :
デフォルトの名無しさん :2007/05/22(火) 21:34:27
どうみても専門学校生の課題レベルだけどw
いやまあ、この問題はそうだけど、このスレの存在意義みたいな物がね… 何つーか、色々助かってる。
これくらい教えてやれよ 1 ラベリング 2 各領域について幅、高さ、色の特徴を計算する 3 幅、高さ、色のしきい値を決めて条件に合う領域を抜き出す 精度が不足するときは、いくらでも補完する方法があるけど簡易じゃなくなるので省略
テンプレートマッチングでググれば何か出てくるんじゃないか?
で テンプレートマッチングで大きさや角度の違うオブジェクトを映像とリアルタイム処理できるくらいの 速度でやるには、どのアルゴリズムがいいのでしょうか? ちなみに画像サイズは1200x780くらいでおね
入力業務って名目でおばさんをたくさん雇えばいいと思うよ
一致しそうな領域をいくつか抜き出して 最後は人力で調べるのが一番だお、 ってなんかのプログラミングコンテストの番組でやってた。 反則だろ。
サンプルコードとかない?
ていうか見るからに遅そうなんだがw
>>514 おいらが最近 Term Project として書いたのならあるけど、ここにはリンク貼らない。
>>515 いちおう realtime processing と銘打っている。
Lowe 先生の配布実行ファイルだと、512x512 で、うーん、一秒か一秒しないかぐらいかな。
追記:俺の環境でね。測りたかったらぐぐっておとして試そう
SIFTだったら ケンブリッジの学生が書いたコードや パノラマ写真作成のフリーソフトのソースもあったかな 漏れ自身は別の使っているけど。 仕事だったらLowe先生の特許許諾をお忘れなく
コードあったよ まあスピードは目を潰れる範囲かなと思う 特許がねー 仕事じゃないけど配布ソフトに入れる可能性もあるからこれネックですわ Publicライセンスで何かないですか?
520 :
デフォルトの名無しさん :2007/05/23(水) 07:20:50
log-polarとかは?
>>519 もしかして、「目をつぶれる」って読んでる人ですか?
「目をつぶる」 問題なし
いやマジで、「目をつむる」とは言わんわけ?
いわん
どっちでもいいだろ。 「つぶる」のほうが標準的だけど。
ん?「つむる」のほうが一般的では。
とりあえず、オマイラ板違い
途中の ぶ は む に化けやすいんだよ。 つぶる ⇒ つむる かわかぶり ⇒ かわかむり そのギャグさぶい ⇒ さむいわ
そのくらい小学生でも知ってるだろ。
>>528 いや、最後のだけは逆だろ。つーか、「さぶい」は方言だし。
……ってことでふと思ったんだが、「ぶ」と「む」の使い方に東西格差があるのかな?
b⇔m さびしい⇔さみしい
「つぶる」も「つむる」も標準語。
「さむい」は現代標準語。 「さぶい」は文語もしくは方言。 基本的にこれらの語はbの方が古くからあってmに変化した。
log-polarってマッチングする対象領域を検査するたびにテンプレートと同じサイズの変換しないといけないの? 遅くない?
536 :
デフォルトの名無しさん :2007/05/23(水) 14:22:22
上に出てきたSIFTって もしかして方向ヒストグラムと同じ?
いんや。それだけで scale invariant になる要素がないべ? orientation assignment はするよ。
一応KLTはパブリックドメインだけど... 時代はSIFTか
KLTで検索したら韓国語レベルテストしか出てこん
KL展開?
Kanade-Lucas-Tomasi だろ
SIFT のイメージマッチングのコードを簡単に point tracker に拡張してみたんだけど、 どうもうまくいかない。 KLT だとフレーム毎に1点ぐらいずつトラック失敗するんだけど、 その SIFT のやつだと、100 点ぐらいずつ減っちゃって 10 フレームも繰り返すともう点がなくなっち。 KLT がうまくいかない画像も無論あるんだけど。
543 :
デフォルトの名無しさん :2007/05/24(木) 07:02:53
フレームごとに特徴点を抽出し続ければいいじゃん
で、トラックしていった結果そうなったってことでしょ?
545 :
デフォルトの名無しさん :2007/05/24(木) 09:32:29
つまりSIFTツカエネってこと?
やっぱり Scale Invariant が押しだから 連続画像だと物体の大きさ基本的に同じだし 恩恵がないんじゃね?
547 :
デフォルトの名無しさん :2007/05/24(木) 12:24:45
カメラをひいたり近づけたりするからscale invariantも大事だと思うけど 単純な背景でしか使えないんじゃないの?
単純なのでしか使えないのが KLT robust なのが SIFT
KLTって処理画像は何か処理しといたほうがいいの?
パノラマパノラマ
画像処理のド素人が入門書として読むにはどの本がいいでしょうか? 私のスペックはいかのようなかんじです。 ・数学の知識は中学高校レベル ・プログラムはそれなりに ・ベクタ画像とラスタ画像の違いはなんとなくわかる ・アフィン変換とかウェーブレットとかは全然しらない
おっと、ただ、企業でできるってのは できる=知識がある ではなく できる=プロジェクトの経験がある なので注意すること 大抵これに弾かれる
>>555 ただの作業員じゃないならなおさらダメだろう
少なくとも、俺ならやったこと無い奴を設計メンバーになんて絶対いれないw
>>553 プロジェクトの経験があるってのは「やったことがある」だろう。
「できる」ってのは、現状からプロジェクトを走らせられるくらいだろう。
できるかどうかはやらせてみないと解らない 解らないならやったことがある人間の方が安心できる
OpenCVでUSBカメラから画像を取得するとき、 画像のサイズって指定できないの? ドキュメントひととおり見たけど、サイズとかの パラメータを設定できる関数とか構造体が見当たら ないんだが・・・
うぜぇから誰かOpenCVスレ建てろよ
561 :
デフォルトの名無しさん :2007/05/29(火) 19:44:35
できねえ
>>561 できないっすか。
ありがとうございます。
他の方法考えます。
>>562 ちょっと面倒だけど cvcam 使えばできるよ。
素朴な質問ながら、考えていたら段々分からなくなったのでおすがりします。 肌色調整を売り物にするものがありますが、「きれいな肌色」って RGB要素で きまった領域とか値のバランスとかあるんでしょうか。単に売っている側が きれいだろと言っているだけなのでしょうか。
xyY表色系とかでだいたいここら辺、ってのはあるんじゃね。 黒人や白人はどうなるのかは分からん。
566 :
デフォルトの名無しさん :2007/05/31(木) 06:41:15
昔は肌色って色のクレヨンとかクーピーがあったよな
イスラエルのある大学がやってるグレースケール→カラーの変換をする研究を やってるらしいですが、この研究の論文ってなんていうタイトルなのか知ってる方いますか?
569 :
デフォルトの名無しさん :2007/05/31(木) 10:18:53
未踏プロジェクトでもなんか似たようなのがあった あれは確か色を指定しなくてもヨカタ
色を指定せずに勝手に塗ってくれるの・・・?
最初のりんごを塗ると、他のりんごも塗るってのはあるけど どうやって色を判断するの?
572 :
デフォルトの名無しさん :2007/05/31(木) 12:07:37
573 :
デフォルトの名無しさん :2007/05/31(木) 12:12:46
うきうきりんごだぷ〜
未踏じゃなくても未踏プロジェクトなの?
(立案時点で)未踏プロジェクト
>>573 これはさっきの論文と同じものっぽくない?
578 :
デフォルトの名無しさん :2007/05/31(木) 14:52:27
かもしれないしそれでないかもしれん それくらいは自分で判断して欲しい
580 :
564 :2007/05/31(木) 16:21:47
>>565 レス感謝。
RGB<->xyY 変換の方法が見つかったので、(これまでの色変換に追加して)
ちょっと遊んで見ます。
肌が綺麗に見えるといえば、当然染み(くすみ)が無いことですがな。 ってことで、その辺の色ならスポットノイズを除去するフィルターとかw
>>564 ISO/FDIS9241-30xシリーズで参考値が記載されていたはず。
>>583 教えて頂き有難うございます。
ぐぐったら、チーズケーキの切れ端の形のグラフが出てきますね。
やっぱ、アレを理解しないといけないんでしょうね。
聞いてみてよかった。
>>583 ありがとう。参考になった。
このスレ見ててよかった。
ITKってlinuxだと/usr/localの下にデフォルトではいるんだよね? マニュアルとおりにccmakeしても入らない
587 :
464 :2007/06/01(金) 20:30:09
高いソフトは買う事できないんですけど どうしてもモザイクを綺麗にしたいのです。 皆さん、お願いいたします。
目を細めるといいと思うよ
589 :
デフォルトの名無しさん :2007/06/01(金) 22:25:12
590 :
デフォルトの名無しさん :2007/06/02(土) 02:29:35
モザイク除去機(18禁
或るアルゴリズムで元に戻せるモザイクの作り方で作ったもんなら戻せるけどね 完全に欠損してるのはほぼ無理っしょw
もうURL忘れたけど 以前にこのスレで結構すごいのリンクされてたな どんなアルゴリズムなんか気になったけど追求しなかった
動画からの超解像は、別にすごくはないだろ 静止画からの超解像で何かすごいのは無いのか?
595 :
デフォルトの名無しさん :2007/06/02(土) 10:34:18
CSIみたいだ
>>594 動画からの超解像を自分の発想だけですらっと作れちゃうなら
あんたがすごいんだよ。
誰かがやった手法を調べて真似するのなら半分くらいすごい。
情報的に可能であろうことは容易に想像がつくけど、
実装を実現させるのはやはりすごいことだ。
対して静止画の超解像は…できるのか?というのが正直なところ。
画像の元の形に対する膨大な知識があれば可能だろうけど、
2次元配列の情報のみでは、補完する以上の手法はちょっと
見当つかん。
597 :
デフォルトの名無しさん :2007/06/02(土) 11:59:32
おじゃまいたします。
現在、次のような『祭り』をやってます。
===============================================================
■日本VSハンガリー クリック戦争【GAME4】勃発!!■
ハンガリー国民総出の大逆襲、 捲土重来の猛攻撃!
現在、1位のハンガリーに3億クリックの大差で苦戦中!
奇跡の逆転優勝のために 集え2chクリッカー!!!
☆☆ 一番クリックした国が優勝 ☆☆
【戦場】
http://www.clickclickclick.com/default.asp ・戦場へ行き、CLICKボタンをひたすらクリック!
・手動に疲れたら本スレで自動ツールDLを!!
【本スレ】
http://wwwww.2ch.net/news4vip/ 「クリック」で検索。
【まとめサイト】
http://www33.atwiki.jp/clickvip/ =====================================================================
で、お尋ねしたいのですが、
ここで使われている画像認証を自動で突破できるでしょうか?
と、言うのもクリックとかは自動で出来るまでにはなったのですが、
9分に一度の画像認証がネックになり、完全自動化までは出来ていません。
ツール作成部門があるので、アイデア・アドバイスがあれば、よろしくお願いします。
>>597 この画像ってみんな同じものが見えてるんだったら、誰か人が判断して
その情報を共有したほうがてっとりばやいと思う。
Captchaか。 普通これはアクセスする度に自動生成されるよね。 前処理として糸くず除去とか背景色の均質化でもすれば精度はあがるのかな。 OCRはよくわからんけど。
603 :
デフォルトの名無しさん :2007/06/02(土) 13:38:29
流石にプログラム板住人でも無理か・・・。 自動認証できたら意味ナイもんね
>>603 基本的にプログラマって怠けモノだから
興が乗らんと動かんよ。
インチキCaptchaモドキだったら画像処理するまでもなく簡単に突破できる奴もあるよね
606 :
デフォルトの名無しさん :2007/06/02(土) 14:03:54
あの画像て自動生成なんかね。 パターンは無限にあるってこと? 有限ならデータベース化できればいいけど
有限のはモドキ。 ちゃんとしたのは無限。
Captchaといえば、画像をサーバーにアップロードしてネット上の誰かに答えさせるってのがあったな 答えれば肌色の多い画像が見れることにしておくとかなんとかw
>>608 CAPTCHA破りという研究分野があることに驚いた。
611 :
デフォルトの名無しさん :2007/06/02(土) 14:46:49
^cさんのサイトで見たな、と思ったら 上にでてるじゃん
OCR で読み取れなかった文字を CAPTCHA 用に使ったりする。 他のソフトでは読み取れたりするかもしれないけど、一応ソフトで読み取れないことを無論期待している。
>>608 なるほど。つまり歪み文字を作る場合は歪み度よりも分割難易度をあげたほうがいいわけか。
人に優しく、機械に厳しくできるなんてちょうどいいな。
>>603 (1)画像から文字情報を取り出して二値化する
↓
(2)文字ごとに切り出す
↓
(3)テンプレートマッチかニューラルネットワークかなんかで各文字を解析
↓
(゚д゚)ウマー
ってやれば多分出来る。
サンプルを見ると(2)はまったく問題ない。(3)も多分出来る。
ただ、(1)の文字以外の情報を除去する方法がわからん。
616 :
デフォルトの名無しさん :2007/06/02(土) 16:30:51
スパマー作成の手助けはしない
僕も解析エンジン作ってみようかな。 なんか面白そう。
>>614 文字の大きさがある程度決まっていて画像の端に掛かってないうえに太い、
ノイズは細線の直線ばかりだから収縮で結構簡単に除去できるんじゃない?
作る気は無いが。
620 :
464 :2007/06/02(土) 18:13:47
ベストなのが見つかって良かったやん。
>>620 何度も書き込んでるけど、少しずつ拡大するんじゃダメなの?
>>614 人間は (3) と (1) を同時に行っている
っていうか (3) の情報がないと (1) はできないだろうな
さらに日本語用とアルファベット用で文字要素ライブラリを切り替えないといけない
アラビア語やヘブライ語で出されたら太刀打ちできない
つーかさぁ、これ、文字数少ないんだからブルートフォースで やってもあっというまじゃないか?
普通、失敗したら別の文字にならないか?
いま繋がらなくなってるw
>>597 日頃、ニダーがF5攻撃してるだとか馬鹿にしといて
こーゆーモノで盛り上がれる神経がわからん。
ツールを使っといて正々堂々とかもわけわからん。
>>628 きっと終了直前にタイトルはどの国の国民が一番馬鹿か選手権に代わってるに違いない
>>629 日本がダントツで馬鹿なのは,最初から参加者は分かっていることだが?
>>628 ゲーム運営者がツール使用を許可してるわけだから
そこを問題にする神経がおかしい。
>>631 どこにそんなん書いてあるんだよ。
俺、英語できないけど、"Service Unavailable" が
そんな意味の言葉じゃないってことぐらいわかるぞ。
はあ?
(*´д`)ハァン
点がいくつか与えられた場合に それを滑らかにつなぐ曲線を得る関数、何て言いましたっけ・・・?
>>635 いっぱいあるが、代表的なものはスプライン
何ッスカそれwww
ベジェはどうっすか
どうってwww こっちがききたいですよ?
この自演のやりとりの意味がわからない
知ってどうする? 某国の暗号かもしれないぜwww
642 :
638 :2007/06/04(月) 21:47:28
>>635 総称すると自由曲線。
エルミート(Hermite)、ベジェ、Bスプライン、NURBSあたりがよく使われる。
ドヴァコックスの式あたりから全部理解してる奴は俺ぐらいだろうw
曲線の神様と呼ばれているのはあなたでしたか
647 :
635 :2007/06/06(水) 20:07:05
有難うございました
与えられた点をつなぐというとふつうは曲線補完だろう。 ラグランジュ補完とかスプライン補完とか。 >644に挙がってる「曲線」はどれもふつうは与えられた点をすべては通らない。 すべて通らなくてはいけないなら、通るような曲線を引くための制御点を別に求める必要がある。
>>648 そんなことしなくても通らなければならない点の付近を
1次の曲線(直線?)にしてやれば確実に通るもんは作れる
その場合、曲線と直線と折れ線が混ざった変な感じにはなるが・・・
馬鹿正直に補間関数をそのまま適用すると全く使えない
制御点通るかどうかわからない曲線ってやっぱ使えないと思う
見た目2次曲線と直線組み合わせて曲線(?)作ったってそれなりに見える
ところで全然関係ないけど、
見た目一本の線なんだけど曲線と直線と折れ線が混在してる線の
新しい名称が必要だと思った。以上。
650 :
デフォルトの名無しさん :2007/06/08(金) 09:58:29
「線」でいいんじゃね?
だなwwww
>>648 与えられた点を全て通る場合でもラグランジュやスプラインより
ベジェやエルミートの方が良い結果になると思う。
特に画像処理においてはね。
ベジェって何だよwwwwwwwベジエだろwwwwwwwwwwwwwwwwwwwwwww
じゃあBezier
Bezier の検索結果 約 1,720,000 件 Bezier に一致する日本語のページ 約 113,000 件 ベジェ の検索結果 約 154,000 件 ベジエ の検索結果 約 33,000 件 はいはいワロスワロス
656 :
638 :2007/06/08(金) 14:02:50
FourierはフーリエなのになんでBezierがベジェなんだよwwwwwwwwっうぇwっうぇww
フーリェ変換
そういえば、アメリカ帰りの奴とかが 日本語でAntiVirusのことを、アンチバイラスとか発音するとむかつかね?
>>659 漏れは日本語では「対ウイルス」と言うなぁ。英語の発音で言うときはそもそも「アンチ」とは発音しないし。
そもそも英語のantiはアンチとは発音しねーだろ
アンティ
>>664 そんなこと言ったら、カタカナ表記してる時点で正解など無いんだがw
外来語は英語と米語でも発音は変わるし、ドイツ語から発音を持ってくる
場合も多いから、同じ単語でも分野によって読み方が変わったりもするね。
結局は、伝わりさえすれば何でもいいと思う。
正しいカタカナ表記について議論すること自体、無益なことだろう。
そもそも、肉食ってる奴らがそんな細かいことを気にするはずがない。
ガメラvsバイラス
リヌクス vs リナクス vs リナックス
669 :
デフォルトの名無しさん :2007/06/08(金) 18:32:43
ディーブイディーじゃなくて、 ディーヴィーディーだからな
そんなにひっぱる話題じゃないよ
ディーヴィーディーでもなくてDVDだよ
>>666 いや問題はそこじゃないんだ。
VirusをヴァイラスってるのにAntiがアンチのままってのが。
>>659 の耳ではVirusはヴァイラスと聞こえたが
Antiはアンチとしか聞こえなかったんだろ
画像処理と何の関係が?
ウンティバイラス
あんちばいらす (あの千葉がいらっしゃいます)
括弧書きをしないと伝わらないネタってなんだかなあ・・・
次のネタどうぞ
679 :
デフォルトの名無しさん :2007/06/09(土) 22:34:19
グラフカットの計算方法を教えてください。
681 :
デフォルトの名無しさん :2007/06/09(土) 23:40:25
エッジに重みがつけられたグラフを管の太さが違うパイプラインに見立てて、 ソースからシンクに向かって液体を流します。 パイプに流れる流量の少ないところを一筆書きで辿ります。 こんなかんじでしたっけ? その一筆書きの辿り方が分かりません。
アルゴリズム関係の本には大雑把なことしか書いてなくて、 肝心の部分がかかれてないので分からないのです。
微妙にスレ違いな気がしないでもない。まぁどうでもいいや。
GPUで実装したいのですが
がんばれー
グラフカットのバリエーションはいろいろあるだろうが、すでに知られている式を使うなら、 いわゆるσ(近傍連結係数とでもいう?)を画像によって試行錯誤で決めたら、 後は、seedを適当に決めて式にあてはめるだけじゃねーの? それとも実務じゃなくて研究関係?・・・にも見えないけど。
グラフカットは応用範囲が広いから
>>679 が具体的に何をやりたいのかわからんことには助言しにくい
大学で画像処理系の研究室にいるんですが 今からひとつ画像処理ライブラリを導入するとしたらお勧めはどれですか? 割とメジャーでプログラムにあまり詳しくない人間でも扱える物をお願いします。
そんなものは無い
ないよなぁ。
691 :
デフォルトの名無しさん :2007/06/10(日) 08:45:27
opencvとかadobeのやつとか
>>691 いや、プログラミングできない人には無理だろう
693 :
デフォルトの名無しさん :2007/06/10(日) 09:40:13
netpbmとか?
いまから画像処理しても飯は食えないぞ
ダウンしまくってHDDに溜まった画像を 糞画像と永久保存画像に分類したいのですが うまく処理する方法を教えてください
ロリと非ロリを分けるのか それはむずかしい・・・
永久保存が不可能だろ
将来おまえの趣向が変わるかも知れないじゃないか
700 :
デフォルトの名無しさん :2007/06/10(日) 15:09:52
上のほうに出てきたような 2次元顔画像から3次元モデルを推定して 任意の方向やライティングで顔画像を推定できるとか、 低解像度のビデオから高解像度の画像を生成するとか そういうレベルじゃないとダメなんじゃない?
この問題がわからないんですけど、教えてください。 ヒステリシス平滑化のプログラムを作成すること
いやです m9(^Д^)プギャー
画像処理の人ってscriptはpython or Rubyどっちで書く? pythonの画像処理ライブラリが便利なので私はpython
画像処理に限らずRubyなんて使う奴いるのか?
恐らく日本人が作ったという理由だけでRubyを使ってる人達がいる
まさに宗教的な
Ruby on Rails 便利だぞ。
ぶっちゃけそれくらいしか利点が見当たらない
Ruby on Rails 専用スレってありますか?WebProg板ですか?
そうみたい
RubyistはPHPerとともに地獄の炎に投げ込まれ、 神はPerlerのみをお救いになる。
713 :
デフォルトの名無しさん :2007/06/11(月) 08:43:34
5点
すごいスレ違いっぷりだな
もってけセー
ステレオマッチングで複数の画像から3次元座標を求めたいのですが これについて学べる適当な書籍等をご存じないでしょうか?
>>719 この本は既に持っているのですが
調べていただきありがとうございました。
やはりこの手の本はそんなにないようで…
721 :
デフォルトの名無しさん :2007/06/11(月) 16:07:06
金谷センセの本は?
嘘でも持っていなかったと言え
授業で教科書として使ったやつだけど、 Robot Vision, Horn とか。結構古い。 後はなんかぐぐる気しない。
>>720 それなら普通は、これこれこういう本は持っているのだが、これ以外にないかと聞け。
質問して答えたら、それはすでに知ってたけど・・・という答えを見るたびに
それが人にものを尋ねる態度か、と思う。
情報の後出しは最悪だな
自分が答える側に回ることがないんだろうな
自分の知らないことを知ってるやつに出会って悔しがる人たち
?
なんでベンジャミン
2コマ目のモザイクを外して欲しいのでは
732 :
718 :2007/06/12(火) 01:22:10
自分の事しか考えず質問・応答がきちんとできていなかった事で 気分を害してしまい申し訳ありませんでした。 他に所持している書籍は以下の2つになります。 c言語による画像処理入門(安居院 猛 (長尾 智晴 共著 3次元ビジョン (徐 剛 (辻 三郎 著 レス頂いたものを参考に調べさせて頂きます。 本当に申し訳ありませんでした
733 :
デフォルトの名無しさん :2007/06/12(火) 10:02:50
openCVそのまんま使うんじゃダメなの? 自前でやるなら元画像のテクテーション大変だよ
ググる言葉かえたら見つかったわ。 その通りの模様。さんくすこ!
Haar-likeとはAdaBoost?ってのが
パターン学習させるのに相性いいらしいんだけど、
知ってる人いるかや?
てか学習とかどのスレ/板にいきゃいいか分からんちん。。。
http://media.cs.tsinghua.edu.cn/~ahz/papers (pdf)/%5B2007%5D%5Bpami%5DHigh%20Performance%20Rotation%20Invariant%20Multi-View%20Face%20Detection%20i0671.pdf
とか出来が神なのは分かるけど意味ワカラナス
それが人に尋ねる態度かね
739 :
デフォルトの名無しさん :2007/06/13(水) 23:17:46
このスレのおまえら、修士博士課程程度だろうけど、 糞馬鹿しかいないな。
>>737 それはつまりOpenCVのやつでしょ?
まず Reference の論文から読んだら?
ちなみにいっとくと、自前でやると 学習にすごい時間かかるわりにサンプルほど精度よくならない、 というよりかなりひどい可能性が大。
背景データ、オブジェクトデータともに5000件以上なんて、やってらんない
743 :
デフォルトの名無しさん :2007/06/14(木) 09:33:26
そういう画像データベースってどこかで公開されていないかしらん?
そりゃものによるけどあるさ。ぐぐれよカス
745 :
デフォルトの名無しさん :2007/06/14(木) 10:38:21
Lena姉くらいしかヒットしないわボケ
実際認識て難しいな
論文てのを見たけど、
素人には英語より数式の方がキツイかもwwwww
>>741 なんで?実際に公開されてるやつだって学習させたんじゃねえの。
>>746 顔とか、意外とそうでもないらしい。
特に肌色検出→目検出のコンボとか割と楽で認識率も悪くないとか。
>>742 セカンドマシンにでもやらせてほっといたらいいんじゃね。
>>747 >特に肌色検出→目検出のコンボとか割と楽で認識率も悪くないとか。
それは illumination variant になりそうだな。
色んな要素に対して invariant にしたいのだよわれわれは。
専門学校の課題は他でやってくれ
751 :
デフォルトの名無しさん :2007/06/15(金) 19:00:31
入力画像から、QRコードみたいな情報マーカーを取得して、 その情報を読みとるライブラリとかありませんか?
>>751 情報マーカーの種類や詳細がわからなければ、「みたいな」では誰も答えられないと思うよ。
753 :
デフォルトの名無しさん :2007/06/15(金) 19:36:27
すみません。このスレに該当するか分かりませんが、このスレだと回答もらえそうなので、 お聞きしたいと思います。 C言語で(まあ、なんでも言語はいいのですが、Cを仮定として)、WindowsAPIなどを使わずに 自作でWindowsにウィンドウを表示するプログラムを作ってみたいとおもうんですが、 そういうのって、無理ですか? どういった辺りから手をつけてみればいいのかわからないんですが・・ よければ、教えてください。Unixとかだとできそうですが、Windowsじゃ無理ですかね??
(´-`).。oO(なんでこのスレに来たんだろう・・・)
画像から顔だけ(範囲は矩形でいいので)切り出せる ツールやソースってない? 画像を送るとオンライン上で認識するってやつはあったんだけど・・・
>>753 「ウィンドウシステムを自作したい」ということですか?
>>757 おまいは実にばかだな。それを顔検出というのだよ。
画像処理って目視確認しながらじゃないと実際の結果がわからないので 目視環境を作るだけで一苦労という拷問
でも目視ができるからおもしろいんじゃん?
OpenCVって、なんであえてIplimage?bmpじゃだめなん?
Bitmap 構造体のほうがなにかいいの?
>>764 OpenCVだとalphaChannelとか使わないわけだし・・・
Iplimage使う利点ってなに?
>>765 で、Bitmap 構造体のほうがなにかいいの?
どっちもどっちならどっちでもいいんじゃないの?
IPL時代の遺産を引き継げるからだろ…
>>762 てか、目視できるだけ楽だよな
出た数値がビジュアル的に意味がわかるもんになってくれるのは助かる
これが机上で期待値作らないとあってんだかなんだかわかんねー値になるもんだと
検証だけでも楽に1週間は過ぎていく
見える画像の処理をしている連中はいいね。 こちとら同じ画像処理でも見えないものが相手だから視覚化するだけでも手間が掛かるから困る。
そういう何が自慢したいのかよくわからない言い方されても
>>769 画像処理で見えないもんってあるの?
とりあえず出力してみればだいたいわかるじゃん
769ではないが、steganographyとか見えたら困るべ 暇なんで"colorization using optimization"インプリメントしてみた マルチグリッド遅すぎなんで別の最適化にしたけどしばらく遊べそう
単にSARとかX-rayの画像扱ってるぜ、オレスゲーな人じゃネ?
質問です。 現在画像の減色処理のコードを書いているのですが、メディアンカットについて 使われている色の回数を求めた後、似た色をまとめて一つの箱にするということらしいのですが、 使われている色の回数はわかるのですが、1つの箱にするというのがわかりません。 今は仕方なく、(元の色×出てきた回数 + 似た色×出てきた回数)÷2つの合計数で 求めているのですがとても遅いです。 何かキーワードだけでもいいので教えていただけるとうれしいのですが…
>>774 最初は、すべての色の種類とその回数を一つの箱の中に入っていると見た上で、
それを2分割するわけよ。
で、どうやって分割するかというと、一般的には、RGBの各値の最大値と最小値の差が
最も大きいのを、メディアンすなわち中間値で分割するわけ。
だから、メディアンカットというわけね。
776 :
775 :2007/06/16(土) 20:20:13
で、後はその分割された箱について、また中間値で分割していく繰り返しするってことよ。
777 :
775 :2007/06/16(土) 20:21:12
で、どうやって分割するかというと、一般的には、RGBの各値の最大値と最小値の差が ↓ で、どうやって分割するかというと、一般的には、RGBの各軸の最大値と最小値の差が の方が正しいかな
778 :
774 :2007/06/16(土) 20:54:17
>>775 ということは、それぞれの最大値が、
Rが0〜250、Gが0〜100、Bが0〜200だとすると、
まずRを125で分割、次にBを100で分割、またRを75で分割、GまたはBを50で分割
というようなことをしていき、箱の数が指定した数になったら分割をやめる
という感じでしょうか?
>>778 君の場合はまず統計学における「メディアン」の意味を調べるところから始めたほうが良さそうです。
>>772 マルチグリッドの実装方法を簡単に説明してください
782 :
775 :2007/06/16(土) 21:24:01
783 :
774 :2007/06/16(土) 21:31:44
中間値の定理の中間値じゃないのか orz もっかい数学からやり直すことになりそう… でも、キーワードはわかったと思うので、統計学やってきます。 ありがとうございました。
784 :
775 :2007/06/16(土) 21:32:29
785 :
775 :2007/06/16(土) 21:36:44
訂正 分割が中間値でやってるかどうかは、この画像だけではわからんけど。 ↓ 分割を中間値じゃなくて、最大値と最小値の平均でやっているみたいだけど。
>>775 氏
メディアンは普通「中間値」じゃなくて「中央値」と訳さないか?
787 :
775 :2007/06/16(土) 21:41:04
>>786 俺も実は不安だったので一応Wikipediaを見たら、
中間値は中央値のエイリアスみたいな書き方がしてあるんだよね。
でもなんか俺も違う気がしないでもない。
>>783 が混同したという中間値の定理の中間値はintermediate valueだから、
それと区別する意味でもmedianは中央値と呼んだほうがいいと思う。
789 :
775 :2007/06/16(土) 21:45:43
中央値よりも重心の方がよくね? ノイズフィルタみたいに極端な値があるわけでもないし
重心じゃイミフメ 他からの類推でしか意味が通じない名称は不適当だと思うよ
極端な値がでないからこそメディアンをとってるんでしょうが
微妙に会話がすれ違っているような気がする まあともかく、メディアンでカットするからメディアンカットだろうな メディアン以外でカットするなら、変法だろうし、平均とるにせよなんにせよ、 メディアンよりは時間がかかるだろう。
>>793 メディアンは極端な値があっても有効だぜ?
メディアンフィルターぐらいやったことあるでしょ?
平均を使う場合は極端な値があると困る。
796 :
793 :2007/06/16(土) 22:45:12
すまん言葉足らずだった × 極端な値がでないからこそメディアン ○ 極端な値がで(ても影響が少)ないからこそメディアン
>>794 そうか?メディアンって一回ソートしないと見つけられないと思うけど、
平均ならそんなことはないだろ?平均のほうが早くない?
メディアンって O(n) でいける?
何かいつになく活発だな。そんなおまえらに朗報 GIL 2.1 キター
>>797 どうせ輝度なんて高々256段階なんだから、O(n)にできるバケットソートでいいじゃん。
>>801 おぉなるほどねぇ。というか O(n) でできると習わなかったかなと思って調べたら
分割統治法で線型時間でいけるとでてきた。ただ実際どうするのか書いてなかった。
実際習ったのではなく何かの median 値を使うソートで median は O(n) で見つけられるとする。
と言われた程度だったような気もする。
803 :
デフォルトの名無しさん :2007/06/16(土) 23:27:13
n=256っていみ? それともn=画像の全画素の個数? 後者ならn^2では?
>>803 バケットソート?無論後者の意味だけど、2n でいけるよ。
805 :
デフォルトの名無しさん :2007/06/17(日) 00:01:20
m=画像の一辺の大きさ n=m^2 だったらo(n)ってのは見せ掛けだけでしょって意味
>>805 なにをいってるの?君は O 記法を知らないの?概念を知らないの?
>>806 クヌースかセジウィックの本を読んでから来いよボケ市ね
喧嘩するなよ〜
>>805 全要素の中央値をとるのになんで一辺の大きさが関係あるんだよ。
n = 全要素で考えて終わりに決まってるだろ。画像とか関係ねぇよ
こんな人達が画像処理出来るとは思えない。
どっちにしろ今のPCならメディアンよりは、平均値の方が速いと思うけどね。 まぁ、これ以上はスレ違いになってくるが。
>AdaBoost "ブースティング"で本のタイトル調べれば出てくるやつに載ってた。
■ おすすめ2ちゃんねる 開発中。。。 by FOX ★ このスレを見ている人はこんなスレも見ています。(ver 0.20) 【池の下に】奈良先端科学技術大学院大学 Part.14【極秘研究施設】 [大学学部・研究] ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ このスレでNAISTのレベルが知れてしまうなwwwwww
でも一件採択されてるじゃん(´・ω・`)
NAISTスレ見に行って来た 採択されてるのは画像処理と関係ない学科だった
1次元の中央値は並び替えればいいけど 多次元の中央値はどうやって計算するのかな
>>818 多次元の中央値をどう定義するかによる。
VQの空間分割なら軸ごとに中央で切っていけば楽。
naistにともだちいっぱいいるお
821 :
818 :2007/06/17(日) 14:28:20
>819 Med X := min_X Σ_i|X-Xi|, X=(x1,x2,...,xN), |X|:=|x1|+|x2|+...+|xN| の定義だと各軸独立に中央値を求めればいいけど Med X := min_X Σ_i sqrt(<X-Xi, X-Xi>) だとそうはいかない、という感じでしょうか
822 :
737 :2007/06/17(日) 21:33:38
>>814 ひっそりレスthx!
かなり助かりました。
naistといえばやはりパシフィストだよな
アリストテレスには成れナイ人
naist人気だな 嫉妬しちゃいそうだ
shit
どう考えてもGCOE
NAISTは自然言語処理以外話にならんだろ。
830 :
デフォルトの名無しさん :2007/06/19(火) 18:56:40
そんなことないすと
一番話になるのはバイオだろ
最近バイオばっかり話題になってて嫉妬
NAISTの自然言語処理は、たまたまChaSenの時期に出来る子がいただけでしょ。 MeCabの人は卒業しちゃったし。今は特に・・・。
834 :
デフォルトの名無しさん :2007/06/20(水) 02:04:27
門外漢の素人の思いつき質問です。 ルビンの壺みたいなだまし絵って、普通の画像と比較して 何らかの数学的特徴があったりするんですか? 画像の信号成分を行列で表して固有値空間とか零空間を 調べると、何らかの特徴があるとか。
しらん。やってみるかぐぐってみたら?
>>834 心理的要因が重要で数学的な特徴はない。
838 :
デフォルトの名無しさん :2007/06/20(水) 11:52:08
認知学的要因じゃね? モノを認識する過程の それも心理学と言えば心理学だけど
>>836 心理的要因は数学的な特徴として出せないの?
840 :
デフォルトの名無しさん :2007/06/20(水) 12:18:51
定義すればOK
841 :
ひろみつ :2007/06/20(水) 12:23:33
画像処理って面白いですよね。僕もアイドルの画像を色々処理しています。 Paintで鼻毛を書き足したものを印刷して、町の電柱にはりつけたりしています。意外とおもしろいですよ。
>>841 電柱はNTTもしくは電力会社の所有物で、無許可でそういったものを張り付けることは違法です。
あなたは犯罪者です。極悪人です。
電柱は電力会社の所有物です。 NTTの所有するものは電信柱と呼びます。
>>843 どっちの所有でも無いものはなんて言うんだ?
柱
電力会社のは電力柱 通信会社のは電信柱 共用のやつは共用柱 特に持ち主や使用目的を気にしないのは電柱
柱とかにぐるーっと一周見れるようになっている 液晶って何って言うんですか?
そんなに高度なものじゃなくて、 何といいますか、もっと画質は悪いです。
本当に液晶?
液晶ではないのかもしれません。 液晶じゃない場合は何かわかりますか?
LED?
あー、LEDありそう
すみません、そんなに詳しく見ていないもので。 LEDの場合RGBのLED使うということですか?
そうじゃないか。
電光掲示板の超進化バージョン
新聞に「70歳から画像処理始めました」っていうおばあちゃんの記事があった。 デジカメで撮った写真に文字入れてるらしい。。。
それがどうかしたのか 画像処理じゃないか
素人の画像処理なんてそんなもんだよ。 連中にとっては双葉のコラ画像ですら神に見える。
>>860 まぁそういうのは別のテクニックって気がするけどな。
ネットワークで言ういわゆるハッカーみたいな
使う側と作る側の差じゃなのか?
そうだよ
鍛冶屋と料理人を比べてどうする
静止画から半透明のロゴだけを除去したいのですが、具体的にどんな手順を踏めば良いのでしょうか。
>>865 ネットオークションにお店が作った写真を流用しようなんてなら
止めた方がいい。
自分で出品するモノを写真に撮って出すべき。
BS-hi
>>865 半透明合成にもいろいろあるけど、単純なアルファブレンドだと仮定すると、
Dest = (1-α)*Src + α*Logo
なので、Srcについて解けば、
Src = (Dest - α*Logo) / (1-α)
つまり、ロゴ単独の画像(Logo)と不透明度マスク(α)が既知で、
かつα=1(完全不透明)になる領域がないなら、これで元画像が得られる。
Logoとαが未知のときにどうやって推定するかは頑張れ。
871 :
デフォルトの名無しさん :2007/06/22(金) 14:35:17
>>872 アルファブレンディングは普通に半透明なオブジェクトの描画手法の一種として通用していると思うけど。
ありもしないスペキュラーを加算合成してないからとかバカな話以外で
「半透明じゃなくて」と言い切る根拠があるなら、後学のために知りたい。
>>873 872は871に対するレスで、871はアルファブレンディングの話ではないと思うが。
>>873 おまえが何の話をしてるのかよくわからんが、
その論文の7ページのサンプルとか見ると消したい対象が半透明じゃないから、
元画像の情報が完全に失われてる場合の補間処理をやってるんだなと思っただけ。
>>865 の半透明ロゴのケースとはちょっと違うでしょ。
>>872 の "
>>871 " ってのを見落としていますた。
漏れの脳がおかしかったために不快な思いをさせてすまん。
877 :
デフォルトの名無しさん :2007/06/22(金) 16:55:11
下着や水着を取り除いた後を補間できますか?
yes. ofcource.
万人にできるわけではありませんが、知識と想像力があればできます。
>>878 871の方法だと不自然な結果になってしまう
見えていない毛や具については難しい
毛や具を自動生成してやれば問題ない
883 :
デフォルトの名無しさん :2007/06/22(金) 19:53:59
フラクタルを使えばいけるな
テンプレート用意した方がいいんじゃまいか?
マンガでは、乳首のスクリーントーンがあるらしい。 具は知らん。
乳首はスクリーントーン貼ってさらにトーンを削って作ります。
光の当て方だけを売り物にしてるスレッドはココデスカ?
888 :
デフォルトの名無しさん :2007/06/23(土) 18:06:20
変えれ
>>877 では、
>>878 の期待に副えないことは確認した。着エロの極小ビキニでも困難であった。
確かに、檻や字幕は消えてるように見えるんだけどね。
同じように補間されているのかもしれないが、女体だと極めて不自然に見える。
鑑賞眼が研ぎ澄まされているためだろうか。
マジレスおねがいします。(男か女か明記してください) もしあなたが結婚して新婚旅行の話になったら、どちらがうれしいですか? @なるべく二人の時間を長くとっていっぱい話がしたいから、軽井沢の自然がいっぱいで静かできれいなペンションで1週間。 A一般的な、海外の観光旅行で1週間。
いよいよ何のスレだかわからなくなってきたな
>>890 画像処理の観点で@とAを比較すると、いずれもスレ違い
OpenCV を試してみようと思ったんだが,以下のようにエラーが出て cvaux.lib が作成できん…. OpenCV\cvaux\src\cvbgfg_acmmm2003.cpp(411) : error C2039: 'foreground_regions' : 'CvFGDStatModel' のメンバではありません。 OpenCV\cvaux\src\cvbgfg_acmmm2003.cpp(416) : error C2039: 'foreground_regions' : 'CvFGDStatModel' のメンバではありません。 OpenCV\cvaux\src\cvbgfg_gaussmix.cpp(343) : error C2039: 'foreground_regions' : 'CvGaussBGModel' のメンバではありません。 宣言を確認すると… …… ……… CvMemStorage* storage; /*storage for 吐oreground_regions?*/ \ ←文字化けしていてコメントが閉じてない. CvSeq* foreground_regions /*foreground object contours*/ ←この行の末端までコメント化してる. ワロス
何をいまさら
OpenCVによる顔認識って、 facedetect.cmdの参照元をhaarcascade_frontalface_alt.xml にした場合は鼻を検出してる? 各haarcascade...ファイルの特性を解説してくれてるページないかな・・・
OpenCVスレでも作ったらどうかw つっても他にホットな話題もないか。
鼻?frontalface って書いてあるじょん
opencvスレ確かに作った方がいいだろうが低レベルな質問に誰かが答えるスレになりそうだな
実際 opencv メーリングリストはインストールができない、とかそんなんばっかだな
1日に200通くらい、 そんな感じの低レベルな質問だったので 即効退会した
初心者質問は常にありうるんだし、わけてほしいよね
エッジ検出のcanny法について詳しく解説してるサイトない? みつからねぇ・・・
ソース読むのが一番はやい。
オリジナルの論文嫁よ
日本語でソース公開してる所があったような>Canny というかそれ見て作った。 悪くないけどメモリ食いすぎ。
本ならソース付のもあるが、サイトはいいのが見当たらないな〜
そうか・・・サンクス。 ソース読んでがんばるわ
なんらかのプリミティブな2D図形を、線に沿って描画する方法は分かるんですが、 ピクセルを端から一つずつスキャンする方法では、全ての対象オブジェクトの全ての衝突判定(?)しなければいけないんですか?
日本語でおk
誰か通訳たのむ
よし、イライラして寝付けない俺がチャレンジしてみますわよ。以下、意訳。 >なんらかのプリミティブな2D図形を、線に沿って描画する方法は分かるんですが、 塗りつぶし無しの図形の場合は、図形の輪郭を描くだけで良いので、私でも出来ます。 >ピクセルを端から一つずつスキャンする方法では、 塗りつぶし有りで、図形同士が重なる場合はスキャンライン法の様な手法をとる必要が あると思っています。 >全ての対象オブジェクトの全ての衝突判定(?)しなければいけないんですか? その場合は図形の前後判定をする必要があると思うのですが、正しいでしょうか?
おまえ天才
翻訳してもよくわかりません
>>910 >全ての対象オブジェクト
事前にクリッピング出来れば全てのオブジェクトを比較する必要は無いよ
でもまずは全てのオブジェクトを比較する所から実装してみよう
本来の画像処理の問題ではないけど、写真を修正した後、折角だから Exif の中の thumbnail(大抵2種類ある)も更新して Exif Header を残しておこうとしている。 最近カメラを変えたら、軒並み thumbnail サイズが増えて入らないと出る。 中を見たら FFE1 の次にあるサイズが 0xFFFE だ。でその末尾はゼロで埋っている。 正味の FFE1 のサイズはゼロ列を走査して減ずるしかないんですかねえ。 うまいことやっている人はいませんか。
919 :
デフォルトの名無しさん :2007/06/29(金) 14:56:24
?
誰か通訳たのむ
勝手翻訳 質問 EXIFの実装でAPP1 データが 0x00 でパディングされてサイズ0xFFE1固定ってのがあるんだけど(某カメラ)、 サムネイル入れ替えたりして実データ増えた時にはその分だけ 0x00 を取っ払っちゃえばいいの? 答え サムネイルだけ入れ替えて、うしろのゼロは(増減はすれども)そのままにして 長さ0xFFE1のままにしておくのが吉
>(某カメラ) ここにこのスレの懐の深さを感じた
925 :
918 :2007/06/29(金) 19:26:27
>>921 パディングとかそういう言葉知らないから説明難しい。
お答え頂き感謝。
しかし、当座を凌ぐのに、読み込んで、0xFFFE か調べてそうならゼロ列長を
求めて、これまでの基準の形式に変更するようにした。
お答えのようにしようかと最初思ったけど、Exif tag の tree の走査で
2重の管理が必要で、関連変更が大きい気がした。
2、3の Exif 見たら 30KB 位縮まる。写真全体では、4.5MB とかだが。
某カメラも前のはチャンとなっていたんだよね。テンプレートにデータを
埋めてメディアに書出すと編集が省けて速いとかメリットがあるんかな。
926 :
デフォルトの名無しさん :2007/06/29(金) 19:47:32
ファームウェアが糞なんじゃないの?
>>926 クソだよ。他にも撮影枚数 0xFFFF 超えると元に戻るというし。
前のは日立の 16bitCPU だったが、32bits 演算のライブラリ用意してないんかと
思う。古い Z80 の本見ても、64 bits 演算までのルーチン載っているのに。
928 :
デフォルトの名無しさん :2007/06/29(金) 22:43:24
最近家電のカタログを見るとxvYCC(ソニーはなぜかxvColorと呼ぶ) とやらをよくみるんですが、これに対応する画像編集ソフトを作る場合、 画素の内部表現をRGB8bitづつにしていたら精度が足りなくなるんでしょうか というかxvYCCは具体的にどんな規格なんでしょうか いろいろ検索してみたんですが概要レベルの説明ばかりで・・・
>>928 レスがないようなんで、説明ではないが、お付き合いを。
xvYCC の構造が分かっているわけではないが、CRT 基準の sRGB に対して、拡張の
AdobeRGB ってのがある。Photoshop を使うとこの色空間で処理して、また、sRGB
に戻しているようだ。今ある機器の色表現は sRGB 基準なので、他の色表現のデータ
を作っても表示する手段がない。(ソニーはその拡張機能を備えたということでしょ)
デジタル一眼では、CCD 電荷そのままを記録した RAW データを出力する。これを
編集して AdobeRGB, sRGB も出せる(今ある機器で見れる)ようになっている。
細かくは Adobe のサイトに説明があるが、AdobeRGB は XYZ 表現みたい。
自分もここで教えて貰ったんだが、XYZ 表現の変形?に xyY 形式もある。
これらの座標系で示すと色の範囲が広いのが分かるが、画像としてみるには手段が
ないんで、最後は sRGB に(今は)せざるを得ないということではないか。
IEC61966-2-4 を見たいが、所在にまだ行き付いていない。
乱文ゴメン。
何なんだよこいつ・・・
リニアsRGBの0〜1範囲外も使うだけなんじゃないの
XYZ色空間ってのは人間の眼で見える色を表現したもの、つまり全ての色を含むと考えればいい。
これが全ての色空間の基準になる。
で、RGB色空間は、3原色のXYZ座標とガンマカーブを定義して、その混色で色を表現する。
YCCは輝度と色差で色を表現するもので、RGBと相互に変換できる。
通常、RGB値は0〜1で表現するが、YCCで表現した色をRGBに変換するとその範囲外になってしまう場合がある。
sRGBは0〜1の範囲外をクリッピングするが、xvYCCはその範囲外も許容することで色空間を拡張する。
>>928 >画素の内部表現をRGB8bitづつにしていたら精度が足りなくなるんでしょうか
YES
具体的な実装方法としては、YCCからRGBに変換したときに0〜1の範囲でクリッピングしなければOK。
sRGBに変換したいときは0〜1でクリッピングするだけでOK。
>>929 はいろいろ間違ってる。
・AdobeRGBはsRGBの拡張ではない。3原色の座標が異なるので互換は無い。
・AdobeRGBはXYZ形式ではない。ただのRGB形式。
・AdobeRGBはxvYCC/xvColorと無関係。もちろん互換は無い。
>>932 sRGBの拡張はxvRGB以外にもいろいろあるね。sYCCとか。
許容するRGB値の範囲の違いくらいで、考え方としては大体似たようなものだと思っていいんじゃないかな。
935 :
929 :2007/06/30(土) 14:16:28
>>930 撒き餌だよ。
みんなが調べ出して、ワシも教えてもらえる仕掛け。
>>934 お教え頂き有難うございます。
これを起点にいろいろ見直したいと思います。
937 :
928 :2007/07/01(日) 10:31:13
質問しておきながらスレ覗くの忘れてました 大変勉強になりました みなさんありがとうございました
938 :
デフォルトの名無しさん :2007/07/03(火) 08:26:55
【派遣ネガティブ根性チェック】 3つ以上、チェックがつけばアナタの性格はひん曲がっており、 ネガティブ負け組派遣人生を歩んでいます。 □派遣先正社員の作った糞開発ツールはたとえ腐っててもマンセーして使う □派遣先の人事権のある社員の意見はたとえ間違っていてもマンセーする □昼食は必ず派遣先の社員と行くべきだ □自分の仕事で問題が発生しても解決するのは自分の仕事ではない □派遣先から「いつまでもここで仕事してくださいね(安い金でw)」と言われて嬉しい □自社で仕事なんてできるわけがない □派遣労働の問題点の話題が出ると感情剥き出しにして反論する □派遣労働の問題を指摘する人は嫌いだ □派遣先には仕事だけでなくプライベートについてもグイグイ引っ張って欲しい □奢ってくれる派遣先正社員を尊敬する □自分の月額金額を知らないのは当然だ、単金を聞いてはいけない □派遣先正社員より自分の生涯収入が低いのは当然だ □チビは派遣先にかわいがってもらいやすから派遣には有利だ
939 :
デフォルトの名無しさん :2007/07/05(木) 22:11:50
画像処理に絡んだパターン認識の勉強をしております。 クラス分類に使う「最尤法」は、サンプル点から各クラスのプロトタイプへのマハラノビス距離で 最短のものを、その対象クラスに分類しているだけのような気がするのですが、 「最尤法 == 最短マハラノビス距離による分類」 というのは間違いなのでしょうか?
全然ちがう。 単に「最短マハラノビス距離による分類」と言った場合確率のかの字もないじゃん
941 :
デフォルトの名無しさん :2007/07/06(金) 06:15:00
魔腹のビス距離の近さ≒尤度の高さで近似していると思えば 最尤法とも思えなくない
事後確率モデルを正規分布と仮定したときの最尤なんじゃね?
さいゆうほうか。。。 もっとももっともな方法
確実に == ではないね
税金の引き下げを道具に支持者を集めようとする意図が見え見えのしんぶん赤旗がポストに・・・。 まじきめぇ・・・。
だからと言って公明党には活躍して欲しくないんだろ?
FlexInspector
948 :
939 :2007/07/06(金) 23:43:16
>940 to >944 の皆様、レスありがとうございます。 いろいろ調べているのですが、まったく自信がなくてココで聞いてしまいました。 染色された細胞の画像が対象で、核や壁や液体の領域分類(分割)をしています。 とある方がMATLABで作成した最尤法による領域分類のソフトと、 自分がCで作った最短マハラノビス距離による領域分類のソフトの結果が 似てしまったので、アレ?と思ってしまったのです。 ちゃんと系統だてて勉強しないといけませんね。 最短ユークリッド距離と比べて最短マハラノビス距離で分類すると、オォッ、スゴイ!という感動がありましたが、 最尤法は最短マハラノビスとあんまり変わらないなー、という感じでした。そんなもんなんでしょうか... それと >947 さんの "FlexInspector" というつぶやきが、気になります。
949 :
デフォルトの名無しさん :2007/07/07(土) 15:24:08
画像類似検索を作ろうと思うのですが よくあるパターンとしては、インデックスに画像データそのものをおいて、パターンを比較するみたいなのが多いようですが インデックスには、小さな64bit長程度の特徴データを置きたいのです。 その場合の特徴値として、何がよさそうな値はありませんか?
950 :
デフォルトの名無しさん :2007/07/07(土) 17:59:40
それを思いつかないのに どうして類似画像検索を作ろうと思ったのかが知りたい そこがキモじゃん
エロ画像の重複にウンザリしていたに違いない
>>949 キーワードの組み合わせが一番いいんじゃない?オブジェクト認識するのが大変だと思うけど。
言葉による画像検索にも使える。
「砂浜に裸の若い女が2人」で朝青龍と白鵬の取り組みが検索できるぜ。
女なのか
RGBorほかの色空間のヒストグラムデータとか?
955 :
デフォルトの名無しさん :2007/07/07(土) 21:09:34
ペイントでマスクみたいに塗りつぶして処理しても サムネイル表示で処理されてないのは仕様ですか? マイクロソフトのバグなんですかね?
>>949 MD5でファイルのハッシュを取って特徴データとすればOK
>>956 それじゃ完全に一致する画像しかわからんだろ
画像の類似性を判定したいんだから
>23からの流れを見てて、複数の比較組み合わせれば手軽なんじゃないかと思った
1段階目 MD5等の完全一致比較
2段階目 色ヒストグラムの比較 (全く違うものを弾くのが目的)
3段階目 一部を切り出してマッチング×数箇所
>>955 スレ違いだけどThumbs.dbにキャッシュされてるとかじゃ?
>>949 フーリエ変換かけて、64bit長になるように間引き
そのデータと、類似点を探せばいいんじゃない?
ababcde
abaactde
って感じのデータに落とせれば、
アライメント配列で、何パーセント類似かを数値的に表せれるし。
960 :
デフォルトの名無しさん :2007/07/08(日) 00:30:21
エッジを検出するラプラシアンフィルタとラプラシアンガウシアンフィルタを作る課題がでててるんですが、 ラプラシアンガウシアンフィルタがよくわかりません。 Gausiann関数の二次微分を近傍の対応画素にかけてその総和が中心画素の値になると思ったんですが そのとおりプログラムを組むとうまくいかないです。画素の値がものすごくでかくなってるみたいです またゼロクロスを抽出する場合としない場合について作るんですが、ゼロクロスってそもそもなにかわかりません。 ヒントでもいいので教えてくださいませんか
>そのとおりプログラムを組むとうまくいかないです。 (゚д゚)ハァ?
>>960 フィルタとフィルタを掛ける部分のソースくらい貼りなよ
964 :
デフォルトの名無しさん :2007/07/08(日) 07:29:16
>960 エッジの定義を画像f(x)の勾配f'(x)として, エッジの最大・最小値(=色が急激に変化する点)を求めるためには 高校数学で習ったようにf''(x)=0の停留条件を満たす点をエッジ点として 抽出しましょうというのがゼロクロス。
>>965 なんかプロっぽい説明だな
お前エロイ人だろ
>>960 「ラプラシアン ガウシアン」でググればすぐそれっぽいネタは
ひっかかるけどな。
経験上フィルタ適合後のデータは最低でも負号付き12bit位はないと
綺麗にエッジが出ない。
というかゼロクロスを抽出しないでどうやってエッジを求めるんだろう…。
ハイパスフィルター?
969 :
960 :2007/07/08(日) 20:13:56
ラプラシアンのほうは単に
-1 -1 -1
-1 8 -1
-1 -1 -1
のフィルタかけるだけでできました
ラプラシアン ガウシアンはよくわかりません
注目画素近傍の画素がPixel[]配列に入ってます。
60 23 23
19 45 39
12 49 89 のマスクをとってきたら
Pixel[0]=12
Pixel[1]=49
Pixel[2]=89
Pixel[3]=19
Pixel[4]=45 注目画素
Pixel[5]=39
Pixel[6]=60
Pixel[7]=23
Pixel[8]=23
みたいに値が入ってます
ガウシアン関数を2次微分した式にiとj(中心画素からの距離)を代入してマスクをつくり
それを画素にかけて、その合計を中心画素の値としてるんですが、画像がおかしくなります・・・
>>968 だとおもいます
ラプラシアンガウシアンで3x3じゃ厳しいな 3x3じゃメキシカンハット形は表現できないでしょ
マスクサイズは任意に設定できるんですが、 大きくしてもエッジ抽出がうまくいきません
フィルタの名前とその用途だけ覚えても 本当にそれを適用するべき場面なのかどうなのかって怪しいよな? 8 16 24 32 40 -1 -1 4 -1 -1 の計算結果がわかった上で適用してるのかと 本当にお前の望むとおりのものを認識できるのかと
だいたいエッジを検出したいなんて言ってる奴でも 話聞いてみるとminmaxの方がよっぽど結果がよくなる奴のがほうが大半 だいたい固定長フィルタでエッジを検出するのはかなり困難だ 商品になりえない場合のほうが多い
974 :
960 :2007/07/08(日) 23:36:59
課題なんでどうでしょうもないです。適用しろといわれてるので
んじゃさっさと適用すればいいじゃん
課題なら先生にでも聞け
>>974 なんだ、学生かよw
テキトーにやっとけw
画像処理の大半のお便利フィルタは大抵使い物にならないw
画像がおかしくなるって、どうおかしくなるの?逆に予想した結果とは? まさかフィルタかけるだけでエッジがでるとは思ってないよね
ラプラシアンのほうはエッジが検出できました。 ラプラシアンガウシアンのほうはテレビの砂嵐みたいな画像になっちゃいます
そろそろ次スレ?
>>982 そのページにはラプラシアンガウシアンフィルタについての記述はないです・・・
>>982 3x3で空間的も重み付けも糞もねぇよなw
ガウシアンフィルタを3x3で適用しようとする奴って頭空なんかなw
>>980 >-1 -1 -1
>-1 8 -1
>-1 -1 -1
ラプラシアンはこれを使ったのよね?
ガウシアンはどんな値を使ったの?
ただのバグか正規化がうまくいってなくて濃度値がオーバーフローしてるだけなんじゃね?
>>985 そうです
ガウシアンは式が指定されてて、ガウス関数の2次微分
(-1/2πσ^4)*(2-(x^2-y^2/σ^2)*exp(-(x^2+y^2)/2σ^2)という式を使いました
σはマスクサイズが(2k+1)*(2k+1)のときk/2となるように設定されてます
で、フィルタに使った値は何?
msk:834.198284 msk:37.632154 msk:834.198284 msk:37.632154 msk:-5.092958 msk:37.632154 msk:834.198284 msk:37.632154 msk:834.198284 こんな感じです。 でかすぎますよね?
式が明らかに間違ってるじゃん。xとyは対称式だから入れ替えても 同じ式にならないとおかしいでしょ
正規化してみたら出力画像が平均フィルタかけたみたいにぼやけるだけでエッジ抽出になりません・・・ ゼロクロスの抽出が関係してるんですか?
すいません (-1/2πσ^4)*(2-(x^2+y^2/σ^2)*exp(-(x^2+y^2)/2σ^2) です
>>989 はったりもここまでくるとキチガイだな
どう文献読んでもガウシアンかけてラプラシアンかけるだけなのに
どう調べても計算式しかのってないのなw
まだ対称じゃないよ
LOGの場合マスク総和≒0にならないといけない
ハード的制約から、ガウシアンフィルタを3x3で実現することはある。 複数回適用すれば任意のガウシアンと同等の結果になる。 そのようなガウシアンをパラメータを変えて組み合わせればラプラシアン―ガウシアンも簡単だ。 複数回適用というのは多階層化すればよい。 2階層目、3階層目からの結果を元の階層にフィードバックするようにすれば、 じつは複雑なパターン認識も容易に実現できる。
ではでは。諸君の健闘を祈る。(・∀・)
1001 :
1001 :
Over 1000 Thread このスレッドは1000を超えました。 もう書けないので、新しいスレッドを立ててくださいです。。。