新スレなんだから引っ張らなくていいのに・・・ しかも宿題なんだし
式の意味もわからず、公式やフィルタだけ適用するアフォを量産する学校なんだな 楽でいいな大学の教授ってのはよ
意味を教えようとすると受講生が減ったり学生評価が下がったりするんだYO
意味を知ったところで応用できないなら意味ないけどなw
8 :
デフォルトの名無しさん :2007/07/09(月) 10:53:09
新しい概念が出てきたら、 意味を理解している人間は比較的近い概念と比較したりして本質を見抜くことができて効率が良いが、 意味を知らない人間は新しい概念ごとにゼロから勉強することになるからとても非効率。 それが高学歴エリートと叩き上げ低学歴の違い。
9 :
前スレ質問者 :2007/07/10(火) 00:35:07
>>3 そのとおりです。例をみたら中心がー40ですけど
中心は-1/π×σ^4ですよね?
σ=1.4としたら-40にはならないんですが、なんかの操作をしてるんですか?
正規化じゃなさそうですし
>>9 え?計算した?
俺はなったよ
とりあえず手で計算すると
真ん中-1/12で
上下左右-1/20になるでしょ?
で、480倍(おそらく近い整数にあわせてる?)すると真ん中-40、上下左右-24になる
真ん中の計算は-10000/314x384
約-10000/120000で-1/12になる
480倍して-40
上下左右の計算は-1/12x(1-(1^2+0^2)/1.96x2)*e^-(1^2+0^2)/2x1.96)
1.96x2を4として、eを2.718として計算
-1/12x3/4x4/5となって-1/20となる
480倍して-24
11 :
デフォルトの名無しさん :2007/07/10(火) 02:56:17
質問です アンチエイリアスとグラデーションは、 色の間を取って滑らかにする、という点では同じなのに アンチエイリアスはぼけて、グラデーションはシャ−プなままなのは 何が違うからなんですか
↓満を持してエスパー登場
[M] ( ゚∀゚ ) <ポテトおひとつでよろしいですね? _(__つ/ ̄ ̄ ̄/_ \/ /  ̄ ̄ ̄
░▒▓▊ ░▒▓▊ ░▒▓▊どこがシャープ? ░.#▓▊ ░▒▓▊
目のつけどころがシャープでしょ
>>11 アンチエイリアス → 物体間の境界を滑らかにする
グラデーション → 色の補完
なのでアンチエイリアスは単なる色の補完とはちょっと違う。
シャープといえば、 先日富士山の写真を撮ったけど、霞みがかかっているみたいにクリアでない。 これを修正するプログラムを作るヒントはないかとぐぐったけれども、ヒット しない。どんな用語でぐぐれば出てくるか、教えて下さい。 素人考えで、HLS変換して全体の明度平均、Y軸毎の明度平均を求めておいて 全体平均より明るいY軸に対して、そのY軸の明度平均より暗いピクセルの 明度の暗さを倍にして RGB に戻すとか試してますが、改良は見られるものの スッキリしない。スライダで閾値を変えるとか、マウスで絵を見てブラシ様に なぞって段々クリアにするとかやらないとダメかと悩んでいます。
>>17 明るさに注目するなら「コントラスト強調」について調べるといいかも。
ただ、霞みがかってるものはそもそも情報がかなり欠落してるから復元は難しかったような…
>>11 面積が違うからじゃねえ?
アンチは幅1〜3ドットの幅で掛ける極小グラデーション
イラレのパスにアンチ掛けて表示するとして、ルーペで拡大すると
アンチのぼかしまで拡大するプログラム書くバカはいないだろ?
>>17 空気で光が散乱している結果なので、情報量はかなり落ちています。
単純な修正は難しいと思うので、「どういう写真にしたいか」のイメージにしたがって
納得いくまで微調整するしかないのでは?
22 :
17 :2007/07/10(火) 11:31:28
>>18 ,
>>20-21 早速レスを頂き有難うございます。
>>20 氏の挙げて頂いた用語で
ぐぐると文献が一杯出てくるので、これからチマチマ見ようと思います。
>>21 確かにどういう写真にするかですねえ。遠景なんで多少は霞みも残さないと遠近感
が出ません。近景はマンマでいいわけですから。境目を徐々に変化させるというの
が計算一発では難しい。
>>18 コントラスト強調とも思ったのですが、明るい方をいじるとギラギラします。陰のみ
をいじるという変則的な処理かなと思っています。
ホレこんなのがあるということでもないようなので、闘志が出てきました。
>>20 ナンバープレートの例は単なる手ぶれ(モーションブラー)で、
ぼかしカーネルの形が単純な直線状だから、逆変換は比較的簡単な部類だと思うよ。
24 :
デフォルトの名無しさん :2007/07/10(火) 16:43:53
CSIみたいだ
Haze removal, remove haze でピッタリのサイトが出て来ることが分かりました。 しかし photoshop でこうするとかの説明は多いけど、計算手法は見つからない。 議論している英文サイトはあるけど、追うのは時間がかかる。
atmospheric correction リモートセンシングで大気の影響を補正する手法。関係あるかも。 RGBじゃつらそうだ
>>27 書いてあるじゃん
かすみ除去フィルタの効果は、画像の輝度とコントラストを調整すること、そしてシャープニングを画像に適用することです
29 :
デフォルトの名無しさん :2007/07/11(水) 21:21:07
中野康明が死んだぞ えええええええええええ
なんで死んだの?
>>29 どんな人?
ググってみたところ、なんかの先生のようだけど。
前スレのラプラシアンガウシアンフィルタ作ってる者です。
>>10 なんで480するのかわからないので、そのままかけたら一応エッジ出ました。
ゼロクロスの抽出がいまだにわからないです。閾値が課題の中で定義されて86になってます。
二値化処理とは違うんですか?閾値87で2値化すると真っ白になってしまいますが・・・
0にするといい感じです
で?
>>32 >なんで480するのかわからないので
見易くするために一番小さい値を1にするために全体を合わせたとか
所詮重み付けって話ちゃうの?
エッジ検出フィルタが
-0.5,-0.5,2,-0.5,-0.5
でも
-1,-1,4,-1,-1
でもでるもんあんまり変わらないと思うんだ多分w
>>37 >ラプラシアンフィルタかけるだけだってw
↑
どこが面白いの?
式と関係ねぇわけねぇだろばか 例の式はガウシアンの式をラプラシアンしたものだっつーの。 ガウシアンフィルタの具体的な数値だってガウシアンの式からでてるんだっつーの
>>17 ノイズを抑えるために軽くぼかしてからエッジ強調するだけではさすがに駄目かな…
「霞」の原因によってはデコンボリューションが使えるかもしれない
大気による散乱が原因の場合は厳しいと思うが
一番の問題は距離によって霞みの程度が違うこと
>>39 だから、そんだけだろ?
実際使う分には難しい式はそっから算出しましたって話だけで
フィルタさえ出しちゃえば別に意識せんでもいいと
そんなん最初っからわかってんだろうが ガウシアンフィルタの時点でわかってないと話にならんぜ なんなら平均フィルタの時点で、ソベルフィルタの時点でわかってないと話にならんぜ
>>37 >>39 それはわかりました。ゼロクロスがよくわからないんです。
2次微分したグラフでx軸で交わるところですよね?
>>40-41 お付き合い頂きありがとうございます。
絵を見ながら、調整しないといけないということで、スライダを使ってやろうと
思っていますが、もう一杯スライダを使った処理があり、古いのは自分でもどれ
がどれだか分からなくなっています。どれかに追加するか、独立して起すかで
今、頭を冷やしています。
(
>>17 では、係数など変えてはコンパイルし、試していました。)
余談ですが、色変換も最初は radiobutton で選べるようにしていたのですが、
数が増えて場所がなくなり、combobox に切り換えました。こんなのが意外に
邪魔をします。
47 :
デフォルトの名無しさん :2007/07/12(木) 10:04:39
その成果物はここで公開するんだろうな?
49 :
デフォルトの名無しさん :2007/07/12(木) 17:34:00
高校生とかなの?
なんかものすごく表面的にしか理解してない感じだよね
まぁ低級大学ってとこじゃないの?
480かけているのは整数で演算しやすいようにじゃない? LoGで興味あるのはゼロクロスなんでフィルタのスケールには関係ない。 2階微分は一次元は意味はわかるけど2次元だと難しくなるね。 簡単な方法は8方向のどこかでゼロクロスが見つかればエッジ点とする方法。 Cannyだと勾配方向の方向微分とゼロクロスをとる。
>>52 ゼロクロス処理を教えてくれませんか
フィルタかけた後の画像が
2 3 4
-1 1 4
1 3 2
みたいだったら-1 と 1の間がゼロクロスですよね
偉い人がどんな画像で試して使えるっていってるのかわからんけど 平滑化フィルタ→鮮鋭化フィルタかけるだけじゃバタつき多すぎて とてもプラマイ反転だけで輪郭ですとはいいにくい もっと根幹的な画像の特徴をつかむ必要があると思う 例えば、必ず対象物が中心にくるような画像が多い傾向があるとか なんかないとそのままでは使えないと思う 漫画のスクリーントーンやjpeg画像のノイズにひっかかりまくってEND
がはっ
プラスとマイナスの画像出してみればわかるけど綺麗にはいかない
57 :
デフォルトの名無しさん :2007/07/14(土) 10:34:06
101 -35 -76 81 41 36 13 8 18 1 15 20 33 38 26 12 25 8 39 23 -99 -38 110 39 38 19 13 2 1 41 47 10 18 1 11 2 23 23 66 -57 -92 67 46 41 7 13 14 41 28 8 11 12 10 1 14 41 28 8 11 12 10 3 2 28 15 -109 -39 -124 74 46 14 5 31 34 12 29 1 3 3 3 7 ラプラシアンガウシアン フィルタを適用したらこんな風な画素値になったとします。ゼロクロスってどうやって検出して、それをどう出力画像に反映するんですか?
58 :
デフォルトの名無しさん :2007/07/14(土) 11:20:18
まず1行目をグラフにしてみろ エクセルぐらいもってるだろ つぎに1列目をグラフにしてみろ
59 :
デフォルトの名無しさん :2007/07/14(土) 11:23:19
グラフにしてみましたがわかりません><
>>57 注目画素と符号が反転してたら1が立つようなフィルタ組んで8方向8ビットに保存
61 :
デフォルトの名無しさん :2007/07/14(土) 12:05:18
62 :
デフォルトの名無しさん :2007/07/14(土) 12:20:53
>>60 注目画素と近傍をくらべるんですか?5×5のマスクだったら24個の近傍画素がありますが、その24個の画素の符号がバラバラだったらどうするんですか?
やっぱ重要なのはスピードだよ
ぐだぐだ言ってないで自分で思ったとおりに作ってみればいいのに それで駄目だったらうまくいかない理由を考えてから質問してくれ 教えて君
65 :
デフォルトの名無しさん :2007/07/14(土) 13:45:47
こいつの周りに画像処理を知っている奴がいないのだろうか 大学なら先生にきくか 先輩にでも聞けばいいのに
66 :
デフォルトの名無しさん :2007/07/14(土) 14:45:24
「gd使ったらプロジェクトがgdgdになったのですがどうすればいいですか。」
わざわざ差分LoG?を使わなくてもいいんじゃない?
なんで専門学校の課題をここで聞くんだよーw
ずいぶんしめきり長いみたいだな
71 :
デフォルトの名無しさん :2007/07/14(土) 18:07:39
夏休みの課題なんじゃね?
>>62 エッジを検出したフィルタと同じサイズでいいじゃん
>その24個の画素の符号がバラバラだったらどうするんですか?
その精度しか検出できてないならプラマイ反転をエッジとして扱わないほうがいいと思う
つまり、使えない(=鮮鋭化のフィルタが腐ってる)
局所的な符号変化をみるだけでいいので3x3で十分。 より高精度にしたいならグラフプロットのゼロ等高線描画の要領で やればいい。
ノイズを気にしてるなら平滑化の処理を疑うべき
ノイズ除去の基本はメディアン。平滑化では眠くなるばかり。 ただし、どんなフィルターの場合でも闇雲に適用するのはダメ。 2階層目、3階層目からの結果を元の階層にフィードバックして局所的に最適化されるようにする。 この部分の設計次第で、目的に合わせてまったく異なる画像をリアルタイムに出力できるようになる。
加法性白色雑音ならウィナーがウマー
77 :
デフォルトの名無しさん :2007/07/16(月) 19:07:56
「gd使ったらプロジェクトがgdgdになったのですがどうすればいいですか。」
78 :
デフォルトの名無しさん :2007/07/16(月) 22:16:29
つかわなきゃいい
IM使ったらマジマジと見られたよ
なんと味気ない答えだ そんなことでは芸人にはなれんぞ
>>75 「2階層目、3階層目からの結果を元の階層にフィードバックして局所的に最適化」について
なんかいい論文とかない?
gilがまだboostの正式ライブラリーになってないっぽいのだけど 何かあったの?
83 :
デフォルトの名無しさん :2007/07/19(木) 10:09:57
gilって何がいいの?
gilは、いろんなライブラリーをごっちゃにして使うときの糊として使える OpenCV + ITK とか
>>84 通りすがりだけど興味アリ
どこかに良い資料ある?
糊か、なかなかうまいこと言うな
>>85 gil本家の掲示板とかにあるかも
日本語での情報はまだない気がする
C/C++で アニメーションGIFを保存できるライブラリって何かありますか?
HDVの1080iって、どうやったらフレームキャプチャできる? WindowsのOpenCVでキャプチャしようとするとエラーが出る。 DirectShowでも、同じくエラー。 Video4Linuxとかでやんなきゃいけないかなぁ・・・
90 :
デフォルトの名無しさん :2007/07/21(土) 17:05:43
画像の読み込みスピードが一番速いライブラリって何でしょう? FreeImageやImageMagickを試してみたけど、AfrerEffectsの読み込みスピードには遠く及ばないのです。
読み込みつっても色々あるからなあ
92 :
デフォルトの名無しさん :2007/07/21(土) 17:31:55
とりあえず、tgaとsgiが読めればOKです。 FreeImageとかだと100枚読み込ませるのに8秒くらい掛かるのですが、 AfterEffectsは2秒くらいで読み込んでしまいますね。
まじで? そんなに差が付くものなのか? Adobe恐るべし。
読み込むだけなら漏れの関数が最速だね。
尤も、読み込むだけなら誰が作っても一緒だと思うけど。
>>88 逆に、何故今時AnimatedGifなんか扱いたいの?
読み込み部分をスッドレに分ければいいんじゃね
>>94 まだ簡易な動画形式としては需要あるだろ
今でも画像うpろだじゃgif以外動画の選択しないしな
97 :
デフォルトの名無しさん :2007/07/21(土) 20:15:14
pngはアニメーションできなかったっけ?
mngだよアニメーションは IEが対応してないとなやっぱり
どうしてIEはmng対応しないんだろう… mng自体の仕様がまだ固まってないんだっけ?
んにゃ、それなりに固まってる MSが同調したくないんだろうね、W3Cに
動画は携帯ですらすでに別の次元に突入しているから、 いまさら、mngもないってことじゃないのかな。 利用しているサイトも、ほとんど無いし。
102 :
デフォルトの名無しさん :2007/07/21(土) 21:59:26
容量をケチる時代でもないし音も入れたいし Flashがあれば困らないしな
いや… いつの時代も容量はケチりたいだろ トラフィック爆発こわいこわい
mngのほうが容量でかいと思た
劣化なしドット絵フルカラー+αで圧縮ありの動画となるとmng以外ないよなあ
つ[MultiPageTIFF]
107 :
デフォルトの名無しさん :2007/07/22(日) 08:45:10
PRMUで韓国なんか行きたくないし
108 :
デフォルトの名無しさん :2007/07/22(日) 10:56:36
「モザイクの消し方を教えてください」
範囲選択→消去
PRMUアルゴリズムコンテストって一昨日知ったんだけど、 この中には参加する人いるの?
112 :
デフォルトの名無しさん :2007/07/22(日) 16:15:47
今年は簡単だな 標識見つけるのは結構難しかった
これどうやったらいいんだろ・・・。 流れ的にはどんな感じでアプローチする?
「応募は大学学部生,大学院生,高専学生を想定しています」 中学生でもいいのかな?
115 :
デフォルトの名無しさん :2007/07/22(日) 16:24:55
ニートはダメなの?
いいんじゃね? 俺は専攻生だし。
>>113 元画像を、パーツのサイズに分割して、それぞれのハッシュを作って比較する。
ハッシュに何を使うかがポイントだろうが、速度のコンテストではないと書いてあるので
まじめに全比較しても無問題。もちろんアワードは取れないだろうが。
元画像が異なるサイズで与えられている場合は、さらに何でハッシュを作るのかが問われるが、
方針は同じ。
これって最終的にはCPマスクの外しアルゴリズムに使うわけ?
元画像って与えられないんじゃないの?
いま教授とこれ見てたんだけど、 「原画像を分割する際に番号を振って、乱数でばらつかせたあと 番号ごとに並べれば一発っすよ!( ´∀`)b」 ってアイデアだしたら紙束で殴られた
CPとかQRとかMECOとかのマスク外し以外の用途が思いつかん
最近ハフ変換をならったのですが、 ハフ変換で画像中の四角形を検出するのと、円を検出するのとでは なにか違う手順が必要になるんですか? それともハフ変換を使えばどちらも同じように検出されるのでしょうか
投票に使う空間(何て名前だっけ)が違う。 傾いていない矩形ではx, y位置と高さ幅で4パラメタ=4次元空間に投票する(正方形なら3) 円ではx,y位置と半径で3パラメタ といった感じで投票方法が違うだけで、 実在する図形の位置に最も多く投票されるという理屈は一緒。
>>113 は元画像が与えられない場合どうするものなの?
どんな画像だろうとばらばらになっていたら元通りに完成できるようなプログラムは可能?
画像処理の勉強始めてまだ日が浅い俺に誰か教えてくれ
>>124 だから、そういうのを各自が考えて作るコンテストだっての。
まず思いついたのは各ピースの四辺を調べて あるピースの左辺(上辺)と別のピースの右辺(下辺)の画素の変化が最小の物を隣合うピースとする って感じで並べていく方法
画像処理全然和漢ねけど俺もそれ思いついたぞ!
逆転の発想! そもそも入力画像が真っ黒なら処理しなくていい
砂漠とか星空とか、色数が少なくて均質な画像だと難しいのかな
>>126 で、それを発展させて、gradient も考慮にいれる。
さらに発展させてもう一回微分とか?
ある種の、画像周囲の estimation を行い、くっつける画像との差が小さいやつってとこじゃね?
でおそらくやっていくと、一番差が小さいけどここで使ってしまうと、画像がうまく四角に戻らないとか
そんな問題もでてくるんじゃないかな。
PRMU のコンテストって毎年 広島市立、名古屋、奈良先端の方々がいるみたいだけど研究室単位で毎年やることにでもなってるんかね?
PRMU コンテスト4日前に見つけたけどもう時間がないから辞めた・・・
今からここのみんなでやれば間に合うんじゃね? 「プログラム技術@2ch掲示板 画像処理 その9 住人一同」で応募しようぜ( ´∀`)
PRMUコンテストここで晒されちゃったかぁ。 しかも解放のヒントまで…まぁ仕方ないけど。 せっかく応募しようと思ってたのに、倍率高くなりそうでこわいな。
基本は
>>126 の方法を中央まで繰り返して完成させるしか浮かばないな
137 :
117 :2007/07/22(日) 21:19:28
ピースに形があるならともかく、形がないなら元画像なしでは完全な回答は不可能。 矩形ピースだから、元画像は与えられるとおもったんだが、ないのか? 126系のやりかたでは、カットされた部分に高周波成分がぴったりある場合、 (例えばモンドリアンの絵みたいな)復元することができない。
>>135 こんなんで倍率上がるようなコンテストなんて参加する意味ねぇだろ。アフォかw
>>135 これそんなにマイナーなコンテストなの?
>>137 >126系のやりかたでは、カットされた部分に高周波成分がぴったりある場合
もちろんあるだろうな
星空、漫画のスクリーントーン、普通の白原稿黒文字書類(その逆も)も全部駄目だ
4辺判断に不感帯をもうけて判断がつかない場合は中身の処理に移らないと駄目だろうな
商品ならねw
でも、今回のは出題画像に最適化しちゃっていいんじゃない?
>>137 元画像与えられてるっぽくね?プログラミング詳細のところに書いてある
>>130 横に並べていく時、あるピースの右辺と左辺でそれぞれ最も隣に来そうなピースを選んで
可能性の高い方"だけ"つなげていくのはどうかな?
一列に並ぶピースの数が上限(元画像の幅÷ピースの幅)に達したらその列は終わり。
これでまず横一列を作って次は縦一列を同様に繋げていく。
んでT、十、L字型のどれかができれば四角形に戻らない事態にはならないんじゃないかな。
>>142 だから、そうじゃなくて処理のときに元画像を使っていいかどうかって話じゃない?
問題文読む限りは駄目っぽいけどね
ちなみにピースのサイズとかはあるんだよなw
145 :
117 :2007/07/22(日) 21:45:23
ちゃんと読んできた。 ピースがばらばらになった画像データが与えられて、それを元のデータに復元するという課題だった。 つまり利用可能なのは、ばらばらになったピースのみだってことだ。 しかも、画像データはどのようなものが与えられるのか書かれていない。 単なる自然画像なら何とかなりそうな気もするが、デザイン画や図面が与えられたら、 適当なアルゴリズムは全然違う。これは難しい。
>>126 の方法って外側から埋めてくだけじゃないの?
>>145 一番外枠の4辺は与えられるから
>>126 の方法で外掘りから埋めてくようになるべ?
そしたら次はその中、その中ってぐるぐる内側へ決めていくしかねーべ
ごめん。概要に書いてあった。 >サンプルで示した写真のように建築物や風景写真を複数枚用いて行います。
サンプル出題画像の湖の空と湖の映り込みの空とか嫌な味出してるな それと判断のしようがないような草花とかも嫌な感じだな これはエッジ拾ったり特徴つかまんとできんな
各ピースの接合部の相関を利用しないと絶対復元できない希ガス。
>>147 外枠あったのか・・・
外枠が与えられるなら隣のピースを選び出すのに角からやっていけば最低2辺ずつは評価できるな
ってか自分もちゃんと読んでくるわ・・・
>>150 ピースっていうか外枠から埋めていくから自然と評価が2辺ずつになるべ
でも1回当てはめても決定に使った信頼度をおいておいて後から補正するのも必要だと思うんだよね
>>151 俺もよく読んだら
Level2はないっぽいなw
この場合は一番相関のないもんを最後外側にもってくしかないから
内側からやるしかないな
うは!すごいいいアルゴリズム思いついた
この問題ってさ、実際使うときある? 前のモザイキングとかなら良くあるけど、完全にばらばらになっていて合体したい時ってあるかな?
156 :
デフォルトの名無しさん :2007/07/22(日) 22:01:49
俺も俺も!
ピースの並べ方のすべての組み合わせを作って、それを妖精さんにおかしいかおかしくないか判定してもらって おかしくなかったら完成
>>135 前スレ・前々スレでも出てる
いまさら「晒されちゃったか」も無いだろ
>>155 シュレッダーにかけられた書類の復元とか
>>159 全部スキャンしなくちゃいけないでそ?やらんだろう・・・
そこは映画や海外ドラマっぽくデジカメかビデオで撮影したのをリアルタイムに いちいち分割線のアニメーション効果いれて効果音もそれっぽく
>>155 航空写真の接続とか。
パノラマ系画像の接続とか。
>>160 シュタージの書類解読で実際にやってるらしい。
>>162 そういうのは予め座標情報と関連づけされてるだろ。
>>162 それはだからモザイキングだろ?共通部分が必要。
今回のは共通部分がない。ジグソーパズル。
>>164 されねーよ。
>>163 やるのか・・・。手でスキャンするぐらいならその場で人間がつなげたほうが早そうだけどな・・・。
シュレッダー自動スキャナーでもあるんかね。
とりあえずこの処理なら画像をN分の1にして処理しても結果は変わらないと思うから 可能な限り縮小してから処理してもいいと思うよ(速度アップ)
167 :
デフォルトの名無しさん :2007/07/23(月) 07:19:52
なんか面白そうだからやる これでいいじゃん
168 :
デフォルトの名無しさん :2007/07/23(月) 11:24:33
とりあえずこの処理なら画像をN分の1にして処理しても結果は変わらないと思うから 可能な限り縮小してから処理してもいいと思うよ(速度アップ)
169 :
デフォルトの名無しさん :2007/07/23(月) 11:28:05
1ドットしか違わないピースが有ったらどうするんだ
170 :
デフォルトの名無しさん :2007/07/23(月) 11:29:09
全く同じピースがあったらどうするの?
審査は、サンプルで示した写真のように建築物や風景写真を複数枚用いて行います。
>>169 無視しておk
まあ、それを判断するかどうかは後で決めるとして
ぴったりもんがあってから考えりゃいい話だと思わん?
少なくともそれ以外は適用できるんだし問題ないよね?
>>171 その仕様なら全然余裕だな>N分の1
16分の1ぐらいにはできるな
>>173 課題の仕様では1ピースあたり120×120画素だから16分の1だと8×8になるが大丈夫か?
>>174 16分の1で判断つかなかないものに対して8分の1で判断しろよ
別に速度を追求するコンテストじゃないんだからそんな縮小にこだわるなよ
ピースの判断もあらかじめハッシュを作っておかないと無駄処理が多くなるな 例えば辺の色を調べるにしても傾向順(詳細は不明)に並べとけばはずれたもんに関してはチェックしなくていいわけだし なんの要素でどうソートしておくかもキモだな アルゴリズム自体はウンコでも最適化で突っ切るってアリかな?w 正直、色(色々w)、エッジ(縦横別)なんかの連続性みるぐらいしか思いつかんけど
>>177 強引に突っ切る手が使えるw
仕事でも結構やるw
特に検出系はよほど特殊でない限り解像度をフルで使うことなんてまずない
180 :
デフォルトの名無しさん :2007/07/23(月) 12:30:13
bmpファイルのディザ法について質問ですけど・・・ 周りの画像に影響を及ぼすディザ法(条件付決定法とか誤差配分法)をする場合、 元画像に対して左上から右下に向かって処理を行わなければならないのでしょうか? というのは、画像データは左から右へ、下から上の順で格納されていますが 画像データを順に読み取っていくと、どうしても元画像に対して左下からになってしまい 元画像を垂直に反転した状態の画像に対して、ディザ処理を行っしまうと思います・・・。 一般的には、このように行うものなのでしょうか? それとも、画像データを読み込む際に、何か工夫して 元画像に対して左上から処理を行わせていくべきなのでしょうか? 分かりにくい文章ですいませんが、よろしくおねがいします・・・
同じ画像を上下反転したので試せばわかる事
>>170 人間にも判断がつかないものは無理
そんなエスパーアルゴリズムできるわけない
183 :
88 :2007/07/23(月) 14:41:54
GIF話、盛り上がったけど
ライブラリの話が出てない件(´д`;)
>>94 仕事で必要になってしまった。
コマンドで繋ぐほうが使い勝手良くね?
ImageMagickとかでいいんじゃね?
>>182 いや、そういう問題じゃないだろ (^^;
お前らの画像処理は低レベルだな
ここで、188が高レベルの自作プログラムを披露!
フーリエ変換がよくわかりません。 どのような処理をするのか・・・とか、わかりやすく教えてください。 過去ログにはこの内容は見当たらなかったし、ネットで調べても難しいこと しか書いてなかったので困ってしまって、ワンワンワワン... あと、ノイズの入った画像をフーリエ変換し、ノイズの除去された画像と、 スペクトル画像を出力するプログラムがあるのですが、 このスペクトル画像と言うのは何ですか? よろしくご指導おながいします。
ふざけてるの?
192 :
デフォルトの名無しさん :2007/07/23(月) 21:30:23
ワンワンワワン...
>>190 フーリエの冒険を読め。
それでも分からなかったら、あきらめろ。
ついでに「冗談でしょうファインマンさん」もお願いします
11111111111111111 22222222222222222 33333333333333333 44444444444444444 ←こういうグラフィックを 55555555555555555 66666666666666666 --------------------------------------------------- 11111111111111111 22222222222222222 33333333333333333 と に分離したり 44444444444444444 55555555555555555 66666666666666666 --------------------------------------------------- 22222222222222222 11111111111111111 44444444444444444 ←このように 33333333333333333 入れ替えたりする処理を 66666666666666666 55555555555555555 --------------------------------------------------- VB2005を使い高速でやりたいのですが、何か良い方法は無いでしょうか? DrawImageを使って、1ラインずつ取得、1ラインずつ描画、 というようにやってみたんですが、ライン数が多いと描画が遅いのです。
マスクつかえ
イメージをBitmapに変換して、自前でゴニョゴニョすればええよ
確かにマスク使えば一気に描画できるな
>>197 はマスク処理に関して調べているだろうか・・・
>マスク 初めて聞く処理です。それでやってみます。 ありがとうございました。
おまえら、マジで低レベルだな
低レベルすいまん。 高レベルなの教えくだい。
俺も中学生の頃はマスクの意味が分からなかった。 処理自体が何をやってるのかは理解出来たんだけど、 何でそれをマスクと呼ぶのかが謎だった。 当時はマスクと言ったら筋肉マスクしか思い浮かば なかったからなあ。
美術部や模型同好会ならマスキングテープ使うから、すぐ理解できるに違いないて
マスクメロン……アレは違うか。
207 :
デフォルトの名無しさん :2007/07/24(火) 21:16:46
顔検出のスレが見つからないけど、どこですか? ここじゃないよね。
ここでもいいよ
質問です。 顔検出のアルゴリズムについて説明してください。
そういうのは質問とはいわないと思う
>>209 人間の目は点が3つあったら人の顔と認識するというから
とにかく3点を探して見つかったら「顔」と判断します。以上。
∵
たしかに、人間の形態認識ってそんなんだから、心霊写真で似非宗教家の懐を潤すことになるんだよな。 逆に言うと、顔検出のアルゴリズムを使って、心霊写真を作り出すフィルタでも作ったら そういった奴らを釣れておもしろいかもしんない。
214 :
デフォルトの名無しさん :2007/07/25(水) 03:42:12
レベル低くて、寒すぎるwww
温暖化防止に努めてんの。
>>214 じゃあレベル高いレスだけニューラルネットワークでも使って、抽出して、
以後レスされる内容も学習器より予測させて、各レベル別に閲覧できる2chプログラムでも書いてくれや
>>211 3つの点を認識する方法をもう少し詳しくお願いします。
そ、そうくるか・・・
219 :
デフォルトの名無しさん :2007/07/25(水) 22:13:31
>マスク だめでした。 透過色を指定しなくてはならないので、 写真には不向きです。
最近はカメラとかビデオにそういう機能ついてるね 探せば論文位ありそうだけど
LockBitsとMarshal.Copy使え
225 :
デフォルトの名無しさん :2007/07/26(木) 07:29:41
SVMもニューラルネットも似たようなもんだが?
>>222 なんでBitBltが使えねぇんだよw
調べた結果BitBltの仕様が変わって使えなくなったって言ってる?
それと、自分で理解してコード書いた上で駄目だったって言ってる?
単にサンプル動かしたら動かなかったってだけ?
>>226 VB.netだと描画まわりがGDI+だからじゃね?
まあしち面倒くさいことすれば使えなくもないが阿呆らしいから普通使わない。
228 :
デフォルトの名無しさん :2007/07/26(木) 16:50:34
某大学の研究室に所属したばかりのペーペーです 画像処理やってます 今度自分の研究内容を10分間プレゼンすることになりました、プレゼンなど一度も経験無いんでアドバイスください 今のとここのようにしようと思ってますがどうでしょうか?↓ プレゼン表題→目次→目的(入力と出力がどうなるか)→ どうやって実現するか(使用した言語・ツールはなにか)→ 実際にこれまで作ったプログラムを表示・軽く説明→問題点とこれから→終わり? 10分もかからない?かもしれません・・。アドバイスお願いします ちなみにプログラムはまだ未完成なので実行結果を表示はまだできません。
いくら画像処理研究してるとはいえ、 プレゼンのやり方は、さすがに板違いだろ・・・
>>228 院生の先輩などにアドバイスをもらいましょう。
231 :
デフォルトの名無しさん :2007/07/26(木) 17:57:48
Fランカーと予想
>>227 そうかぁ?
MaskBltとかあるみたいだぞ?
なんか調べて無いだけの予感
234 :
デフォルトの名無しさん :2007/07/26(木) 21:26:59
専門は画像処理=無脳
>>233 フラウンフォーファ研究所ってmp3のあそこか
色んなことやってるんだな
237 :
デフォルトの名無しさん :2007/07/27(金) 07:53:58
日本だとNTT研みたいなの? それとも産総研みたいなの?
239 :
デフォルトの名無しさん :2007/07/27(金) 10:05:00
電総研のイメージに近いね
アナハイム・エレクトロニクスみたいだな
>>233 >64GB
確認したら64TBだったw
裁断片をスキャンする専用スキャナも開発したのかなぁ
243 :
デフォルトの名無しさん :2007/07/27(金) 11:41:19
1ピース毎に表にしてからスキャンしてたのかな? 両面書いてあったらどうするんだろう?
ここの住民は特にレベルが低い
うるせえわ暇人が
246 :
デフォルトの名無しさん :2007/07/27(金) 21:59:38
.NET Framework 3.0のBitmapSourceクラスを使うようになって、 もう画像入出力はこれで十分だなって感じ。 HD Photoで浮動小数点画像も入出力できて便利だ。
今までRGB8Bitづつあれば十分だろと思ってたら sRGBだのxvYCCだの出てきてやる気が萎えてきた 面倒臭ぇぇ
つくづく、レベルの低いスレだ。
だれか、
>>247 の質問に答えてやれよ。
>>247 はちょっとはググレ。分かっていれば、あほらしい質問だ。
ただの愚痴だろ。
>>248 計算途中の話じゃないの? 好意的、というか普通に解釈すれば。
デフォでsRGBですよね すでにsRGBを使ってるのに sRGBが出てきたって悩んでるのが変です
253 :
247 :2007/07/27(金) 23:37:46
今さらscRGBと間違えたなんて言えないぜ
254 :
デフォルトの名無しさん :2007/07/27(金) 23:56:17
大雑把だがまとめると、 RGB(線形空間)にガンマをかけたものがsRGB(非線形空間)だった。 これを色空間を拡張する際、 RGB(線形空間)の定義域0〜1を、線形空間で−∞〜+∞に拡張したのがscRGB。 ガンマから開放されたきれいな線形空間が特徴。 sRGBと同じガンマ関数で0〜+∞で使い、−∞〜0はそのガンマ関数を0で折り返したような 関数を使って、sRGB(非線形空間)を−∞〜+∞に拡張したのがxvYCC。 sRGBとは0〜1で互換性があるのが特徴。
ほんま暇やな
起きてすぐに他人の暇っぷりを観察してる奴が一番暇そうに見える が、最高に暇なのは俺だ
いや最高に暇なのは俺だ
俺のほうがもっと暇だよ
259 :
デフォルトの名無しさん :2007/07/28(土) 13:28:22
このスレ、クズ人間しかいないわ エロ画像のマスクをはずしてオナニーでもしてろ
そんなに誉めるなよ
むしろ今はエロ画像にマスク付けてオナニーしてるよ
おお!君もマスクフェチですか! こんなスレで同志に出遭えるとは思いませんでした。 お気に入りのマスクについて語り合いましょう。
ビット単位で並び替える系の奴が好きだ。 簡単に独自のを作れるし、波ガラス見たいでちょっと綺麗
俺は花粉症用の三角形ぽいマスクがブラジャーみたいで好き
265 :
デフォルトの名無しさん :2007/07/28(土) 23:44:55
ロジックパズルを写真で取り込んでパソコン上で解けるようにしたいんですが。 ↑はマス目と数字だけ読み取れればいいのですが、何かお勧めの参考書やサイトなど ありましたら教えてください。
例えば少年サンデーのきゃらろじでも解きたいのだろうよ。
>>265 参考にするならQRコード(やその他バーコード)の検出部分とかどう
>>266 すいません。画像のUpの仕方がわかりません。イラストロジック、ピクロスとか言う
名前なら分かりますか?
>>267 サンデーに付いてるのは知りませんでした。
自力で解くのは別に出来ます。同じ問題をもう一度やりたい時とか失敗した時が面倒
なので、取り込んで使えれば楽だなと思ったんです。
>>268 調べてみます。バーコードなら理解できそうな?
塗り潰しのUIと自動で解く部分は出来てるんですよ。ただ問題を手打ちしてるので
一問に30分〜2時間程度掛かるのが・・・
こういうものを組んだ事がないので、調べても何をしてるか良く理解できないんです。
>>269 数字だけなら、それほど精度も必要ないだろうし、
数字のパターン用意して、画像を二値化して比較するだけでいけそうだけど?
271 :
269 :2007/07/29(日) 12:03:59
>>270 元々が白黒に近いので二値化するのは問題ないんですが、
例えば直線を認識させるのに、ベクトルを使うといい(この辺は未だ何とか分かる)とか
言うんですが、ドット欠けや誤差の扱いなどの曖昧さの部分が全く理解できません。
元の数字のパターンを回転、拡大縮小などして、何割で一致とかするんですか?
(DSの頭の体操をやらせて貰った事あるんですが、あれはかなり斜めに書いても認識
してくれますね。横倒しに書いたら×でしたけど)
>>271 > ドット欠けや誤差の扱いなどの曖昧さの部分が全く理解できません。
この辺は補間とか適当にやればいけると思うけどね。
> 元の数字のパターンを回転、拡大縮小などして、何割で一致とかするんですか?
たぶん、写真で撮った画像の方を回転したりする方が楽だと思う。
とりあえずやってみるのが良いと思うよ。
やってみて上手くいかないところを質問するほうが、答えるほうも答えやすいし。
>>271 数字だと構造的な認識でもいけるが、ここでは辞書パターンとのマッチングによる認識について。
1 ドット欠けのような雑音、線幅、文字の傾き等に影響されない特徴を抽出
大きさや縦横比は正方形等に正規化すれば影響なくなる。
たとえば細線化すれば線幅は影響しなくなる
ある程度の面積の正方形内の特徴をまとめれば、多少のストロークずれやドット欠けは吸収できる。
平滑化もよろし。
傾きは難しいが、面倒だったら別パターンとして認識したあと「傾いた1」も「1」にすればよし。
4などフォントによっては大きな差がある場合も同様。
2 代表的フォントについて、上記の特徴の主成分分析(面倒だったら平均w)
辞書パターンを作る
3 入力文字画像について、同じアルゴリズムで特徴を求めて辞書とマッチング。最も距離の近いものを正解とする。
274 :
269 :2007/07/29(日) 13:19:00
>>272 >>273 了解しました。まずはデジカメの電池を買ってきますw
自分が考えていたのは、入力時に四隅をチェックさせれば傾き(とマスのサイズ)が
分かるので少し楽になるかな、と思ったんですが、普通そんな手間かけさせませんしね・・・
いや、25x25のノノグラムの入力するのに数分で済むだろ。
276 :
269 :2007/07/29(日) 13:53:22
>>275 それ位ならものの数分で済みますけど、どちらかといえばパソコン上で解いたりやり直し
したい問題と言うのは40*50とかそれ以上なんで。
打ち込んだ最大は150*70・・・打ちミスあったら泣けます(チェックサム位しかしてないので)
画像の縦と横方向それぞれで濃度の合計を求めると 罫線のあるせいで櫛状のグラフになる(線が多少途切れてても) これを使えば画像の傾きやらマスの間隔やらは一発じゃないだろうか?
>>277 合体した画像がはじめにあるわけじゃないぞ
あなたと合体したい・・・
一万と二千年前から画像処理
282 :
277 :2007/07/30(月) 01:23:41
傾きはどうやって補正すればいいの?
284 :
277 :2007/07/30(月) 03:23:53
処理的にシンプルなのは「少しずつ回転して同じ処理を行って 出力の分散が最も大きくなる角度を傾きの最も少ない角度とする」とか
串状を期待すると、斜め45度のときに・・・どうなるんだ?
286 :
269 :2007/07/30(月) 04:22:16
もう眠りたいw 楽に行くなら、あまりに斜度の大きなものは弾いてしまえばいいんですけど。 正確にやるならz面の傾きも必要だし(カメラ撮りならなおさらですし) (こちらから質問するのはまだまだ先みたいです。画像認識、難しすぎます・・)
本来矩形の筈の領域が(任意の)四角形になっているだけなら、 普通に四角形の頂点を取得して矩形に変換すればよくないか?
288 :
277 :2007/07/30(月) 05:21:30
>>285 櫛からタワシになった
今まで気づかなかったけど、雑誌を撮るということは被写体が既に曲面になってそうだなあ
方眼紙ということで補正には最高に都合いいんだろうけど…
289 :
269 :2007/07/30(月) 14:52:18
>>282 を使って、マスの間隔と個数を入手。
適当なQ値の範囲で、ある交点の位置を取得。
ハフ変換などの線抽出で傾きを獲得。範囲は上のQ値の幅?
>>277 さんの方法でこれから組んでみます
>>282 この画像の「14」の1は升目の線分と重なってて嫌だな
>>290 輪郭追跡とかで枠を検出して内側を切り出せばなんとかなりそうだが
292 :
269 :2007/08/01(水) 12:12:25
回転と櫛状のピーク取り出しでとりあえずマス目の抽出は完了(要調整)
後は数字なんですが、本業が忙しくなって暇がなくなってきました・・・
>>290 ,
>>291 これを取り扱った論文(卒論?)では線と数字を切り離してやってました。(イントロしか読めないorz)
やっぱり切り出すかしないと処理しにくいですね。
あの程度の升目だと20なんて無いから,升目の真ん中に空白があれば それは確実に10代だから、右側を判別するだけでいいよな。
>>292 ocrad(gnu)使って
>>277 の画像から数字を取得してみた
(枠内の切り抜きとpgm化は手作業)
一応、それなりに取れるみたいだ
まあ画質がアレなので参考になるかも分からんがw
295 :
デフォルトの名無しさん :2007/08/03(金) 13:00:42
金谷センセってエキセントリックだなー 業績はすごいと思うけど
296 :
デフォルトの名無しさん :2007/08/03(金) 15:54:10
297 :
デフォルトの名無しさん :2007/08/04(土) 13:44:37
なんだい。どんな高度な議論が展開されてるんだろうと思って来てみたが、 こりゃとんだクソスレだわw
_________________ | | | | ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄| | ̄ ̄ ̄| | | | | | B | | | | | |___| | | | A | | | | | | ̄ ̄ ̄| | | | | | C | | | |___________| |___| | | |  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ピクチャーボックスBとCの画像を、合成してAに表示させたいのですが、 BとCを非表示にすると、正常に表示されなくなってしまいます。 昔のVBでは非表示でも出来ましたよね?
そういうのは画像処理じゃなくね?
>>298 スレ違いも甚だしいが、可哀想なのでレスつけてやると
ドキュメントとビューを分離して設計しなおせ
>>298 VBじゃこの辺?つ[AutoRedraw][Refresh]
画像処理ですよ。スレ違いでもないです。 これが画像処理じゃないというのは、 「ファミコンのドット絵はコンピュータグラフィックスじゃない」と言ってるようなものです。
>>1 >・初学者の質問に対してやさしく(的を外れた)解答を与える
これを見落としてました。すいません。
そういうことですか。
なんだ荒らしかよ失せろ
嵐じゃないです。 もっとマジメなスレかと思っていたので・・。 初心者をバカにして楽しむスレだとは思いませんでした。
ドット絵はもちろんコンピューターグラフィックスだけど、 だからといってCG(コンピューターグラフィックス)専門板で質問したら スレ違いだと言われるだろうね。
誰がバカにして楽しんでるんだろう
なんだ、ただのアスペルか。 次の方どうぞー
なんという沸点の低さ
VB質問スレに行けばいいんじゃないかな?
どうみても荒らしです
荒らしではないけど「場違い」というやつだな。
っていうかVB 2005って何
まあ間違いなく荒らしだな VB2005とVBの画像関係のプロパティもメソッドも全く違う そもそも画像を合成表示できているかどうかもさえ怪しい
つか、ここは画像処理スレなのに、 なんでVBのGUIの話を持ち出すんだっての
レベルが低いからスレ違いってのもひどいだろ。
元画像:input.jpg 変換後:output.jpg スクリーン処理をするためにかぶせるマスク用画像:screen.jpg # ここで、screen.jpg は、#FF0000 などの、モノカラーベタの画像だと思って下さい。 さて、ImageMagick で、 $ convert ./input.jpg -scale 400x300 -colorspace GRAY -compose screen ./screen.jpg -composite ./output.jpg などとやってみても、上記の一行では、モノカラーベタ画像によるスクリーンが実現されません。 $ convert ./input.jpg -scale 400x300 -colorspace GRAY ./temp.jpg $ convert ./temp.jpg -compose screen ./screen.jpg -composite ./output.jpg などと二回に分ければ、モノカラーベタ画像によるスクリーン処理を施した、望みの画像を得ることができます。 これは Linux でも MacOSX でも試しましたが、どちらも同じ結果です。 なんとか、一気に一行で処理してしまう書き方というのはないのでしょうか?
ソフトの使い方はソフトウェア板っぽいけどなぁ ;で区切ればいいって話では無いのか
バカバカシイ
このスレで扱うのは主に画像処理のアルゴリズム、理論です。
326 :
デフォルトの名無しさん :2007/08/05(日) 08:04:43
夏だな
HD Photo実装してみた人ってどのくらい居る?
>>322-326 うわっ!すみません。ImageMagickスレを探して、ないなぁと思ったので、
スレタイの「画像処理」を読んで何も考えずにポストしてしまいました。
>>321 1行で書きたいだけならtemp.jpgをjpg:-にしてパイプ
330 :
デフォルトの名無しさん :2007/08/05(日) 17:16:43
つθ゛
>332 お察しの通りIEEEの論文にアクセスしない人です 英語とかドイツ語とかよくわかりません matlabですか、、、この夏に講座があったのに蹴ってしまった orz 金属の表面を光学顕微鏡で撮影するのですが、どーしてもノイズが乗って それを排除したくてプログラムを書いてました おもしろそうなので、論文とか探してみますね
336 :
デフォルトの名無しさん :2007/08/08(水) 11:01:55
最近はmatlabでちょちょっとやるんだね 以前はcでごりごり書いてたのに
画像の色の境界線を ベクトルで取得するアルゴリズムって何かありますか?
338 :
デフォルトの名無しさん :2007/08/09(木) 20:02:26
? 無理
potraceのソースでも読んどけ
ラスべク変換って ラスターベクトル変換か
341 :
デフォルトの名無しさん :2007/08/10(金) 17:40:58
まず日本語を覚えろよ、と言いたい
べとベが微妙に違うなw
>>338 あなたの能力だと無理なんでしょ?
無理にレスしなくていいよ
>>339 そのキーワードでぐぐって、
出てきた用語をさらにぐぐってると
関連書籍見つかりました。
ありがとうございます。
>>341 ageんなボケ
>>342 w
344 :
デフォルトの名無しさん :2007/08/10(金) 19:11:20
age
345 :
デフォルトの名無しさん :2007/08/10(金) 22:47:11
ビットマップファイルの2枚の画像を重ね合わせて新しい画像を出力する プログラムをC言語で作成したいのですが分かりやすく説明されたサイト などないでしょうか? どなたか知っていたらお願いします。
Cの初歩程度で自ずと分かりそうなもんだが
ageんなボケ
348 :
デフォルトの名無しさん :2007/08/10(金) 23:26:05
あげ
>>345 「ビットマップファイルの2枚の画像を重ね合わせて新しい画像を出力する」
なんていう限定された方法を説明したサイトは知らないが、
何を知りたいんだ?
・ビットマップファイルをメモリに読み込む方法
・メモリ上のバイナリデータを用いて重ね合わせ処理をする方法
など具体的に挙げた方が、良いサイト紹介してもらえるかもよ。
>>349 それ以前に、「重ね合わせる」方法が指定されていないので、どうにもならんだろう。
ゲームのキャラと背景を重ねたいだけだったりして
352 :
デフォルトの名無しさん :2007/08/11(土) 01:58:57
なつだなー
>>351 それだったら本屋に行けば資料あるから、回答不要だな
本すらいらねー。
厨クンが、「背景」と「手前の絵」の重ね合わせをしたいとするなら… と、マジレスしようかと思ったんだが、やめた 初心者スレに行って聞いたら、みんなもっとやさしい
356 :
デフォルトの名無しさん :2007/08/13(月) 03:53:19
ここは初心者スレじゃなかったのか。 どうりでみんな冷たいとおもった。
>>356 「重ね合わせる」方法について呈示されてないから
まじめにレスしても無駄だと判断してるんだけど
ある植物の写真から その名前あるいは種類とかを調べて 出力するようなプログラムを作りたいのですが どんな所から手を付ければよいでしょうか
>>359 中学校辺りから基礎学力を身に付け直すところから始めるといいと思います。
>>359 一生かかるだろうから長生き出来るように健康作りから始めてみてはどうかと思います。
>>359 特許公報で、図鑑関連の類似画像検索がいくつかあった気がする。
検索してから考え直せば?
>>359 とりあえず、データベースの勉強は必要かな。
>>359 まず植物をどんな特徴によって判別するかを考える必要がある
俺が昔見た文献では、
1.花びらの数
2.花びらの色
3.葉&花びらの直径
4.葉&花びらの円形度
5.その他の形状特徴
などによって植物の判別を行うというようなことが書いてあった
基本的には上記の特徴抽出を如何にして正確に処理するかだと思う
これらの処理をするためにまず必要なのはセグメンテーションで、
セグメンテーションさえできれば後は切り出してきたものに対して
特徴抽出を行っていけばいいということになる
しかしはっきり言って正確にセグメンテーションするのが一番難しい
プロでもあっさり間違えるんだ、巧くいったら一財産築けるよ。 ふと思ったのだけど、まさか>359は写真に写っている名札を判断する積もりじゃないよねw
>>365 ワロタ
植木の名札を認識してOCRするプログラムなら面白いかも
364の各項目をプルダウンで選んでいけば、 目的のものにたどり着くというデータベースを作るのが先かな。 これだけで、かなり役立つものになるはず。 その後、写真から各項目を抽出するアルゴリズムを徐々に作り上げていく。
368 :
デフォルトの名無しさん :2007/08/16(木) 17:03:07
はじめまして. 現在,2値画像に対して対象部分(白)の面積が 一番大きいものを取り出したいと考えています. そこで,ラベリング処理を用いたいと考えているのですが, CQ出版の「デジタル画像処理の基礎と応用」の本に 載っているラベリング処理を参考にしています. しかし,うまく動作しません. C#.NET 2003を使用しています. 同じような経験をされた方,いらっしゃいませんでしょうか?
そんな事聞いてどうするんだ
370 :
デフォルトの名無しさん :2007/08/16(木) 17:32:04
エラーを解決したいのですが・・・
うまく動作しない経験なんて全員あるよ。 はい、次の方どうぞ。
>うまく動作しません. ずっと昔から、質問系の記述でこのセンテンスを見るたびに、誰かがプログラマを引っかけようと している釣りなのではないかと思えて仕方がない。 あれほどあらゆる場所で叩かれ続けているんだから、いまだに技術系の質問でこんな言葉を まじめに使うやつがいるとはとうてい思えないんだが、汚れてしまったのだろうか。
未だも何も 初心者の多くがとおる道だ 生暖かく見守ってあげよう
374 :
デフォルトの名無しさん :2007/08/16(木) 18:00:58
CQ出版の本は全て地雷
地雷源を踏み越えて強くなるのさ
プログラムの方に責任がありそうだったら著者か出版社にメール送って聞いてみたら? 3000部くらいしか刷っていないだろうから親切に答えてくれるよ、きっと。
>>372 >>373 技術系とか初心者とか以前の問題
俺はこういうのを見ると、
本気で解決する意欲が無いor頭の中がかわいそうな人だと思うことにしてる
「何が分からないのかが分かっていない」ことをまだ分かってない段階なんだろうな。
382 :
デフォルトの名無しさん :2007/08/16(木) 20:42:07
お前ら368に答えてやれよ。。。 >同じような経験をされた方,いらっしゃいませんでしょうか? 誰かいる? 俺はそういう経験無い
どういう状態が「うまく動いている」のかを述べよ 話はそれから
俺は、その本を読んだことがないな。
本は持っていないが、暇なんで著者名で検索してみた。 同時期に同じ著者が別の出版社から出した「画像処理とパターン認識入門」のラベリングと 同じソースなのかな?ラベリング前後の目次は非常に似ている。同じなら森北出版のHPか らソースをダウンロードして見てやるよ(本日寝るまで限定)。 しかし、掛け持ちで同じような本を出して大丈夫なのかね?
>>378 「何が分からないのかが分かっていない」状態はまあ仕方がないとも言えるが、
まともな思考の出来るやつなら「その質問ではまともな回答が得られない」ということは分かるはず
>>382 こんな回答でどうかな
「CQ出版の『デジタル画像処理の基礎と応用』の本に載っているラベリング処理を参考にして、
(C# .NET 2003で)プログラムを組んだが、うまく動作しなかった」
という経験は俺にはない
387 :
386 :2007/08/16(木) 22:31:35
>>368 >>386 だけだとただの煽りなのでまじめに回答すると
そもそも、その本を持っているor読んだことがある人はあまりいないだろうから、
該当箇所のアルゴリズム(ソースでも可)を提示しないことには話にならない
「うまく動かない」といってもいろいろあるから、どういう状況かくらいは説明しないと回答しようがない
(何がどういう風にうまく動かないのか、どういう症状が出るかなど)
>>368 の人気に嫉妬・・・
はさておいて、これって、複数枚の2値画像があって、各画像の画素が
1または0の個数を数えて、0または1が一番多い画像を見つけるってこと?
それとも1枚の2値画像のなかで、もっとも0または1の面積が広い閉じた部分を
見つけるってこと?
390 :
385 :2007/08/17(金) 00:38:45
眠くなってきたので森北版のソースのラベリングのところだけ追いかけてみた。 すぐ気が付くがラベリングプログラムには境界処理が無くて、画像の外縁にbit1の 画素が無いことを前提としている点が気になった。アルゴリズムはなんだか遅そう。 メモリも馬鹿食い。 全ての問題は、プログラムやアルゴリズムの分かりやすさを優先したために生じ たものだと思う。実用性は無い。 寝る。
森北版て何
northwood?
北森の間違い?
略称使い慣れてないんだったら無理に使おうとしないでいいよw
398 :
デフォルトの名無しさん :2007/08/17(金) 13:04:30
ワロタ
401 :
デフォルトの名無しさん :2007/08/17(金) 18:47:14
本のプログラムは実行すると 'System.IndexOutOfRangeException' のハンドルされていない例外が WindowsApplication2.exe で発生しました。 追加情報 : インデックスが配列の境界外です。 case 7: //左下を調査 i2 = i1 - 1; j2 = j1 + 1; if( f[i2, j2] == 1) code = 5; else code = 0; break;
低脳児のあつまり
403 :
デフォルトの名無しさん :2007/08/17(金) 18:52:12
おちんちん
404 :
デフォルトの名無しさん :2007/08/17(金) 18:52:37
追記 if文のとこが問題点 境界線追跡と同時にラベリング(8連結) f[,]は2値画像の対象部分を1 それ以外を0としている 対象部分だったら8連結でみていく
mathematicaでやれ
>>401 >>390 の指摘通りだとする。
今左下端の画素にいるとi1は0、j1はheight-1だよね。境界処理なしだと、
つぎはf[-1,height]を調べることになるがいいのかな?
本も無いのにアドバイスするのは疲れる。
モザイクって内部的にはどういう処理になってるの?
モザイクといっても処理はいっぱい種類があるけど たとえばモザイクをかける領域を格子状に分けて 各格子内の全ての画素を元の画素の平均値にするとか
>409のような情報量を落とす処理ではなく色を替えるフィルターを通してモザイクと言い張るケースがある。 これは、せこいことに色変換フィルターをデモして「ほれこの通り再現できる」と称してフィルターを売りつけるのが目的である。
買ったことはありませんがそのフィルタには時々お世話になってます
私も一時期は大変お世話になってました^^
おいらもお世話になりたいです^^
原理的に有り得ないの分かってても 広告の文章読むと出来るような気がしてくるのは 期待が大きいから?釣られてる?
モザイク除去は定期的に話題になるなw 複数のフレームから情報集めればそれなりのはできる
416 :
デフォルトの名無しさん :2007/08/23(木) 10:02:24
フレーム変わっても固定していたら難しくね?
超解像ですな。
>>415 漏れが画像処理に興味を持ったきっかけはそれだということは否定出来ない事実だからな
>>419 残念だがそれは違う。
全て私の仕業だ。
お前ら仲良いな
嫉妬ですか
べっ別にそんなんじゃないんだから!
4*2=8
前に話題になってたPRMUコンテストだけど、このスレで誰か入賞とかできたの?
430 :
デフォルトの名無しさん :2007/08/25(土) 09:58:34
画像処理で博士号とってしばらく別の研究してたから 久々に画像処理しようかと参加を考えてたけど 過去の入賞者を見たら学生さんばっかりだったので辞めた
なんで?
432 :
デフォルトの名無しさん :2007/08/25(土) 11:15:15
研究者のたまごや課題の一環でやってるコンテストにしゃしゃり出ていってもしょうがないな、って思って
別にいいんでは?
遠慮せず恥かいてこい
2chグループで出してみる?
大学に所属していなくてもいいのかな?
438 :
デフォルトの名無しさん :2007/08/26(日) 01:18:25
質問ですが、VBAでBMPの輝度値を読み込ませる方法って無いんでしょうか? 知っておられる方がおりましたらぜひ教えてください。 どうしてもVBAで処理したいんで・・・
ありますよ
directshowで動画像処理を行っています。 フレームを1枚づつ画像に切り出しはできたのですが取得した フレームがIフレーム位置かどうか調べる方法がわかりません。 (Iフレーム情報を使ってB,Pフレームを高画質化しようと思ってます) ご存知の方いれば教えてください。
>>440 輝度値とは、画素ごとの明るさのことです。
テレビを近くで見たら赤・緑・青の並びがありますが、その明るさのようなものです。
>>441 ありがとうございます。
ただVBAだと、できるかどうか怪しいですね。とりあえず試してみます。
>ただVBAだと、できるかどうか怪しいですね。 できます
>>443 >輝度値とは、画素ごとの明るさのことです
ぶぶー
それは濃度
無知発見
動画エンコの話って画像処理とは微妙に違うような
どこが違うの
特定APIのプログラミング・テクニックにすぎない点
動画エンコ=特定APIのプログラミング・テクニック?
directshowつってんじゃん
誰が?
自分の考えを正確に相手に伝えることもできない奴が多すぎる
454 :
デフォルトの名無しさん :2007/08/26(日) 20:59:27
457 :
デフォルトの名無しさん :2007/08/26(日) 21:50:45
自前でエンコ書いたら画像処理じゃん エンコの前処理でノイズ取るのも画像処理じゃん
自前で書ける奴はこんなとここねえ罠
なんで?
研究とかで忙しいからだろ
忙しかったら来ないってなにそれ 四六時中研究してる奴しかいないの?自前で書く人って
研究か仕事で他でいちいち見ないとかそんな所だろ こんな所より論文みた方が早いしな
すくなくとも
>>442 は
デコの話であってエンコの話ではない件
USBとかのカメラの動画入力で、画像に動きがあったらそれをトリガにして 録画を開始したいと考えてます。既にこういう技術はあると思いますが、 なんていう名前でしょうか。 論文とかサンプルとか探す時に名前が判らなくて。
動画エンコの話って画像処理とは微妙に違うような
いや、録画はあくまでも結果的な目的であって、 この話は検出する技術とかの方です。
>464->466の話の噛み合わなさに笑った。
自己解決しまう
Motion Detection
>>464 位置検出とかかな
監視カメラではもう当たり前の技術
>>469 も書いてるけど
動体検出だった
すまそ
あと簡単に言うとグレイスケールか2値化したあと(しなくてもいいけど) 移動前の画像と移動後の画像のXORを取るだけでてっとり早くできる
ホログラムって何で立体的に見えるの?
475 :
デフォルトの名無しさん :2007/08/27(月) 09:33:06
gabor変換の人だよね
>>473 別に立体視を目的としないホログラムもあるんだけどな。
ゴンザレス3rd アマゾンで11,000円台と15.000円台を行ったり来たりしている。 ちょうど何かキャンペーンの境目なのかな。 もう一度11000円台プリーズ。
478 :
デフォルトの名無しさん :2007/08/28(火) 09:32:42
ゴンザレス? kwsk
あ、ちなみに俺はGonzalezじゃないから、著者乙とか言わないでね。
481 :
デフォルトの名無しさん :2007/08/28(火) 12:40:21
出版社乙
ホロってデータの欠損に強い面があるからな
ソフトウエアレンダリングで テクスチャ付ポリゴン(3角形でも4角形でもいい) 描画するアルゴリズムかソースか を掲載しているページって知りませんか?
484 :
デフォルトの名無しさん :2007/08/28(火) 14:38:49
本だったら見たことある
485 :
まこと :2007/08/28(火) 20:48:42
どなたか教えてください。ヘルスなどの女の子の写真の顔のモザイク消せませんか? どうしても見たいんですよ。モザイクて言うか顔が見えない処理してますよね。教えてください。
過去ログ読め
目を細めてください。
まじか
お○この写真をたくさん集めて主成分分析すれば下のモザイクにも適用できるな
おとこ
>488 これ一枚の絵から復元したの?すげえな
>>492 the help of a large collection of other high-resolution face images.
概要としては似たようなパーツを探して組み合わせるって感じかしら
495 :
デフォルトの名無しさん :2007/08/29(水) 07:07:58
local特徴とglobal特徴のMAP推定するみたいね 金出先生ってまだ生きてるのね
498 :
デフォルトの名無しさん :2007/08/29(水) 10:09:17
ここはレベル低いスレだけど、 時々面白い論文とかページが紹介されるので困るな
>>488 似たようなのCMUの金出先生がやってなかった?・・・・
と思ったら第一リファレンスか。そうか
しかし金出先生は大量データとか大量カメラとか簡単に追随できないものが多くて困る
資金も優秀な学生も使い放題だからなー
>>497 3番目くらいまでの固有ベクトルが何に対応しているのかは興味がある。
論文載せたら、わいせつ物頒布罪で学会誌摘発かな。
サンプリングが大変だな。
504 :
デフォルトの名無しさん :2007/08/30(木) 12:54:37
擬似かどうかも判定できるようになるのか?
エロゲに応用… は難しそうだな
最近中国人の論文が増えてる気がする
人海戦術は昔からじゃないかな
査読付きに受かるのもテクニック次第だからな。 内容なんて関係ねー。
509 :
デフォルトの名無しさん :2007/08/31(金) 07:43:16
俺がrejectしてるから安心しろ
510 :
デフォルトの名無しさん :2007/08/31(金) 09:04:12
画像自体のエフェクトの話じゃなくて済まないんだが、BMPのランレングス圧縮を自力でやってみた。 圧縮、展開、表示とうまくいくのでデータの整合性としては正しいと思うんだけど、圧縮結果の容量 がフォトショップで出力した画像より5〜8%程度大きい…。 何で差が出るのか画像の中を見てみたら、例えば AAAABCDEFGHHIJKKKLMNNNNNNN ↓ AAAA BCDEFGHHIJKKKLM NNNNNNN:フォトショップ AAAA BCDEFGHHIJ KKK LM NNNNNNN:俺プログラム みたいにフォトショはKKKなど三つ以上連続している場合も不連続領域に含めている感じだった。 おそらくそれで制御コードの容量の差が結果の大きさの違いになって現れたんじゃないかと。 ただ、機械的にやってるわけではなさそうで、単純に三つ以上連続している場合に不連続領域 を止めてるケースや、不連続の途中で(まだ続けられるのに)切ってることもある。 何が聞きたいかというと、容量的に最小になるアルゴリズムってあるのでしょうか? ってことです。 フォトショのBMPのランレングス圧縮はでかい画像に適用しても結構早いので、PNGの圧縮みたいに がんばって探してるふうでもなさそうなんで…。 ご存知の方いませんか?
フォトショがどうやっているかは知らないがviterbiトレリスを使えば 最適経路が求まるんじゃない?DPの一種だからそんなに遅くないし。
viterbiトレリス、DPでググってみます。どうもありがとう。
>510 最も原始的かつ確実なのは、実際に圧縮してみてサイズを比較、 そのご一番小さくなった方法で再圧縮、です。 全体でやってもいいし、全体があまりに巨大なとこきは、サンプルを適当に 取り出してやってもかまいません。
514 :
510 :2007/08/31(金) 10:43:14
>>513 総当りをする場合、どこを(繋がるけどあえて)切って、どこを(切れるんだけどあえて)繋げて、
っていう候補の一覧の作り方が難しいんです。強引に書いちゃうこともできるかもしれないけど・・・。
>514 よくわからないんだけど、一律のルールで、ある画像を圧縮するときの話なら、 そういう問題はでないから、画像の部分部分でランのルールを変えるという ことでしょうか。 それなら、単純に4096バイト単位とか、8192バイト単位とかで、同じことを やればいいんじゃないでしょうか。境界がランを含むなら拡張してもいいし。 なにか根本的に違うことを考えているのかな・・・
516 :
510 :2007/08/31(金) 11:59:44
>>515 >境界
圧縮の単位は行をまたぐことはしていません。行単位で考えています。
>一律のルール
一律のルール(例えば3バイト連続でも不連続とみなして切らない)を
行の最後まで適用すると、試してみたところ容量は増えてしまうだけでした。
なので1行の中でも、「この部分は3バイト連続だけど不連続とみなす」
「この部分は2バイトの連続がみつかったから切る」など、一律で無い
決定方法が要りそうです。
>516 同一の構造を持ったヘッダで、3個連続を残すとか3個連続は圧縮するとか考えてるんですか? ヘッダの構造をどうするかを決めるのに全体をそれぞれの形式で圧縮してみるという話ですよ>513 ヘッダ構造が同じなら、圧縮が利くランは全部圧縮するのが一番小さくなるに決まってます。
518 :
デフォルトの名無しさん :2007/08/31(金) 12:42:53
>>510 こっちはスレ違い。
圧縮の方で書きこんだらどうやるか教えてやる。
>>513 ,515,517
BMPのランレンクスフォーマットを使って10画素くらいの画像で脳内シミュレートしてみれ
自分の言っていることのアホさ加減が分かるだろう
520 :
デフォルトの名無しさん :2007/08/31(金) 14:00:48
3つ以上が出てくる度に 連続領域として処理したときのバイト数と 不連続領域として処理したときのバイト数を比較して 少ない方を選択すればいい なんでこんなに苦労してるの?
組み合わせ最適化問題だから
522 :
510 :2007/08/31(金) 16:18:14
523 :
デフォルトの名無しさん :2007/08/31(金) 17:10:00
524 :
510 :2007/08/31(金) 19:41:00
すまん。向こうでもスレ違いといわれて、あまりバタバタするのもどうかと思うので、
ここに報告しときます。
>>520 その方法ではうまく行かないもよう。問題点は三つ
・3が最適な数字かわからないので3456…と全部試す必要がある
・現時点の最適解が次回の最適解を無効にしてしまう可能性がある。
・総当りに近いので、変換時間がとてつもなく掛かってしまう。
それでもあえて実装して試したところ、多少は小さくなったんだけど、
フォトショの出力より、まだ2〜3%大きいという結果で終わってしまった…。
やはり総当りじゃなくて最短経路検索に近いことを考えないと、
少なくとも速度面で実用にならないっぽいです。
RLEだよな? 釣られてる?
>>510 ハフマンとか算術とか、他にもいろいろな方法があるから。
と突き放すのもどうかと思うんで暇だしマジレスしてやるが
※考えることを少なくするために、256色bitmapを想定する。つまりデータは8bit。
長さの表現に8bit使用するとすれば、圧縮するとき、圧縮フラグに1bit、長さ表現に8bit、データ表現に8bit使用するので
圧縮前の長さが17bitより多い場合に、圧縮できる。
そこで、3pixel以上連続で同じ色が並んでいるところを見つければ、そこを圧縮できる。
勿論、長さの表現を4〜5bitにしてみたり(可変は逆にスペース取るから難しい。)すればさらに縮む可能性もある。
但し、「圧縮したかどうか」を表現するために無圧縮の色1pixelあたり1bit余計に保存する必要があるため、完全に無圧縮だと
この場合1.125倍に膨れてしまう。
24bitカラーの場合圧縮できる可能性はもっと低くなるが、最悪でも1.042倍に膨れる程度である。
527 :
526 :2007/08/31(金) 21:07:01
で、3つ以上同じ値が出てくるときに圧縮できる可能性がある事は理解できたか?
>>510
528 :
デフォルトの名無しさん :2007/08/31(金) 21:08:42
そういう話じゃなくて、BMPにはRLE形式があるからそれのことだろう。
530 :
526 :2007/08/31(金) 21:22:50
>>529 それは知らなかった。
> 容量的に最小になるアルゴリズムってあるのでしょうか
容量を最小にすることだけが目的なら
適切な、完全な総当りをするのがいいんだろうが
俺ならこうする。
最も縮む所から折りたたんでいく。全て折りたたむか、或いはどこを折りたたんでも圧縮できなくなるまで。
絶対モードじゃね
532 :
510 :2007/08/31(金) 21:45:18
一応書いとくと、
>>531 指摘の通り、絶対モードを少し工夫することで、
真っ正直に圧縮するより多少容量が改善されるということ。
どうしてもフォトショの容量に勝てないのは、やはり先頭から見ていくだけのやり方では
>・現時点の最適解が次回の最適解を無効にしてしまう可能性がある。
これがあるからだと思う・・・。
実例を考えてみた。RLE8ね。コード化モード=ランレングス、絶対モード=バイトコピー。
フォーマットは
http://homepage2.nifty.com/tsugu/sotuken/ronbun/sec3-1.html で勉強した。
----------------------------------------------------
12画素のカラーインデックスが
01 02 03 04 04 04 05 06 07 08 08 08
の場合。最初の6画素に"|"区切り
00 0c 01 02 03 04 04 04|05 06 07 08 08 08 14bytes 全部絶対モード
01 01 01 02 01 03 03 04|01 05 01 06 01 07 03 08 16bytes 全部コード化モード
00 03 01 02 03 03 04|00 03 05 06 07 03 08 14bytes 3バイト連続する部分を両方コード化モード
00 09 01 02 03 04 04 04|05 06 07 03 08 13bytes 最初の3連続は絶対モード、2番目の3連続はコード化モード
6画素までは3番目が最適だが、12画素だと4番目が最適に逆転。
この手の離散組み合わせの最適化って難しいよね。 上のhallucinationでも確率伝播やランダムに変異させて組み合わせ最適解を 近似的に求めてるけど局所解に落ちそうな気がする。
不可逆な圧縮しか使ってはいけないのですか?
いまどきBMPの高だか10%程度の圧縮率向上にこれだけ苦労する価値はあるのだろうか
>>536 実務上は、まったくない。
が、そういうスレでもないしな。
538 :
デフォルトの名無しさん :2007/09/01(土) 10:04:11
adobeのライブラリを追っかければ分かるんじゃない?
画像データなんだから、画像データならではの圧縮を考えればいいのに
jpeg2000とかか
pんg
「行」でやるより「周辺」でやったほうが圧縮率多分いいよね
ちょっと画像処理からはずれるかもしれませんが…スレ違いだったらごめんなさい。
boost::gilでJPEG画像の読み込みor書き込みをする際にlibjpegが必要になるのですが、
自分でコンパイルしたファイル(libjpeg.lib)だとうまくいくのに、
GnuWin32
ttp://gnuwin32.sourceforge.net/packages.html からダウンロードしたバイナリだと、
jpeg_read_image();
の呼び出し時にエラーが起きます。
test.exe の 0x7c958fea でハンドルされていない例外が
発生しました: 0xC0000005: 場所 0x00000010 に書き込み中に
アクセス違反が発生しました。
どうもjpeg62.dllの内部でエラーが起こっているようなのですが、
いくら検索しても同じような現象が起こっているという例が見つかりません。
対処法がわかる方はいますか?
>543 >自分でコンパイルしたファイル(libjpeg.lib)だとうまくいくのに、 で拡張子が .lib だから VC 系じゃないかと思うのだが、GnuWin32 は MinGW で コンパイルされているわけで。 libjpeg に対して FILE* を受け渡してるんだけど、構造体に互換性あったっけ?
>>544 すみません、環境書いてませんでした。
環境は、WinXP + VC8です。
エラーは、
>>543 の関数内部で
jpeg_read_header();
を呼び出したときにおこっています。
スタティックライブラリだけでなく、DLLの場合でも、
MinGWとVC8間での互換性はないのでしょうか?
一応.defファイルからvc8のリンカを使ってインポートライブラリを
作成してみましたが、同様のエラーが起こりました。
>>545 他人のレスは注意深く読もう。ここ読めてる?
>libjpeg に対して FILE* を受け渡してるんだけど、構造体に互換性あったっけ?
結論から言うと、互換性がない。
>>546 わかりました。
ありがとうございます。
OpenCVって64ビットWindows用のはありませんか? 64ビットにしたらDLLが使えなくなったので探してるんですが。
わざわざOpenCVスレがあるんだからそっち行け
すみません 見落としてました
すみません質問させてください 鏡は左右が反転して見えるのに 上下は反転しないのはなぜでしょうか?
それはよくある誤解だ。 鏡で反転しているのは左右ではなく、奥行き。
555 :
デフォルトの名無しさん :2007/09/05(水) 04:26:10
お前ら優し杉
ホログラムをプログラムしたら 画面から飛び出ますか
で、何が望みだ? エロゲだな。素直に白状しろ。
BLです
>>479 18,648円に暴騰。投資しとけばよかった。
滑らかなグラデーションに適したロスレスの圧縮方法教えて。 ランレングスやスライド辞書では縮まんねえす。
動きベクトル
隣のピクセル (左とか上とか) との差を取って、それを圧縮するっていうのは? 滑らかなグラデーションなら、隣と差を取るとほぼ一定のパターンが続くんじゃないかな たしか PNG にはそういうオプションがあったような
565 :
デフォルトの名無しさん :2007/09/07(金) 13:36:13
>>561 俺は
>>479 の時点で注文したっていうか、その479自身なわけだけど
あの時点でamazon.comの値段と円相場で比較しても、.co.jpの方が
安かったよ。
で、即注文したんだが
配送予定日: 2007/9/20 - 2007/10/6
いまだにこんな状態。
まぁ、ゴンザレスに待たされた時間に比べたらどうってことないが。
カメラの自動追尾ってどうやるんですか? カメラが動いていない状態でのセンシング、トラッキングは出来ましたが、 カメラが動くときのアルゴリズムが思いつきません。
568 :
デフォルトの名無しさん :2007/09/07(金) 16:00:18
金谷先生の本や新聞を調べろ
569 :
562 :2007/09/07(金) 17:09:27
どうもありがと。調べてみるす。
>>533 今更だけど、3番目と4番目はRLE8の仕様になってないな。WORD境界にそろえとけ、結果が変わるぞ。
あと、PhotoshopのBMP-RLEの圧縮率はよくないと言っておく。
便乗で俺も補足しておくけど、自分でコード書かなくても DIB関係のAPIでRLE圧縮してくれるよ。
>>570 で、サイズを最小にするアルゴリズムは?
573 :
533 :2007/09/08(土) 09:48:31
>>572 最小になるアルゴリズムは巻き戻ししないといけないと思うが、そこまでやってないし、やる必要も感じない。
処理がシンプルなのがRLEの特徴だから、それを潰す必要はないと思うんでね。
が、少なくとも巻き戻しなしでPhotoshop(当方8.0)の圧縮率は超えられる。
基本的に以下を守ればいいはず
・絶対モードのラン(?)は偶数にする(奇数ではパディングの分だけ損)。
・絶対モード後にコード化モードがあり、かつランが2の場合はコード化したほうがよい。
これに従うと、
>>533 の例では、絶対モードのランは10がベター(後続データ次第では12)だな。
574 :
533 :2007/09/08(土) 09:52:31
スマン 誤: ・絶対モード後にコード化モードがあり、かつランが2の場合はコード化したほうがよい。 正: ・絶対モード後にコード化モードがあり、かつランが2の場合はコード化しないほうがよい。 つまり絶対モードのままだ。
オオボケしてる
570=573=574 != 533
だ。
>>533 申し訳ない
510
>>574 >少なくとも巻き戻しなしでPhotoshop(当方8.0)の圧縮率は超えられる
うらやましい。こっちはなんでダメなんだろ。絵によるのか、プログラムが
間違ってるのかも。
>>571 それは知りませんでした…。
>>576 俺がライブラリを作った当時は8bit化した自然画やノイズ画像も比較した記憶がある。絵によるとは思えない。
巻き戻しなしでいける、という事は、単純なコスト計算だけでいけるという事を意味している。
板的には面白みのない話だが、つまり、その場その場でどちらのモードが有利か判断すればいいだけだ。
>>533 の例を見る限り、仕様を勘違いしてるんじゃないかとも思えなくもない。
自作のプログラムで符号化したものは、Photoshopやペイントブラシで開ける事は確認したか?
余談だが、Adobeほどの所が(MSの腐った仕様とはいえ)、
この程度の圧縮率のままで改良もしてないというのはおかしい気もする。
俺が把握してる限りでは、Photoshop4.0の頃からRLE符号化アルゴリズムは変更されていない。
特許があるのか、まっとうなRLEが開けない糞デコーダでもあるのか…
578 :
デフォルトの名無しさん :2007/09/10(月) 07:29:24
だから520でいったとおりだろ 533がへぼ
>>578 533がヘボというのはその通りだが「Photoshopにも勝てないなんて、どんなエンコーダ書いてるんだよ」って理由だし、
>>520 と
>>577 は言ってる事違うだろ。
ましてや、裏付けがあるのか思いつきで書いたのか区別できんもんを自慢気に見せられてもなー。
折角だから、サービスな。WindowsBMP-RLE8のコストはこんな感じ。
・絶対(ラン奇数) : +3bytes
・絶対(ラン偶数) : +2
・コード化(ラン1) : +1
・コード化(ラン2) : 0
・コード化(ラン3) : -1
・コード化(ラン4) : -2(つまりコード化モードは -(ラン-2))
サイズを小さくしたいなら、ラン奇数の絶対モードは使わずに+1して偶数にしてしまっても損はない。じつは、これが一番サイズに寄与しやすい。
コード化モードのラン4以上は無条件で採用していいし、ラン2は絶対モードに組み込んだ方が損がない(得もない)。
最小サイズを目指す場合に最適化が必要なのは、絶対モードの途中にコード化ラン3がある場合だけで、デコーダの負荷を考えたとしてもラン4まで。
もっとも、このケースだけなら
>>524 のように総当りが必要とも思ってなくて、
後に続くのが絶対モードかコード化モードかだけで判断できるはずだが、これは俺も実験してない。5画素先読みするだけでほぼ最小サイズにできると思うので、533が試してくれれば嬉しい。
#他に、前方検索だけで最小化するなら検討すべきだが挙がってないケースもある。レアなうえにたいして小さくもならないんだが。
んで、
>>533 は間違ってはいるんだが、前方検索を考えるならポイントは外してない。
ここで
>>520 が
>>577 と同じだと言うんなら、あれは最適解を都度求めろという意味じゃなくて、こうやって説明しなくても
>>533 に類する問題の解は明らかだという意味なのか?
そうでなきゃ、問題認識できてない578は533よりヘボだ。
ついでに言うとPhotoshopはどーみても組み合わせ最適解なんて求めてない。
・ラン奇数の絶対モードも躊躇なく使う
・ラン4以上はコード化、4未満は絶対モード(行開始時くらいはコード化だろうが調べてない)
みたいな、ごく単純な規則でやってるように見える。
前者はお粗末だし、後者は速い実装にはなるかもしれないが、サイズはお察し。
Adobeのライブラリを追いかけても、Photoshop同等にはなるかも知れないが
>>533 問題は解決しない。
でだ、
>>538 と
>>578 が同一人物かどうかはわからんが、もしそうなら、まぐれ当たりで喜んでるヘボだと思うよ。
#これが
>>536 でも指してくれてたら諸手を挙げて賛成なんだが。
ダラダラと長すぎ
スマン、余計な事まで書きすぎた
今Win32APIで画像アプリ作ってますが メモリ管理がかったるいです。 で、C#に移ろうかと思ってますが 速度が遅そうなのが気になってます。 実際どうなんでしょう?
コアの部分だけネイティブにすればいいんじゃね
>>583 そりゃ遅いさ。あと、人間の許容範囲の待ち時間なのかどうかは C++ にしろ C# にしろ処理によるとしかいえんさ。
マネージドコードでやろうとすると死ぬほど遅いよ。 結局unsafe。
>>583 C#が遅いのは最初の、ILを翻訳しながらロードしてるときだけ。
安心したかい?
その最初の印象だけで遅いという人はいるがなー
減色で遊んでるんだけど、チャンネルの諧調落しやメディアンカット では256色、8bit内に収めようとした場合、マッハバンドが 抑えられない。(ディザはとりあえず考えないとして) 綺麗な減色を謳ってるソフトを試すと、ディザ無しの256色でも グラデがそこそこマッハバンドが目立たないように変換されてる。 (自分でやったのとは雲泥の差) パレットを見ると双方とも大差なさそうなので、ピクセルへのパレット の割り当てにコツがあるんだろうか? 一応メディアンカットでは、分割場所や分割優先度にピクセルの 使用頻度を加味するなど一工夫加えてみたつもりだが、 パレット抽出を多少ひねった程度では改善できんかった…。 ヒントください。
まあ色々がんばれ おまいさんがどうやっているのか、その書き方だけでは全然わからんが、 とりあえず、他のツールで作った画像のパレットを使って 自分の書いたコードで同じようにピクセルへのパレットの割り当てしてみ それでマッハバンドが出るか出ないかで問題の切り分けができる
>>590 メディアンカットで再起分割したものを初期値としてLBGクラスタリングしているけど、
まあまあの品質いくよ。太ももの微妙なグラデーションでもマッハバンドが目立たない。
これだけでは、まだまだ市販の減色ツールには勝てないけれど。
なぜに太もも
>>593 どんな感じか画像が見たい(*´Д`)ハァハァ
590
>>593 うらやましす。LBGでぐぐってみる、さんくす。
>>596 3次元ベクトルで量子化していると思うけれど、いろんな色空間を試してみ。
色空間が異なるだけで、まるで違う結果になるから。
凄い初心者な質問で申し訳ないのですが、 白い背景に「あ」と書いてあるjpg画像を数値にするには、 まず 1 あ.jpgを何らかの方法で読み込む 2 あ,jpgの1ピクセル分の色を記憶する、配列[あ.jpg縦のピクセル][あ.jpg横のピクセル]を用意 3 縦軸をy、横軸をx、左上を(0,0)とすると、 for(y=0;y<画像の横のピクセル数;y++){ for(x=0:x<画像の縦のピクセル数;x++){ 配列[x][y]=今のピクセルの色の数値(#FFFFFFとか?); } } のようにすればよいのでしょうか? 凄い素人考えなんですけど…
>>598 あなたがそれでいいと思うのならそうでしょう。
私には、あなたが言う「jpg画像を数値にする」が一体何をどうしたいのかが判りませんので。
えっと、画像の比較をやってみたいんです。 例えば 白い背景に一と書いてあるjpg画像と二と書いてあるjpg画像 を比較する場合、一般的にはどのようにするのかなと思って。
>>600 >一般的にはどのようにする
こんなところで初歩の初歩から質問せず、ちゃんと勉強する。
わかりました。 ちなみにおすすめの本はどんなのでしょうか?
ワロタ
「この絵と同じパレットになるように減色する」 って機能を持った減色アプリってある?
>>605 「この絵」のパレットファイルを出力して、そのパレットファイルで減色する、
でよれけば、optpixにある。
減色アプリでは無いがドットツールのEDGE。 256色画像を開いて、減色したい絵を上からペーストする。 色の近いパレットを選択するだけだから結果は大抵ひどいものになるけどな。
608 :
605 :2007/09/12(水) 20:33:31
>>606-607 サンクス
optpixってちょっとだけ値段が高いんだな
とりあえず無料のEDGEを試してみたりしてみる
609 :
598 :2007/09/14(金) 02:13:02
すいません質問です。 libjpegを使って、jpeg画像を展開してメモリに読み込む事はできるようになったの ですが、これを白黒に変換するにはどうすればよいでしょうか? 一度メモリに読み込んだ画像を白黒画像に変換するのは難しいような感じがするのですが、 gimpなどスクリプトで使って、先に画像を白黒に変換してからメモリに読み込むのが普通でしょうか?
610 :
598 :2007/09/14(金) 02:17:35
すいません、OpenCVを使えばやりたい事が出来そうです。 でも、これってLinuxとWindowsしかサポートしてないのか…
クマー
>>598 何をしたいのか具体的に書こうという気はないのか?
白黒に変換するロジックさえ自力で書けないならそこもライブラリを使えばよかろう。
LinuxやWindowsでなくてもImageMagickなり使えるライブラリはあるだろ。
画像処理の「いろは」から勉強した方がいいかと。 画像処理以前に、自分のOS上でビットマップを表示する方法すら 分かってないようだし。
足し算からはじめよう
>>600 なんでだよ。じゃあgimpはどうやってやってるんだよ。
くまー
>>609 > 一度メモリに読み込んだ画像を白黒画像に変換するのは難しいような感じがするのですが、
むしろメモリに読み込めてしまえばあとは何でもありだろ
メモリに読み込まずに変換するっていう方が難しいと思うが
>>609 プログラムは分かるんだから、光の3原色とか勉強すれば
いいんじゃなの?RGBってのが分かってたら、白黒(っぽい)
変換なんて1秒で思いつくよ。
それともRGBの24bitをグレースケールの8bitに変更したいっ
てことだろうか?? それにしたって大した処理じゃない。
libjpeg引っ張ってきて画像ファイルをロードできるくらいにプログラムが
分かってるのに、白黒への変換操作が分からないなんて、ものすごく
アンバランスじゃないかな。
どんな人なんだろう…
jpegならもう白黒画像のデータを含んでるじゃないか 色情報省くだけだろ RGB形式やCMYK形式も一応あるが、ここでは考えないということで。
足して3で割るんだw 2値化なら128を閾値にして2つわけろw
黙れバカモノ
いい歳こいた大人が、白だの黒だの…
かまわん! 全部赤で塗りたくれ!
一瞬「ダイナミック離婚」ってなんだろうと思ってしまった
静的離婚もあるのか
性的離婚ならありそうだが
誰がうまいこと言えと
最近顔チェキっていう、 顔の写真から、芸能人にどのくらい似ているかを判断するサービスがありますよね。 あれって、どういう仕組みで動いているんでしょうか? たとえば、この人の目はキムタクに似ているっていうのだけでも、 まず人の顔の中から目の部分を見つけないといけないですよね。 どうやって目の部分を見つけたしているんでしょうか?
顔認識という研究分野があります。 目など各部位を見つけて比較する手法もありますが、顔写真全体にある種のフィルタをかけてそれを比較するだけの手法もあります。それでそこそこ結果はでます。 おそらく顔チェキは低精度の単純な顔認識システムをもちいて、本来ならば誤認となるところを、顔が似ている、という解釈にもっていっているだけでしょう。 簡単なわりには高精度の結果がだせる有名な顔認識の手法としてはPCAを用いたeigenface(固有顔)システムというものがあります。 まずはそれから勉強してみてはいかがでしょう。 #しかし素人しかこないなここ。
OKIのFSEというミドルウェア使ってみるみたいね DSにものっかるくらいだから軽量なのかねえ
633 :
630 :2007/09/15(土) 09:40:28
>>631 有り難うございます。
eigenface(固有顔)システムというのは、
たくさんの顔の写真の平均値?みたいな物を求めて、
たとえば、Aさんの写真−たくさんの顔の写真の平均値が
人の顔の形の範囲内だったらコレはAさんだ!と認識する方法
みたいな感じなのでしょうか?
635 :
630 :2007/09/15(土) 10:40:34
サンプルとしてソースコードって無いんでしょうか?
調べろって言ってんだろ
>>625 フォーマルメソッドなしで、いきなり思いつきでプログラムしてもいけるってことか
>>620 便乗質問なんだけど、jpegを展開する前に色データに加工したいんです。
例えばlibjpegのAPIなら、jpeg_read_scanlinesを呼ぶ前に、色情報のみ
をグレースケール化や色相回転させて、jpeg_read_scanlinesで展開された
結果には、先に行った色変換が反映されている、というような感じです。
>色情報省くだけだろ
ということは、色情報のみにアクセスするAPIがあるのでしょうか?
展開後のビットマップの大量の面積を処理するより、色にだけ処理
する方が高速化できるんじゃないかという目論見です。
APIリスト眺めてもそれらしいのが分からなかったので、もしあれば
情報お願いします。
APIでは用意されてないんじゃないかな
>>639 うへぇ、了解です。
データ構造把握は俺にはちょっと無理そうだなあorz
libjpeg使ったこと無いけど、 jpeg_read_scanlinesがJPEG展開したあと、ついでに自動で色変換しているだけだと思う。
jpeg_decompress_structのout_color_spaceにJ_COLOR_SPACE列挙値適当につっこめばいいような気がするがソースまでは追ってないので知らん。
>>642 J_COLOR_SPACE列挙対に用意されてる以外の変換を、
データが膨張する前の展開前の色部分にのみ施したい…
というのがやりたいことなんだが、的外れなこと言ってる?
展開したあとにビットマップ弄るのと類似するやり方だと、
大して高速化は期待できないんですよ。
JFIFで言えば、YCrCbにしてDCT変換してハフマンで符号化しているだけだから、 展開するまで色なんか分からないんじゃ・・・8ビットカラーの話ですか?
>>644 うわ。やっぱりそうか…ありがとうございます。
まあ展開しつつ色変換するのと、全部展開してから全部色変換するのでは、速度的にほとんど変わらんわな
>>638 もうおわってるっぽいけど。
>>620 が言っているのは jpeg をグレースケール化する場合 jpeg のアルゴリズム的に展開時
ハフマンデコード→逆zigzagスキャン→逆量子化→逆DCT変換→YCbCr to RGB
だから、グレースケール化するのに色情報を省けってのは
YCbCr to RGB 変換をしないで Y のところだけ使えってことで、つまりそこでの CbCr (色情報)を捨てろってこと。
jpeg ファイル構造にパレット格納領域があって、とかそういう話じゃない。
つーか
>>620 の回答は
>>609 のレベルに対しては適切なアドバイスじゃないと思うけどな。
638
>>647 そもそもなんでそんな発想になったのかというと、以前jpeg2000
(ウエーブレット変換?)の展開途中の状態を無理やりビットマップに
書き出したことがあって、左上(?)だけのカラーが集中した部分と、
そのほかの成分の再帰的な配置が頭の中に残ってたからなんですわ。
そのカラー情報(っぽい)部分の面積が小さいうちにそこだけモノクロ化して
しまえば、展開後の全体がモノクロになりそうだったので(実際試したわけ
じゃない)ひょっとしてjpegの成分復帰中にどこか小領域にカラーが集中して
たらいいなあとろくに仕組みもチンプンカンプンなのに聞いてしまいました。
>YCbCr to RGB 変換をしないで Y のところだけ使えってことで
なるほどモノクロ化だけなら後でやるのに対して変換時間を
ゼロに出来そうですね。
>>648 カラーが集中ってのはなんか変な表現だな。せめて強度が集中?
DCT にしろ wavelet にしろ
左上が近似情報(低周波成分)、右下が詳細情報(高周波成分)になります。
一番左上なら画像全体の平均値です。それを集中と表現しているのかな。
まぁそもそも jpeg の場合は Y チャネルがすでにあるから
>>647 で言ったとおり一連の処理を Y チャネルに対してやるだけで勝手にグレースケールだからいいとして、
RGB に対してそれらの処理をやっていると仮定した場合に途中でグレースケール化できるのかどうかを考えてみよう。
左上の近似情報だけをモノクロ化して、と言っているけれど、
そうしたら右下の詳細情報は利用しないのかい?すてちゃうの?
そうしたら違う画像になってしまいますよ。いくら詳細っていってもさ。
ただでさえ lossfull なのにもっと loss しちゃいますよ。それがお望み?
#というかそもそも DCT 変換、ウェーブレット変換後は周波数ドメインになっているから、周波数ドメインでモノクロ化ってのがピンとこないけど。
空間ドメインでのポイントオペレータ(モノクロ化計算式)は、周波数ドメインだとどうなるんだろう?→ただの定数掛け算、足し算だから周波数成分でもただの定数掛け算、足し算かな?
>>649 >まぁそもそも jpeg の場合は Y チャネルがすでにあるから
フォーマット上は、あるとは限らないよ。JFIFならあるけれど。
jpgの話題ついでに、ちとスレ違い気味なんだけど、教えてエロいひと。 フォトショなんかでjpgで保存すると、ベースライン(一枚画像)よりも プログレッシブ(ネットとかで荒い画像から出てくるやつ)のほうが 同じ品質でサイズが小さくなる。 これ、何故でしょうか? 同じ品質でおまけがつくプログレッシブの 方が大きくなると思うんだけど、圧縮のアルゴリズムとなんか関わ ってるのかな?
詳しくは知らんが、wikipedia にもそう書いてあるね
http://en.wikipedia.org/wiki/JPEG >Baseline Progressive JPEG encoding usually gives better compression as compared to Baseline Sequential JPEG
>>652 その直後に理由として
> due to the ability to use different Huffman tables (see below) tailored for different frequencies
> on each "scan" or "pass" (which includes similar-positioned co-efficients)
って書いてあるやん。
各「スキャン」の異なった頻度のために仕立てられた異なった ハフマンテーブル(以下を見る)を使用するか、または「通る」能力 のため(同様に置かれた係数を含んでいます) さぱーり
画像のスケールに応じたハフマンテーブルを使ってるぽいね 画像全部を符号化せずに 荒いやつを符号化+もちっと細かいやつを符号化+細かいやつを符号化 って感じに段階的にやってるんちゃう?
656 :
デフォルトの名無しさん :2007/09/21(金) 05:48:14
画像のチャネルって何ですか?
音声のチャネルがたとえば左右とかだったりするわけだけど、 画像のチャネルは普通、RGBとかYGbGrとか色空間の各要素のことを言うと思う 他の意味もあるかも
ありがとうございます。 つまり、 RGBは3チャネル R,G,Bは各一チャネルづつ ってことで良いでしょうか?
>>659 adobe関連で言うところのチャンネルというのは、様々な種類の情報を保存するグレースケール画像のこと。
それ以上でも以下でもないので注意。
photoshopで言えば、これにカラー情報チャンネルだのアルファチャンネルだのスポットカラーチャンネルだのがあって、
それぞれ与えられた意味が異なるだけで、データとしては単なるグレースケール画像。
つーか、単純に channel っつー、訳すなら通信路という言葉があって、 テレビのチャンネルみたいに、 これのこの道、それはその道、とわかれていることを示したい時に よく使われる言葉に過ぎない。
channelの元々の意味は水路。運河canalと語源一緒。
664 :
デフォルトの名無しさん :2007/09/21(金) 12:39:48
ImageJ知ってる人います?
666 :
デフォルトの名無しさん :2007/09/22(土) 14:43:36
顕微鏡画像の処理ですか。なるほど。 ImageJのプラグインについても詳しいですか?
小出しに質問して何かいいことありますか?
詳しくなければ質問しても意味がない →質問を書く時間が省ける ぐらいかなぁ。
665じゃないけど詳しいよ
>質問を書く時間が省ける そんな人には 詳しいから回答したいが、回答を書く時間を省きたいから書かない
>>670 いいんじゃないか、それで。
でも実際暇人ってのはいるもので
暇人だけど詳しくない。
今後流行りそうな画像処理ビジネスってなにかある?
バイオ
665だけどバイオなんて流行らないと思う ネット上の動画の検索とかどうかな
665じゃないけど、バイオ分野は流行ってるんじゃないの?大学の予算とかみてもすげー高いし。 画像処理をどう使うのかは知らんけど。 検索系は流行るかもしんないけど、今から追いかけても技術的にはつらそうな気がする。 ビジネス的には分からん。
画像検索系は結構行き詰まっている感じがする。 同じような画像の抽出のように、元画像があれば単なる特徴抽出でなんとかなるかもしれないが、 例えば、ブルドックの画像とか、こたつみかんの画像とかということになると、画像から そこに表現されているものが何かを判断しなければならず、これは相当難しい。 技術的には、何らかのブレイクスルーが必要だろう。 だからそれを何とか出来るなら、ビジネス的にも大ブレイクするのではないだろうか。
>>679 バイオ系には予算がついてても、日本ではその多くは
wetな実験、それも「網羅的何とか」とか「何とかオーム」みたいな
力任せな研究の機材や人件費に費やされていて
画像関連のアルゴリズムの話はほとんど聞かない
ということはバイオ+画像はビジネスチャンスというわけか
微生物の力で画像探索・・・
絶対領域に集まる微生物…
そういや粘菌が迷路の最短ルートを探索するって論文あったな。画像処理とはちょっと違うけど。
もうすぐ来るといわれる4k2k時代の画像処理ってどうなるんだろ。 ビジネスチャンスの山なのだろうか?
解像度が上がるだけで、この板的には何も変わらないんじゃないかな
GPGPUみたいに、あるいはmany coreでもいいけど、 並列度の高い計算環境が広く普及して多くの人が並列処理の手法を考える機会を得た結果、 新しい考え方やアルゴリズムが出てくると面白いんだけど期待できないかな
てめぇがやれよ
おまいは文盲か
画像から検索するサイトができて欲しい。 手持ちの画像が使われてるサイトを探す検索エンジン。 サーバーにものすごい投資がいりそうだけど。
692 :
OpenCVVVV :2007/09/25(火) 02:08:49
OpenCVで画像処理の勉強してる初心者です。 OpenCV使ってサブピクセル単位のブロックマッチング をするようなプログラムソースを公開してるサイトと か知りません?もしくはなんかよい方法知ってれば教 えてほしい・・・
>>691 たしかそういうのあるよ
知ってるのは著作権違反してるサイトを見つけるためのビジネスなんだが
例えば何かのキャラクターの画像を入力してWebを検索すると
その画像が張ってあるサイトが出力されるってかんじの。
694 :
OpenCVVVV :2007/09/25(火) 02:18:47
OpenCVのスレで聞けってかんじですよね。失礼しました
>>693 ネット上の画像ファイル自体でなくマッチングに必要な特徴量だけを
抽出して蓄えとくのかな?
>>695 まったく同じ画像ってんなら特徴量どころか md5 ぐらいでなんとかなりそうですな
>>692 なにが難しいの?ただ単にプログラミング1年生ってこと?
697 :
デフォルトの名無しさん :2007/09/25(火) 11:31:54
ImageJのプラグインですが、8bit画像対応で書かれたの処理を、 16bit画像対応の処理に変換したいんですが、どのように行えばよいかわかる人いますか?
ImageJのことはよくわからんけど 16bit画像を読み込んで8bit画像に変換(減色)して 元からある8bit画像対応で書かれた処理に投げるのじゃ駄目なの? 16bitで全て処理したいなら処理部分で画素参照してる部分を16bit画像に挿げ替えるとか
マジレスキタコレ
700 :
デフォルトの名無しさん :2007/09/26(水) 03:59:04
ありがとうございます。 16を8へ変換すると、階調数変わって、画像そのものが変わるので、やりたくないんですよ。 「16bitで全て処理したいなら処理部分で画素参照してる部分を16bit画像に挿げ替えるとか」 をもう少し詳しく教えていただけませんかね?
703 :
デフォルトの名無しさん :2007/09/26(水) 05:39:46
ありがとうございます。 16を8へ変換すると、階調数変わって、画像そのものが変わるので、やりたくないんですよ。 「16bitで全て処理したいなら処理部分で画素参照してる部分を16bit画像に挿げ替えるとか」 をもう少し詳しく教えていただけませんかね? (スレ変わったのでもう一度書き込みました。すみません。)
オープンソースなんだから自分でソースをいじれってことだろ
705 :
デフォルトの名無しさん :2007/09/26(水) 12:28:05
そうですよね・・・。ありがとうございます。 また、困ったら質問すると思いますので、よろしくお願いします。
複雑なグラフ構造をかっこよく二次元or三次元に表示できる定番のアルゴリズムって何かありますか? JavaのJDKのDemoに入っていたような、なんちゃって物理モデルを定義して各点を相互作用させていく やり方は試したのですが、点が増えると線がこんがらがったり、ぶるぶる震えたり、 点が重なったりしてなかなかうまくいきませんでした。 うまいやりかた教えてください。
>>706 グラフはどれくらいのサイズ?
バネみたいなモデルでとりあえず安定しないかい?
>>697 import ij.process.*;
ImageProcessor ip8; // 8bits/pixelグレイスケールだとする。つまり ByteProcessor 型
ImageProcessor ip16 = new TypeConverter(ip8, True).convertToShort();
で ip16 が 16bits/pixelグレイスケールになる。つまり ShortProcessor 型
>>706 定番かどうかは知らんが、Graphvizとか参考にしてみれば
710 :
デフォルトの名無しさん :2007/09/27(木) 03:13:58
またまたImageJなんですが、プラグインした処理を自分でいろいろと書き換えたいんですが、そのファイルの中身は、classファイルとjarファイルがあります。 普通にファイル開こうとすると開けませんので、ImageJ起動させて、plugin>editeから書き換えようとしたんですが、これも開けませんでした・・・。 といことは、classファイルやjarファイルを他の何かに変換しないといけないって事ですよね? どうやって変換すればいいんですかね?そして、どーやって書き換えればいーんですかね? ImageJオープンソースのプラグインの処理の書き換え方を教えて欲しいんですが。初心者ですのでわからなくって。。。
>>710 ImageJというよりJavaについての知識が足りない
同じプラグインのソースファイル(ImageJプラグインならjavaファイル)を
ダウンロードするなり貰ってくる必要がある
>>710 プログラミング(もしくはjava)初心者ならまともにjavaプログラミング出来るようになってから出直せ
713 :
デフォルトの名無しさん :2007/09/27(木) 04:21:03
Jarの中身を閲覧してデコンパイル(classからJavaソースを生成)できないんですか?
残念だが710には無理だな
715 :
デフォルトの名無しさん :2007/09/27(木) 04:34:00
デコンパイルは難しいことなんですか?
糞スレageんなカス
ここは一問一答スレではありません
隣の家の芝はどうして青く見えるんですか?
スカリー産卵のせい
>>715 Java関係のところで聞いた方がいいと思います
それとメール欄に「sage」と入れてください
それとせっかくだから改造したいプラグインの名前を教えてよ
山は死にますか?
風はどうですか?
海の水はどうしてですか?
そんな歌詞はありません
725 :
デフォルトの名無しさん :2007/09/28(金) 03:28:46
友達がこんな無茶ブリを言ってきた。 このプログラムをjavaに直して起動させろと。 そ、そんな無理な!誰か分かる方いますか? //pget(int x, int y) : 入力画像の指定したx,y座標からピクセルの色を読み出す(0か1) //pset(int x, int y, int c) : 出力画像の指定したx,y座標に色をセットする(cは0か1) //width : 画像幅 //height : 画像高さ int sx, sy; //追跡開始点 int px, py; //追跡点 int vec; //調査点フラグ int IsFirst; // //画像内を捜査し有効画素を探す for(sy=0; sy < height; sy++) { for(sx=0; sx < width; sx++) { //有効画素があった場合ループから抜ける if( pget(sx, sy) != 0 ) { break; } } }
726 :
デフォルトの名無しさん :2007/09/28(金) 03:29:49
//有効画素が見つかっていた場合、追跡処理に入る if( sx < width ) { px = sx; py = sy; pset(px, py, 1); vec = 2; //最初の調査点を左下にセットする IsFirst = 1; //追跡開始点と追跡点が同じ座標なるまで輪郭追跡処理 while( px != sx || py != sy || IsFirst == 1 ) { switch(vec) { case 0: //左上を調査 if( pget(px-1, py-1) != 0 ) { pset(px-1, py-1, 1); px = px-1; py = py-1; vec = 6; break; }
727 :
デフォルトの名無しさん :2007/09/28(金) 03:30:23
case 1: //左を調査 if( pget(px-1, py) != 0 ) { pset(px-1, py, 1); px = px-1; vec = 0; break; } case 2: //左下を調査 if( pget(px-1, py+1) != 0 ) { pset(px-1, py+1, 1); px = px-1; py = py+1; IsFirst = 0; vec = 0; break; } case 3: //下を調査 if( pget(px, py+1) != 0 ) { pset(px, py+1, 1); py = py+1; IsFirst = 0; vec = 2; break; } case 4: //右下を調査 if( pget(px+1, py+1) != 0 ) { pset(px+1, py+1, 1); px = px+1; py = py+1; IsFirst = 0; vec = 2; break; }
728 :
デフォルトの名無しさん :2007/09/28(金) 03:31:54
case 5: //右を調査 if( pget(px+1, py) != 0 ) { pset(px+1, py, 1); px = px+1; IsFirst = 0; vec = 4; break; } else { //孤立点であった場合 if( IsFirst == 1 ) { IsFirst = 0; break; } } case 6: //右上を調査 if( pget(px+1, py-1) != 0 ) { pset(px+1, py-1, 1); px = px+1; py = py-1; vec = 4; break;
729 :
デフォルトの名無しさん :2007/09/28(金) 03:33:34
} case 7: //上を調査 if( pget(px, py-1) != 0 ) { pset(px, py-1, 1); px = px; py = py-1; vec = 6; break; } vec = 0; } } }
730 :
デフォルトの名無しさん :2007/09/28(金) 03:34:22
休憩
なにがしたいの?
どうせならちゃんと貼ってくれ。matlabに直してやるから
友達に断るのが吉。 宿題なら宿題スレ行け。
そのままじゃ動かないんだっけ?
何が無茶なんかよくわからん
>>725 友達にそんなことを頼まれることになった経緯を詳しく聞かせてくれ。
そっちの方が興味深い。
737 :
デフォルトの名無しさん :2007/10/03(水) 10:48:31
相変わらずレベル低いなw
相変わらず暇そうですな
neet
www.openjpeg.orgが見れないんだがなんか知らない?
741 :
740 :2007/10/06(土) 00:45:46
自己解決。とりあえずここでライブラリ落とせた www.tele.ucl.ac.be/PROJECTS/OPENJPEG/
そこに置いてあるやつ使っちゃいけないよ
743 :
598 :2007/10/09(火) 13:53:43
画像認識はあまり関係ないけれども、質問してもよろしいでしょうか? あれから勉強して、卒論としてなかなか面白いソフトウェアを作り上げたんです。 もともとアイデアがあって「実現したいなぁ」と思ったので、 あんな素人同然の質問をしたんですけれども。(画像処理は本当に初めてでした!) ちなみに自分は経済学部生なんですが、 指導教官(理系の大学院大学を主席で出た)の方針で、 卒論の内容は自分で好きなことを決めて良いことになっています。 それで、出来た物を指導教官に見せたんですが、 「こういうテーマの研究は学会でもみたことないし、ユニークだ」と褒めてもらいました。 で、自分としてはそのアイデアとソフトウェアとソースコードを公開して、 精度を高めるために、いろんな識者の意見を聞きたいなと思うんです。 (経済学部なので、周りは誰も画像処理について知らないので。) でも、指導教官は「そういうのはちゃんと論文を書いて、学会で発表してからにしないと アイデアをパクられるぞ」と言うんです。 で、質問なんですけれども、こういう場合、指導教官に従うべきなんでしょうか? 学会ってパクりパクられの殺伐としたところなのでしょうか?
744 :
デフォルトの名無しさん :2007/10/09(火) 13:59:23
>>743 学会が殺伐しているのではなく、世間が殺伐しているから、従うべき。
学会で発表してから、公開した方がいいよ。
ボタンを押すことによりキャプチャした画像を 連続でファイルとして保存したいのですが同じ画像が保存されてしまいます。 capDlgVideoFormat( hWndCap ); capDlgVideoSource( hWndCap ); capDlgVideoCompression( hWndCap); 上記のどれかを書けば連続した画像を保存できるのですが毎回ダイアログが 出てきてしまいます。ダイアログを出さずに保存できるような方法が ありましたらご教授頂きたいです。よろしくお願いします。 環境はvisual c++ 2003.netでVideo for Windowsを使用しています。
PGM形式のヘッダーなんだけどさ、 P5 # this line is a comment 640 480 255 以下バイナリ とかってなるじゃん。 輝度最大値のあとにコメント行が来ていいもんなの? Linuxでman pgmすると、 輝度最大値の情報の前の#で始まる行はコメント扱いだとあるんだけど、 たまに輝度最大値とバイナリの間にコメントが含まれるPGMに出くわす。 ソフトによってはそういう変な画像もちゃんと表示してくれんだけど、 IEが変なHTMLも表示してくれちゃうみたいで好きじゃない。 公式の定義としては、コメントの扱いはどうなってるんでしょう。
作った奴も適当だろ
>>747 仕様から外れたファイルに対応するなんて日常茶目仕事
まさか、茶飯事を「ちゃめしごと」って読んでたりする人?
752 :
デフォルトの名無しさん :2007/10/09(火) 16:35:40
茶飯: ちゃめし 永谷園のお茶漬けのごとく簡単にできる飯のこと これより、茶飯事(ちゃめしごと)は非常に簡単に出来ることを云う。 また、茶飯事をさはんじとと読むと別のいみとなる。この場合は 酒・煙草・2ch・小便のように毎日行っている事を云う。
後付けで意味をこじつけても虚しいだけだね。
754 :
デフォルトの名無しさん :2007/10/09(火) 16:52:28
そんなレスは空しいな
755 :
747 :2007/10/09(火) 16:54:30
756 :
750 :2007/10/09(火) 17:00:32
穴があったらはまりたい
757 :
デフォルトの名無しさん :2007/10/09(火) 17:04:49
日本にプログラマは非常に少ない ITドカタなら羊の群れのごとくいる。
>>747 ネットでいろんな manpage みたけど、そんな制限書いてるのは見つけられなかったな。
漏れが見た全てのドキュメントがラスター値より前にならどこにでもコメントを入れて良い
こととしている。
単に
Strings starting with "#" may be comments, the same as with PBM.
とか
Characters from a "#" to the next end-of-line, before the maxval line, are comments and are ignored.
とか
>>758 もしかして、英語読めないの? 後者はmaxvalの後のコメントを認めていないのだけれど。
スマン・・・寝ぼけていた。 netpbm 系のドキュメントはラスター値より前ならどこでもok、 後者の - えーとどっから持ってきたのか忘れたが - は maxvalue より前派、 となってるわけやね。
761 :
747 :2007/10/09(火) 17:33:14
>>758 そうなの。2種類の書き方があるんだわ。
前者はsourceforgeにもあるやつで、後者はLinuxのmanで出てくる。
>the same as with PBM.
とあるんだけど、PBMにはmaxvalが存在しないんで、
"same as"と書いてしまうのは乱暴なんだよね。
maxvalより後ろのコメント行がある場合には対応したくないんだけど、
(間違ってるのは変なPGMを吐く他のソフトだから)
もし公式にそういうコメントの付け方が認められているならば、
ちゃんと自分のコードでも対応しないといけないなー、と思ってね。
762 :
デフォルトの名無しさん :2007/10/09(火) 19:02:24
c++でRGBに変換した画像は、 color_dest=Color::FromArgb(r,0,0); pen=gcnew Pen(color_dest); gr->DrawRectangle(pen,X0,Y0,1,1); のように表示しているんだけど、 YUVの場合はどうしたらいいのでしょうか? 変換式はわかっています。
sage。
>>759 後者は、maxval lineより前にある#は、行末までコメントだから無視すると書いてあるだけで、
maxval lineより後ろにあってはならないとは書かれていないんじゃ・・・
もちろん普通は、そうとらえないと思うけど。
いずれにしろ、そういうデータが存在する以上、前者の仕様は後者の仕様も含むから、書き込みは
ともかく読み出しは前者の仕様で作ればいいだけの話なんじゃない?
>>762 何がしたいのかよく分からん
YUV画像を表示するなら、RGB画像に変換するだけだし
(RGB画像のR値だけ表示する様に)YUV画像のY値だけ表示したいなら、Grayscaleで表示すればいいだけだし
あと、それC++じゃないから
>>765 すいません、VCで作っています。
グレースケールということは、変換してでた値をRGB全部に入れればいいのですね。
残りのUVについては値域がー128〜128になるので0〜255に直すために、128を足せばいいのですか?
やりたいことは、原画像を与えて、 原 R G B Y U V のように成分抽出して表示させることです。
>>767 Y成分だけ表示
U成分だけ表示
V成分だけ表示
ってやりたいのかな?
表示したい成分以外を固定すればいいんじゃね?
あと、YUVとは何か分かってないみたいだから少し勉強してくれ。
とりあえず(en.wikipedia.orgによると)デファクトっぽいnetpbmのドキュメントよりpbmのコメント (pgmは適宜読み替えて) ・ラスタの区切りの空白文字より前の、"#〜<CR>"、"#〜<LF>"はコメント ・型破りだが、コメントはトークンの途中に挿入されるかもしれない ・ラスタの直前にコメントを置いた場合はコメント末尾の<LF>は区切りにはならない (補足) ラスタの区切りの空白文字は1文字のみ(通常は<LF>)。 つまりpgmだと"Maxval<LF>"の後にはコメントは書けないが、 "Maxval# comment<LF><LF>"と書くのはOK
>>768 やりたいことはそのとおりです。
表示したい成分以外を固定とは、どういうことでしょうか?
771 :
769 :2007/10/09(火) 21:02:11
例としてはこんなところだろうか [OK 1] P2<LF> # comment<LF> 64 64<LF> 255<LF> <raster> [OK 2] P2<LF> 64 6# comment<LF> 4<LF> 255<LF> <raster> [OK 3] P2<LF> 64 64<LF> 255# comment<LF> <LF> <raster> [NG 1] P2<LF> 64 64<LF> 255# comment<LF> <raster>
772 :
768 :2007/10/09(火) 21:10:22
>>770 R成分だけ表示
G成分だけ表示
B成分だけ表示
するときはどうしてる?
color_dest=Color::FromArgb(r,0,0); pen=gcnew Pen(color_dest); gr->DrawRectangle(pen,X0,Y0,1,1); のようにFromArgbで値を与えて、 それをpenに入れて、 DrawRectangleで始点とペンの大きさを与えて、 描画しています。
774 :
768 :2007/10/09(火) 21:56:31
基本的な流れは 1.YUVの値をいじる ↓ 2.RGBに変換 ↓ 3.表示 2と3は分かるよな?
いやスレ違いもいいところだが、普通はBitmap::SetPixel()使う。最低でも。 つーかBitmap::LockBits()使えといいたいところだが。
776 :
762 :2007/10/09(火) 22:07:02
>>774 YUVに変換すると、値がマイナスになってしまう部分があります。
FromArgbでは値をint型で入れなくてはならないのに不都合が生じてしまいます。
というところで詰まっています。
777 :
762 :2007/10/09(火) 22:13:05
>>775 今外出中なのでできませんが、戻り次第調べてみます。
778 :
768 :2007/10/09(火) 22:24:52
>>776 そのYUVをRGBに変換すればプラスの値になるだろ?
もしかしてFromArgbの引数にYUVの値を入れようとしてるのか?
779 :
762 :2007/10/09(火) 22:36:09
あるのは原画像、
現在原画像からRGB成分を取り出して、
赤緑青で表示させるのは先程のコードでできています。
RGBの値をYUVに変換することも出来ます。
その値の処理の仕方がわかりません。
>>778 引数はrgbの値しか入らないことはわかっています
780 :
768 :2007/10/09(火) 22:58:14
YUVのYだけ、Uだけ、Vだけの画像を作る ↓ YUVをRGBに変換してFromArgbに入れる ↓ 後は同じ 一体何が分からんのだ
比率
782 :
762 :2007/10/10(水) 05:47:48
解決いたしました。
>>768 さんを始め、
悩ませてしまい申し訳ありませんでした。
GIL gil どっちが正しいの?
淫乱テディベア画像をどう処理すればデスクトップの壁紙にできるかについて
785 :
762 :2007/10/11(木) 20:52:31
画像処理か分からないんですが、 最近HPなどに貼られている画像は 分割されているものが多いと思うのですが 簡単に1枚画に結合できるソフトとかありませんか?
XCOPYコマンドで連結
スクリーンキャプチャ
物体の横幅を計測できるアプリケーションを以下の処理で作ろうと思っています。 @透過照明を用いて、背景を白、物体を黒の2値化画像を撮影。 Aその画像にラプラシアンフィルタをかける。 B横に隣接した2ピクセルの符号が反転していれば、その隣接した2ピクセルの間にエッジがあるとする。 C隣接した2ピクセルの線形近似によりゼロクロス点を求め(0.1ピクセル単位で)、その点をエッジとする。 D1行ごとに2点のエッジ位置があるので、差を求め、その差に校正値をかけて実寸値を算出。 幅を求めたいだけなのでラプラシアンフィルタは{ 1, -2, 1 }を用いています。 以上の手順で改善すべき点はあるでしょうか? またサブピクセル処理でゼロクロス法を使っていますが、 他にもっと精度の高い(誤差の少ない)サブピクセル処理があれば教えていただきたいです。
LOG 二次補間
>>786 1枚の絵にされ、転用されるのを嫌がっている場合もあるんじゃなかろうか。
794 :
786 :2007/10/13(土) 09:49:21
>>787-788 ,
>>791-793 お返事ありがとうございます!
自分は今、分割されている画像を全部落としてペイントで地道につなげています^^
PrintScreenは確かに簡単ですけど、できたやつはオリジナルとは別物って認識なので…
XCOPYよかったら詳しく教えて下さい〜もう寝る時間なのでまた後ほど ノシ
>>794 ここはソフ板じゃなくてム板。自分で作るところ。
プログラム書く上でわからないことなら質問して良いと思うけど。
796 :
786 :2007/10/13(土) 12:43:40
799 :
786 :2007/10/13(土) 13:54:59
>>798 馬鹿か。そのレベルじゃねーよ。
ただ画像をつなげるにはどうしたら?ってきいているに過ぎない。
>>794 >PrintScreenは確かに簡単ですけど、できたやつはオリジナルとは別物って認識なので…
ペイントで地道に繋げてもオリジナルとは別物だと思うぞ。
デジタルデータにオリジナルも何もあるか
そこでステガノグラフィー
804 :
786 :2007/10/13(土) 18:40:09
今確認したら 元データ(6分割):103,783 bit ペイントで結合:40,911 bit PrintScreen:40,876 bit 前々から画質落ちてるとは思ってたけど、 半分以下かよ・・・拡大して比較してみたら悲惨だったorz 暇だったのでフリーの結合ソフト探したら普通にあったw それで結合しても58,680 bitでこちらも画質落ちてた…でも結合は一瞬だった\(^o^)/ と思ったら、画質指定できるみたいだったのでMAXにしたら結合後は256,107 bit 拡大して元画像と比較しても損傷なかったです〜 お騒がせしました、また何かあったらよろしくお願いします〜〜〜
プログラマじゃないならもう来ないでくれ
>>805 SE、コーダ、プロジェクトリーダもお帰り下さい、って言いたげだなあ
それにしても、ビット数で画質を比較ってどういうことだろう。 PrintScreenで画質が落ちるって言うのも意味不明だし。 まさか今時、32bitじゃない表示環境で使っているとも思えないし。 そもそも、ビット数って何を比較しているのだろう。 まさか、できあがったjpegファイルのサイズのことなのだろうか。 だとしたら、保存に使ったツールで調整可能だろうし、 そもそもjpegにしなければいいわけで。 人の話を聞かん香具師の考えていることはどうにも判らんな。
まさか本当にペイントで結合しているとは
たぶんファイルサイズを byte でなく bit と勘違いしてるな
それでも理解不能だ。
淫乱ティディベアを学会で発表するノートPCの壁紙に使いたい
813 :
デフォルトの名無しさん :2007/10/15(月) 12:21:02
任意の四角形(凹みや捩れも有り)から、(0,0)-(1,1)を対角線とする 長方形への変形転送を考えてるんだけど、ちと相談に乗ってほしいす。 転送元の任意の四角形をsrc , 転送先の長方形をdstとする。 srcとdstのどの角を対応付けるかはあらかじめ決めておく。 転送方法は、dstをyとxでループして、転送先の座標とdstの辺との 位置の比率からsrc内の対応する点を拾ってくれば問題なく出来る。 ここで、src内の1点だけ転送したい場合、転送先のdstを全領域 サーチするのは勿体無いので、それがdstのどこに対応するのか、 計算で求められるか?という問題です。 転送元が任意の四角形だから、アフィン変換では対応できず。 捩れてる場合の交点など、数学的には解が見つからないのは仕方ない けど、そのときは、プログラムとしては例外的に処理しないなど対応 すれば済むので、それ以外の場合でおおむね動作すればOKなんですが。 src内の1点→dstの対応点、計算で可能でしょうか? よろしくお願いします。
srcの外接長方形を求めて、4頂点に対応するdstの4点を求める。 あとは、dstにやっていたのと同じ計算を逆方向にする。
815 :
813 :2007/10/15(月) 14:34:41
>>814 >srcの外接長方形を求めて、4頂点に対応するdstの4点を求める。
質問は、要するにこれ「4頂点に対応するdstの4点を求める」のやり方です。
(src内ではありませんが、同じことだと思う)
そりゃおまいが書いてる >転送方法は、dstをyとxでループして、転送先の座標とdstの辺との >位置の比率からsrc内の対応する点を拾ってくれば問題なく出来る。 の計算方法次第じゃね?逆関数書けるだろう?
817 :
813 :2007/10/15(月) 15:58:06
>>816 for(yが0〜1){
for(xが0〜1){
dstとsrcの各辺の比率からsrc->dstを決定
}
}
と、おそらく一番単純な考え方だと思うんだけど、
srcの任意の点からだと、逆変換がスマートな式では
思いつかないんですよ。(dstからsrcは簡単なので、
拾ってこれる)
dstは長方形だから、dst内の任意の点は各辺からの距離に
簡単に置き換えられるんです。辺からの距離が分れば、src
の4辺を比率で割って交点からsrcの対応点を求められる。
だけど、src内の任意の点だと、srcの四隅からの距離の
比率を出せないんです。
何か見落としてますかね?
>dstは長方形だから、dst内の任意の点は各辺からの距離に >簡単に置き換えられるんです。辺からの距離が分れば、src >の4辺を比率で割って交点からsrcの対応点を求められる。 よくわかんないけど、正写像は dst 内の点を P(xp,yp) 、src の上下2辺を A,B として、対応する src 内の点 Q(xq,yq) は Q = xp ( yp A + (1-yp)B) ってことだよね。x,y の各項について書けばAを(Ax,Ay), Bを(Bx,By) として、 xq = xp ( yp Ax + (1-yp)Bx) yq = xp ( yp Ay + (1-yp)By) これを P について解くだけだよね。 何か勘違いしてんのか、おれ。
819 :
813 :2007/10/15(月) 16:28:45
>>818 それってsrcが任煮の四角形で対応できる? 検証したわけじゃないけど
srcが平行四辺形までだと思うんだが…。
820 :
813 :2007/10/15(月) 16:29:29
任煮>任意、でした
いやだから正射影はこの式であってんのかとか、 基本的な事実出してもらわないと。 この式であってるんなら解けるケースは簡単に解けるんじゃない?
822 :
821 :2007/10/15(月) 16:32:48
訂正 誤:正射影⇒正:正変換
>>821 上で書いたけどアフィン変換できないと思います。
>>818 だと、dstのAB以外の辺がsrcにどう対応するか
考慮されて無いようなので。
うーん、どう説明したもんか、ずらずらソース書くのもなんですし dstの各頂点がABCD、srcの各頂点がRSTUだとすると、(ABCDの順に時計回りに角が定義されている) →forループ方向 <=色の転送 A→B <= R→S を内側のループに書いて、 A→D、B→C と R→U、S→T を外側のループで回してdstを埋める感じですね。
825 :
821 :2007/10/15(月) 17:06:09
あスマンスマン 時計回りに4頂点を A,B,C,D として Q = xp ( yp A + (1-yp)B) + (1-xp) (yp D + (1-yp)C) か。 これもやっぱり解けるんじゃない?
826 :
813 :2007/10/15(月) 17:37:34
解けそうな気がしてきた。ありがとう
フーリエ変換で作られる虚部と実部の画像って白と黒の縞模様みたいのが ぐにゃ〜って現れますよね。それを振幅画像にすると縞模様がなくなると 思うんですけどこの現象って何故起こるんでしょうか?
>>827 質問を整理してくれ。
縞模様が現れる理由を聞きたいのか、その縞模様が「ぐにゃぁ〜って現れる」理由を聞きたいのか、
それとも逆変換できる理由を聞きたいのか、それ以外なのかよく判らん。
# 「ぐにゃぁ〜って現れる」もよく判らんが。
そもそも、変換後の周波数空間の擬似画像の意味はわかっているのか?
829 :
デフォルトの名無しさん :2007/10/16(火) 12:21:34
>>813 BC S T
p ← P dst 上での点 p の座標を p = (s, t) とします。
AD R U
変換元 P は
P = R * (1-s) * (1-t) + S * (1-s) * t + T * s * t + U * s * (1-t) ………………………… (1)
となります。(当然, P が □RSTU 内部の点の場合 0 ≦ s ≦ 1, 0 ≦ t ≦ 1)
多項式を展開して x, y 成分に分けると
Px = Rx + (Ux-Rx) * s + (Sx-Rx) * t + (Rx-Sx+Tx-Ux) * s * t ………………………… (2)
Py = Ry + (Uy-Ry) * s + (Sy-Ry) * t + (Ry-Sy+Ty-Uy) * s * t …………………………… (3)
で、ここで Q = (Rx-Sx+Tx-Ux)/(Ry-Sy+Ty-Uy) と置けば
Px - Q*Py = (Rx - Q*Ry) + ((Ux-Rx) - Q*(Uy-Ry)) * s + ((Sx-Rx)-Q*(Uy-Ry)) * t …… (4)
Py - Px/Q = (Ry - Rx/Q) + ((Uy-Ry) - (Ux-Rx)/Q) * s + ((Sy-Ry)-(Sx-Rx)/Q) * t …… (5)
となり、s, t の連立1次方程式に持ち込めます。
交点上ではQの分子・分母いずれかが 0 になるので、Q の計算か (5) でゼロ割りが
出ます。□RSTUが傾いていない矩形の場合、Q の分子分母ともゼロになるので、
その場合は (2) (3) 式の s * t の項が消えた連立1次方程式を直接解くことができます。
>>829 (4),(5)の連立方程式はまずい
とりあえず、0除算は考えないことにすると
(4) = -Q (5)
になって、(4),(5)が線形独立でない
(注:
>>829 は(4)でtの係数が間違っている)
下記の連立方程式(1),(2)を解く場合
a1 s t + b1 s + c1 t + d1 = 0 ― (1)
a2 s t + b2 s + c2 t + d2 = 0 ― (2)
まず、tで括る
(a1 s + c1) t + (b1 s + d1) = 0 ― (3)
(a2 s + c2) t + (b2 s + d2) = 0 ― (4)
(4) * (a1 s + c1) - (3) * (a2 s + c2)としてtを除去すると
(a1 s + c1) (b2 s + d2) + (a2 s + c2) (b1 s + d1) = 0
これを整理すると、
(a1 b2 + a2 b1) s^2 + (a1 d2 + a2 d1 + b1 c2 + b2 c1) s + (c1 d2 + c2 d1) = 0 ― (5)
(5)を解けば、sが1つないし2つ求まる
これを(3)または(4)に代入してtを求める
>>830 何も考えずに書くが、線分がsweepしたような図形への変換と逆変換だよね?
殆ど全ての点で解は1つなわけで、
最後が2次方程式ってのが直観と合わないんだけど。
>>827 振幅(複素数の絶対値)はパワースペクトルの平方根なわけで、
たいていの画像では高周波になるにつれて緩やかに減少するね。
もちろんパワースペクトルだけでは情報が失われまくりで画像は再構成できない。
その分の情報量が位相差になるわけだから、虚部と実部は必然的に激しい画像になる。
ちょwww激しい画像ワロタ
>>833 >激しい画像
そこだけ抜き出すな!w
フイタ
>>827 実部画像や虚部画像が白黒の縞なのは周波数ごとに位相が異なることを反映している
振幅画像には位相情報が含まれていない
>>828 すみません、自分でも理論を完璧に理解していなかったので質問が
滅茶苦茶になってしまいました。
>>832 >>835 大変わかりやすい回答ありがとうございました。
超解像アルゴリズムのいくつかのサンプルプログラムを探してるんですが どっかないですか? 出来ればC言語かC++でMATLABを使ってない奴で
C++で書いてるやつ STLとかBoost使ってる?
動画の連続フレームの超解像をする時に 被写体が移動してるわけだけど 平行移動だけじゃなく回転拡大も加わるのを どうやって光速に位置合わせするのかわからないから サンプル探してる
光速かよ
光速エスパーって三ツ木清隆だったんだな…
845 :
デフォルトの名無しさん :2007/10/22(月) 18:19:14
>>844 Lucas-Kanadeで精度を上げるには、どのあたりのパラメータをいじれば
良いのでしょうか?
人工的にずらした画像でテストしても、精度が悪く超解像画像がぼけて
しまいます。元画像で0.1ピクセル以上の精度が欲しいのですがいろい
ろいじっても、0.25ピクセルくらいの精度しか出ません。
846 :
844 :2007/10/22(月) 22:48:18
私が以前試したのは低解像度画像×20枚から4倍解像度の 人工画像のテストで見えない文字が見える程度になりました。 人工画像なら、ずれ量が既知だと思うけど、そのずれ量を使って 超解像処理は試してみましたか?それで駄目ならレジストレーションの 問題ではなく画像復元アルゴリズムの誤りだと思う。 Lucas-Kanadeのレジストレーションの位置精度は私が知りたいです。 (上のリンクでは濃淡値のRMSで精度を測ってますよね) 精度を上げるとすると変形後の画素補間とかでしょうか。
847 :
845 :2007/10/23(火) 01:25:30
>>846 既知のずれ量を使うと納得のいく超解像処理ができました。
画像復元アルゴリズムには誤りはないようです。
現在は、KLT処理の検出結果付近±1ピクセルの範囲をサブピ
クセル単位で照合していますが、処理が重いのでKLTだけでう
まくできないかと質問しました。
>>841 ではなく便乗質問です。
848 :
デフォルトの名無しさん :2007/10/24(水) 22:34:52
mean-shiftがどうしても理解できません。 何か良い本ありませんか?
849 :
デフォルトの名無しさん :2007/10/25(木) 22:31:45
天文画像を良くするRegistaxというフリーソフトですが、画質が良くなる理由は、重ねがき(コンポジット)による効果ですか、それともウェーブレットによる効果ですか?
850 :
デフォルトの名無しさん :2007/10/26(金) 19:00:45
教えて下さい。 携帯の写メに映った小さい数字を読み取る方法はないでしょうか? PCに取り込んでの拡大では読み取れませんでした。 スレチかもしれませんがどうか教えて下さい。
スレ違いすぎるよ
>>850 超解像処理か。とりあえずその画像をうpしてみろ。
853 :
デフォルトの名無しさん :2007/10/26(金) 21:15:14
>>851 そうですよね。申し訳ないです。
>>852 超解像処理ですか。
うpは恥ずかしい写真なので出来ないっす。
自分はまったくの素人なんですが、どこか
処理を頼めるようなところはありますでしょうか?
文字がまったくつぶれている(ベタ塗り)のは情報がないから無理だぞ
糞釣り死ねよ
>>853 自分でプログラム書く気ないならソフ板にでも行けば良いかと
>>850 何が写ってるのか知らんけど、その場所に今から行ってみれば?
それともひき逃げした車の後姿でも撮ったのか?
電光掲示板かも
861 :
デフォルトの名無しさん :2007/10/27(土) 19:19:20
C++で画像処理を扱っている分かりやすいサイトはありませんか? まずは画像のRGBを配列に取り出して、 いろいろなグレースケール変換をして、 結果を画面に表示したいと思っています。
C++と画像処理は切り離して考えるべきではないか
864 :
861 :2007/10/27(土) 19:37:23
862さん、「C++と画像処理は切り離して考えるべきではないか」とはどういうことでしょうか? 863さん、ありがとうございます。 ピッタリですね。さっそく読みたいと思います。
C++はC++で勉強する 画像処理は画像処理で勉強する 近道しようとすると後々困るということじゃない?そのうち俺みたいになるよ。
866 :
861 :2007/10/27(土) 19:47:02
865さん、 なるほどー、必要な箇所だけ分かればいいと思っていました。 ただ、それだと画像処理の枠から広がらないのでしょうね。 そして、基礎が不安定だとプログラミング自体も遅くなりそうですね。
867 :
デフォルトの名無しさん :2007/10/29(月) 01:33:12
>>867 普通の入門書買ってExcelに書き直した方が良いんじゃないか?
画像処理をExcelでやること自体に違和感を覚えるが
Excelと画像処理は切り離して考えるべきではないか
俺も初心者の頃似たようなこと考えたことあったけど、 Excelだと横がZZだったかIVだったかまでしかとれなくて断念した記憶があるな
872 :
867 :2007/10/29(月) 03:12:03
>>869 >画像処理をExcelでやること自体に違和感を覚えるが
実は某所で画像処理の基礎を教えることになったのだが
・Windows環境での実習を入れてくれ (重要だね)
・VCとか開発環境はない (なに〜。まぁフリーのソフトでもいれて。。。)
・PCは管理されているのでソフトの追加はできない (えぇ〜)
とのことなのです。(--;;
苦肉の策として小さな画像をCSVに変換してEXCELに読み込ませて
平滑化、エッジ処理、アフィン変換などなどをEXCELの関数を使って
書こうかなと思っているのです。
ガチガチのシステムだとマクロも禁止されてそうだし。表示は
グラフの「等高線グラフ」にすれば雰囲気は分かるかな。
>>872 画像処理の知識は既にあるってこと?
だったらあとはExcelの勉強だけすればいいじゃん。
>>872 Javaは標準ではランタイムしか入ってないんだっけか。Javaがあればアプレットで色々できそうなんだが。
入門レベルだったら自前で資料作るだけでいいんじゃない?
>>871 Excelの列数の最大値は256
>>872 代替案としてjsでプログラミングというのはどう?
画像表示はどこかのWebサーバにデータ送信、画像出力で
インターネットに繋がってない場合は、divかtableで1pxのセル並べて背景色変更でw
Retina(l) samplingについての実装例(プログラム)がなかなか見つかりません。 ご存知の方教えてください
ゲームなどにおける爆発の効果などを勉強したいのですが、お薦めの本などがありましたら教えてください。
880 :
bicubic :2007/11/04(日) 14:26:45
Cやmatlabで拡大時の補間ってどう打つの? bicubicとかlanczosとか。 あ〜オレってアフォだぁ〜
>>878-880 死ね役立たず。
人の足引っ張って楽しいかゴミクズ。
今すぐ死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。v死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。死ね。
882 :
導師 :2007/11/04(日) 23:45:16
喝!
883 :
デフォルトの名無しさん :2007/11/07(水) 12:42:52
ターミネータ2に出てくるようなオブジェクトに金属感を与えたいのですが、 どのようにするのが常套手段なのでしょうか
CG板
886 :
デフォルトの名無しさん :2007/11/08(木) 23:22:23
IDL使ってる人いますか?
887 :
デフォルトの名無しさん :2007/11/10(土) 23:16:34
>>887 ウェーブレットあんま知らんけど
int sum = (input[i*2]+input[i*2+1]) / 2;
int difference = (input[i*2]-input[i*2+1]) / 2;
>>888 隣接する平均を常に取っていくということですよね。
これでちょっと試してみます
890 :
デフォルトの名無しさん :2007/11/14(水) 22:31:18
質問します。 なぜ画像データはテキストデータに比べて容量が大きいんですか?
python のPILが便利 しかしc++とのインターフェイスがnumpy経由でしかないのが いまひとつ
IPL/OpenCV使い始めた やはりネックはドキュメントだな IPL2.5よりIPPがかなり速いなら買っちまうか・・・
>>890 画像と同じだけの情報をテキストで与えてみてくれよ。
「百聞は一見に如かず」って言うだろ。
BMPをPPM(ASCII)で保存してみてくだしあ
ははは、テキストデータ1MBと画像データ1MBは、同じ大きさですが、なにか?
あ?
どこぞにはテラバイト級の画像もあるらしいが
>>899 これはたしかに紛れもなく2GBの画像だなwwwww
便乗ですが、truetype のフォントって、漢字で平均何バイト位? よくフォントのこと知らないんで、質問が悪かったら、意を汲んで下さい。
すべての生物の身長の平均を聞くくらい無意味な質問だな
>>902 結局どの程度まで手を入れてフォントが作られているかで変わる。
手元にある適当なフォントのファイルのサイズを文字数で割ってみたら?
906 :
902 :2007/11/19(月) 19:25:27
各氏のレスに感謝。 自分の win98 機をみると、Fonts フォルダの中の HG正楷書体.ttf のサイズは 4,088 KB となっている。漢字は第一、第二水準が含まれるのが相場らしいので その計 13,000 字で割ると、314 バイト/字になる。(明朝でも似たようなもの) こんなものということでしょうか。
お前が納得するならそれでいい
>>906 フォントの中には表示が不自然にならないように、特定のサイズだけ別に用意したビットマップのフォントを埋め込んでる場合がある
だれも"13,000字"には突っ込んでやらないのか
そもそもフォントの1文字当たりのサイズを調べて何がしたいのか理解できない
>>911 >903によれば、ノアの箱舟でも作るのには役に立つのかもしれない。
平均身長以下の動物が乗せられない船ができたりw
???
156cmだな
916 :
902 :2007/11/22(木) 10:16:18
>>911 別に何をしたいってわけではないよ。
画像ファイルとテキストファイルのサイズの話があって、テキストの方が小さいのは
フォントのせいだなと思ったが、どれくらいかなと疑問の思っただけ。
話が飛躍するが、情報量ってのは表記法が定まっていれば送る「電文」は短くて済む。
フォントがあるからテキストは短い。ある種の数式は特に変数の意味を言わなくても
分かる場合がある。ある種の数は単位を付けないと誤解される。話の流れではなくて
もすむ。
山本周五郎は最後の一行のためにそれまでの文章があるとか言っていた。
それまでの文章はいわば表記法の説明だな。
「おい」というだけで相手が準備するって素晴らしいと思わないか。
表記法を共有するために、時間と金を掛けたとも言えるナ。
無駄な議論だ。 JISの16x16dotフォントなら、最初から256bitだと判り切っている。 # 尤も、複雑な漢字は区別できなくなるが。
>>916 言いたいことはわかるが、いきなりtruetypeの話を持ち出したから誤解されたんだと思うよ。
あなたの興味からすると、「フォント」というよりは、一文字あたりの情報量なので、
文字コードの話が適切になる。s-jisとかユニコードとかでググルと幸せになれるかも。
スルーを閃くしか道が無いな
疑問と思考に情報収集能力がついていってない 自分を子ども扱いしないで答えをネットの海から探し出すよう訓練汁 何百人がズコーしたとおもってるんだw
最近のゆとりは考えることを放棄して ネットから回答得ようとしてるのが多いそうだ
>>916 こう言う奴はバイナリとかPCがデジタルでON、OFFしかないという概念がない
>>916 究極の質問の中には、おのずと解答が含まれいるんだぜ
>>916 フォントは全然関係ないだろ
無圧縮画像なら字があろうが無かろうがサイズは変わらんし
文字コードの情報量とピクセルの情報量の違いだろ
そうだなあ。 なにか基準になるフォントがないとなあ。 JIS例示字体?
なにがそうだなあ。なんだ? というかそろそろ画像処理の話をしろよ
電磁波の波長からRGBの値を返すような関数無い? 特に正確である必要はないのだけど。
ありますよ
Photoshopのレンズ補正のゆがみ補正みたいな変形をしたいんですが、 どうやるもんなんでしょうか。
半径からの距離に応じて(リニアじゃないけど) ピクセルを外(内)側にずらせばいいよ
幾何光学的にレンズを律儀にシミュレートしみてるとか面白いんじゃないかな。
>>931 まあ、実際の方眼紙を実際のレンズを通してみたところを
デジカメかなんかで撮影すれば面白いだろうさね
デジカメ自身のレンズが...w
>>933 あーそうか。
ということは。
あらかじめ方眼紙をデジカメでとって、その変換の逆関数をつくらなあかんな。
936 :
929 :2007/11/24(土) 00:09:56
レンズをシミュレートするなんてことは俺には無理です・・・
方眼紙を撮影するってのは、例えば1cmの方眼を撮影して、
各交点毎のずれをテーブルにしてそれを元にピクセルをずらし、
間は補完してってやればある程度はそれっぽくなりますかね?
>>930 半径からの距離というと、画像の大きさの円を描いて、
その円周上からの距離が遠いほど大きくずれるようにするってことですか?
全然理解してなかったらすいません。
>>936 の前半
なるだろうね。
間は線形補間かなんかで十分じゃね?
何も考えずにDirectXやOpenGLでガラスの球体を入れて終わらせたいな
レンズをシミュレートするなんてことは簡単だよ
>>936 undistort でぐぐったら情報があると思う。
自分はそうして、糸巻き型の歪みを修正するルーチンを組んだ。
どれ位補正するかを slider で見るようにして、目視で決めた。
自分は理解できなかったが、OpenCV にも将棋盤のパターンを使った
補正のソースがあったと思う。
リファレンスに使えるラインがあれば、糸巻き収差の補正量は計算で求められるんだけどね。
一般的に、2次スプライン曲線1本を、好きな場所で二つの2次スプライン曲線に分割 出来るものなのでしょうか?
つまり方眼紙を用いた復元パターンさえ事前に用意しておけば ベトベトスライムに犯される女戦士の、スライム内の状態像を復元できるということか
>>943 非一様Bスプラインならノット挿入で簡単に分割できるよ。
946 :
943 :2007/11/26(月) 07:57:01
やってみます。 ありがとうございました。
947 :
デフォルトの名無しさん :2007/11/26(月) 18:17:03
imagemagicのアニメーション機能にて質問なんですが、 convert -delay 100 magick[1-2].gif anime.gif 上記で作成する場合に、アニメーションさせる画像のサイズが異なる場合に(例 100*100と200*200 ) それぞれのサイズで表示する事は可能でしょうか? というのは、このまま作成すると100*100の画像を先に読み込んだ場合には、200*200の画像が100*100 の範囲でしか表示されず、200*200を先に読み込んだ場合には、200*200の画像の上に100*100の画像が 表示されてしまいます。
アニメーテッドGIFはサイズ固定。大小どちらかに合わせるしかない。 合わせ方は、ImageMagickならいろんな方法があったはずだからがんばって調べてくれ。
949 :
947 :2007/11/26(月) 18:54:36
やっぱり無理でしたか、サイズ調整してやります。 ご回答ありがとうございました。
950 :
Org :2007/12/02(日) 12:12:08
FOX ★ DSO(Dynamic Shared Object)
951 :
Org :2007/12/02(日) 12:12:52
215 KB [ 2ちゃんねる 3億PV/日をささえる レンタルサーバー \877/2TB/100Mbps]
スプライト処理をしたいのですが createBitmapでマスクを作ってBitBltで合成していく方法と ファイルとして読み込んでピクセルごとに透明色を判定してそれ以外をコピーしていくのでは どちらが負荷や速度的に有利になりますか?
>>952 やってみたら? こちとらあんたがどんな環境でどんな画像を使っているのか判らんから何とも言えんので。
955 :
デフォルトの名無しさん :2007/12/06(木) 01:25:33
BitBltはハードウェアアクセラレータが使えるから 恐らく前者だろうな DirectXとかなら後者でもハード対応してるのか?
ただ現実問題として、それ以外の処理をしたいことが多いから 速度だけの問題でもないんだよな
いまどきソフトウェアでやるならARGBのAにマスク仕込むのが一番な気もするが。
>>958 なぜいきなりフォーマットの話に・・・
いずれにしても、最初の 953でFAだろ。
どっちも十分速いと思うのですが。
>952がどんな環境かも書いていないのに勝手に憶測でレスしても詮無いだろ。 もしかしたらWineかもしれないし、WABIだったりするかもしれないし、そうでなくてもWinCEかもしれないじゃないか。
いいえ、ケフィアです。
半透明の処理ってどのようにやるのでしょうか? RGBとAの値があった場合、Aは、最終的なRGBを決定する際にどのように使えばよいのでしょうか?
半透明と言っても色々あるが、最も一般的なのは Src*α+Dest*(1-α)
src + dest * (1-α) も多いぞ
YUV422に関して、ど素人なのですが 再生用YUV422のサンプルファイルと、 再生用サンプルプログラム等を ダウンロード出来るサイトご存じの方いませんでしょうか?
>>966 なんだかよくわからないんだが、YUV422って単なる色の表現方法じゃないの?
再生用プログラムって何?
>>966 マルチ乙
レスがないのは、
・誰も答えを知らない場合
・質問の内容が曖昧だったり意味不明な場合
が考えられる
3×3の一様重みフィルターで2階差分画像ってどんな画像になりますか?
(x, y)の点列があって、それが閉じた面を作ります。 例えば正方形の場合、 (x0, y0) = (0, 0) (x1, y1) = (1, 0) (x2, y2) = (1, 1) (x3, y3) = (0, 1) (x4, y4) = (0, 0) ある点P(X, Y)が与えられたときに、 点Pがこの閉曲線の中にあるかを調べるには、 どんなアルゴリズムがありますか?
974 :
デフォルトの名無しさん :2007/12/15(土) 17:43:11
>>973 グーグルソースコード検索で
isinsidepolygon
で出てくるソースを解析
>>973 画像処理というより計算幾何学の気ガス。
面というか多角形だよな?
おおまかに言って
1.
点から半直線を伸ばし、多角形の辺との交点数の偶奇で判定
2.
点と多角形の各辺とが成す偏角の総和
で判定する方法がある。
あとは上記のキーワードでググれば分かる筈。
>>973 凸多角形限定かどうかで、だいぶ違う。
凸限定だと簡単な処理が多い。
画像にグローを掛ける処理についての質問なんですが、 グローを掛けるには、元の画像をガウスぼかしなどでぼかしたもの を元の画像に加算するという流れであっているでしょうか? どうもAEのグローエフェクトとは違うみたいなのですが、あれは 全く別物として考えた方が良いのでしょうか? (参考にするものを間違っているような気がしなくもないですが…)
グロ画像を加工するのかと思ってしまったじゃないか。
AEとか知ったこっちゃない
じゃ埋めるか
9+8=4
985 :
598 :2007/12/16(日) 17:44:06
9 + 8 = 5
幾何平均フィルターって何ですか?
手がかりとなるキーワードを質問させて下さい。 カメラを2台(or複数台)使用して、2mm球程度のマーカの3次元位置(XYZ)を 計測するシステムを構築したいと考えています。 対象空間の大きさは50cm立方程度です。 (検索では視差を利用した研究などはよく見つかるのですが、 カメラの配置が自由であればもっと簡単に精度良く取得する方法もあるのでは無いかと考えています。 また、光学式マーカを使用した専用システムは高価なので、できれば避けたいと思います。) また、実例などありましたらどうぞ宜しくお願いします。
あまり詳しくないけど、 2つのカメラの座標、向き、レンズ特性が分かっていて どの方向からの画像でも同定可能なマーカを使えば 自由に配置しても計算出来るんじゃないか?
何時だったかの映像情報メディア学会か何かで紹介されてた アメリカ人が「カメラは沢山使うんだ!」と力説してた。 被写体が何かの影になったりとかそういうことに対処できるし、 超解像etcもできるし、とにかくたくさんのカメラで撮っておけば ウマーだと。
物量作戦か。アメリカらしいな。
ロボットアームの先にカメラ取り付けてあらゆる角度から撮影して合成、 てなシステムもあるな。結構誤差出そうだけど。
>988 なんでもいいから視野のなかに固定できる物があれば目安でいけるんじゃないだろうか エピポーラ線だかエピポーラ平面だかというキーワードを思い出した
>>988 のは大学院や企業で研究されるレベルの話だから、アイデア求めるのはちょいと厳しい気が。
自分の飯のタネを掲示板で簡単に晒したりはしないんじゃ…
988の書いた条件が俺の考えている事と同じ過ぎて困るぜ。 具体的に何かやってるわけじゃなくて、そのうち手を付けたいという段階だが。
.
.
.
.
1000ならジュースでも飲むか
1001 :
1001 :
Over 1000 Thread このスレッドは1000を超えました。 もう書けないので、新しいスレッドを立ててくださいです。。。