前半:相澤先生
(問1)
- コサイン4乗則とは何かを述べよ。
- 位相差オートフォーカスについて説明せよ
- 色白の友人をデジタルカメラで撮影した。その画像を確認したところ、青い顔に写っていた。その理由として考えられることを述べよ。
(解答)
- 画像中心での画像の明るさに対して、画像の周辺部の明るさを周辺光量と呼び、画像周辺部が画像中心に対して暗くなる現象を 周辺光量の低下 と呼ぶ。この原因の1つがコサイン4乗則で、光軸に対する入射角度を \(\theta\) とした時、投射面上の照度がコサインの4乗に比例する現象である。コサイン4乗則は、レンズの絞り値には関係しない。
- オートフォーカス専用センサーを設けて結像位置のずれから瞬時に合焦位置を算出して焦点を合わせる方法。計測と撮像を切り替えられる一眼レフ式での利用が始まる。
- カメラのホワイトバランス機能を用いずに蛍光灯の下で撮影したためと考えられる。昼間の太陽光の色温度は5500K程度であるが、この値より低くなるほど光源の赤みは増し、高くなるほど青みが増す。したがって、色温度が高い蛍光灯などの下で撮影したことが原因であると考えられる。
(問2)
次のそれぞれの場合において、空間フィルタを画像に適用したい。どのようなフィルタを適用すればよいか。その原理と理由を述べよ。必要に応じて数式も用いること。
- 画像からエッジを抽出したい
- 画像中の大振幅スパイクノイズを除去したい
- 画像中のエッジを保持しながら、ガウシアンノイズを除去したい
(解答)
- @LoGフィルタ@: ガウス関数のラプラシアンを計算しておき、それを係数としたフィルタである。ラプラシアンで値がゼロ交差するところがエッジの位置となる。ガウス関数を用いるのは、ラプラシアンによってノイズが強調されてしまうのを平滑化の影響で小さくするため。
- @メディアンフィルタ@: 注目画素を中心とした領域の輝度値の中央値を出力としたフィルタである。中央値を採用することによって外れ値に相当するスパイクノイズを除去できる。
- @バイラテラルフィルタ@: 注目画素からの距離による重みと注目画素との画素値の差に応じてガウス分布に従う重みをつけた平均化を行うフィルタである。輝度値が離れるほど重みが小さくなるため、エッジ周辺の画素値が混ざらずにエッジが保存される。
(問3)
- \(\gamma\) 補正について説明せよ
- トーンカーブとは何か
- ヒストグラム平坦化とは何か。どのような効果が得られるか。
(解答)
- もともとは、陰極管の物理特性により、ブラウン管テレビの¬「入力信号の電圧」と「出力する輝度」の間にリニアな関係がなかった¬ことを是正するために、放送局側で色情報を調整するための変換を¬ガンマ変換(ガンマ補正)¬と呼んだ。これは
$$y = 255\left(\frac{x}{255}\right)^{\frac{1}{\gamma}}$$で表される式で入力値 \(x\in[0,255]\) を補正する変換式であり、ブラウン管補正のガンマ特性は \(\gamma=2.2\) であった。 なお、式からわかるように、\(\gamma > 1\) の時はトーンカーブが上に凸に、\(\gamma < 1\) の時は下に凸になる。
- 入力画像のそれぞれの画素値に対し、出力画像の画素値をどのように対応づけるかを指定する関数、階調変換関数をグラフで表したもの。
- 結果として、出力画像のヒストグラムが画素値の全域にわたって均等に分布するようにする変換のこと。これによって、画像の明暗がわかりやすくなる。
後半:山崎先生
(問4)
パーセプトロンの学習が収束するまで表を埋めよ。
- 初期重み \((w_2, w_1,w_0) =\)(学生証番号下2桁、下1桁、1)
- 学習率 \(\eta=1\)
- 学習データ
- \((x,y) = (0, 1) (1, 2 )\) のとき、正解ラベルは \(1\)
- \((x,y) = (2,1)\) のとき 正解ラベルは \(0\)
- 入力値は \(x_0 = 1, x_1 = y, x_2 = x\)
- 出力は
$$\begin{cases} 1 & \text{if $w_2x_2 + w_1x_1 + w_0x_0 \geq 0$}\\ 0 & \text{otherwise.} \end{cases}$$
(解答)
初期重み \((w_2, w_1,w_0) = (0,3,1)\) とする。
Step | \(x_0\) | \(x_1\) | \(x_2\) | 真理値 | \(w_0\) | \(w_1\) | \(w_2\) | 出力値真理値-出力値 | \(\Delta w_0\) | \(\Delta w_1\) | $\Delta w_2 |
---|---|---|---|---|---|---|---|---|---|---|---|
1 | 1 | 1 | 0 | 1 | 1 | 3 | 0 | 1 | 0 | 0 | 0 |
2 | 1 | 2 | 1 | 1 | 1 | 3 | 0 | 1 | 0 | 0 | 0 |
3 | 1 | 1 | 2 | 0 | 1 | 3 | 0 | 1 | -1 | -1 | -1 |
4 | 1 | 1 | 0 | 1 | 0 | 2 | -2 | 1 | 0 | 0 | 0 |
5 | 1 | 2 | 1 | 1 | 0 | 2 | -2 | 1 | 0 | 0 | 0 |
6 | 1 | 1 | 2 | 0 | 0 | 2 | -2 | 0 | 0 | 0 | 0 |
(問5)
Harrisのコーナー検出系において、数式によりアルゴリズムの概要を説明せよ。
(解答)
¬ハリスのコーナー検出(Harris corner detector)¬は、画像からコーナーを検出する手法である。なお、コーナーとは、「周辺と自己相似性が低い所」
- 入力画像に対する \(x,y\) 方向の勾配画像 \(I_x,I_y\) を生成する。(例えば、ガウス関数 \(G(\sigma)\) を \(x,y\) の各方向で微分した \(G_x(\sigma),G_y(\sigma)\) を画像に畳み込むことで勾配画像を求める。)
- 各勾配画像の積により、各方向における勾配の大きさを算出する。
$$I_{x2}=I_x\cdot I_x, I_{y2}=I_y\cdot I_y,I_{xy} = I_x\cdot I_y$$
- \(I_{x2},I_{y2},I_{xy}\) の局所領域における勾配の総和 \(S_{x2},S_{y2},S_{xy}\) を求める。\(I_{x2},I_{y2},I_{xy}\) は局所領域における単純な総和でも良いが、以下に示すようなガウス関数 \(G(\sigma^{\prime})\) による重み付き和を用いることが多い。
$$S_{x2}=G(\sigma^{\prime})\ast I_{x2},\ S_{y2}=G(\sigma^{\prime})\ast I_{y2},\ S_{xy}=G(\sigma^{\prime})\ast I_{xy}$$
- 画素 \((x,y)\) における局所領域の勾配の総和 \(S_{x2}(x,y),S_{y2}(x,y),S_{xy}(x,y)\) を要素にもつ行列 \(\mathbf{M}(x,y)\) を定義する。
$$\mathbf{M}(x,y) = \left[\begin{array}{lll}{S_{x2}(x,y)} & {S_{xy}(x,y)} \\ {S_{xy}(x,y)} & {S_{2y}(x,y)}\end{array}\right]$$
- 画素 \((x,y)\) がコーナーである場合、行列 \(\mathbf{M}\) の固有値 \(\lambda_1,\lambda_2\) は共に大きな値となる。そこで、コーナー関数 \(R\) を以下のように決める。なお、\(k\)は\(0.04\sim0.06\) が最適値とされている。
$$R = \operatorname{det}\mathbf{M} - k\left(\operatorname{tr}\mathbf{M}\right)^2$$
- 上式の値が局所的な最大値となる画素をコーナーとして検出する。実際には、画像中に非常に多くの局所的な最大値が存在するため、上の値に対して適当なしきい値を設け、有効なコーナーだけを選択する。
(問6)
シーンの奥行き計測したい。手法を3つ挙げ、その原理の概要とお互いの手法の利害損失を述べよ。
(解答)
名前 | 原理 | 長所 | 短所 |
---|---|---|---|
スポット光投影法 | レーザー光を照射して戻ってくるまでの時間を計測して距離を計算する。 | 単純な原理のために信頼性⾼く計測できる。 | ⼀回の画像で⼀点の計測しかできず計測時間が⻑い。 |
スリット光投影法 | 線状の光を照射してその線の歪みから奥⾏を推定する。 | ⼀回の画像で線上の点の奥⾏が計測できるため⽐較的⾼速である。 | 1枚の画像からすべての点の奥⾏がわかるわけではない。 |
コード化パターン光投影法 | 対象物に対して既知のパターンを照射してその歪みから奥⾏を推定する。 | 1枚の画像からすべての点の奥⾏がわかる。 | コードの復号化の計算コストが⾼く、細部の計測が難しい。 |