Visualisierung von Rauschen: Digitalkamera

Digitalkamera

Bei einer Digitalkamera nutzen die Pixel des Bildsensors den photovoltaischen Effekt aus: Einfallende Lichtstrahlen (d.h. die Photonen) lösen einzelne Elektronen (negativ geladen) aus den Siliziumatomen und hinterlassen dort Löcher (negativ geladen). Die Elekronen wandern zu einem Pol, die Löcher zum anderen: Es fließt ein Strom, der ausgelesen wird und die Bildinformation ergibt. Bevor die Ladungen die Pole erreichen, können sie jedoch untereinander rekombinieren, d.h. ein Elektron rekombiniert mit einem Loch. Dies ist ein Zufallsprozess, die Rekombination geschieht, wenn Elektron und Loch sich zu nahe kommen. Hierdurch schwankt der erzeugte Strom auch bei konstantem Licht in zufälliger Weise. Wird nun der Strom vom Bildensor verstärkt, so wird auch das Rauschen verstärkt (und zusätzlich das Rauschen der elektronischen Schaltung, das es ebenfalls gibt). Filmt man bei Dunkelheit mit einer hohen ISO-Zahl (= hohe Verstärkung), so sieht man die zufällige Rekombination der Elektronen-Loch-Paare.

Der folgende kurze Film zeigt diesen Effekt, den sie auch bei ihrer Digitalkamera reproduzieren können. Zwischdurch wird die ISO-Zahl kurzzeitig abgesenkt, so dass das Bild dunkler aber rauschärmer wird. Gegen Ende des Films wird die ISO-Zahl wieder erhöht, so dass sich das Rauschen wieder erhöht. Das Rauschen erscheint als Farbrauschen, da die Pixel des Bildsensors unterschiedlichen Farben zugeordnet sind (Stichwort: Bayer-Filter).

Stochastisches Modell


Ein einfaches stochastisches Modell für das Rauschen eines Pixels ist gegeben durch

$$ Y = \mu + \epsilon $$

Hierbei ist $ \mu $ die tatsächliche ("wahre") Pixelintensität (also das wahre Signal) und $e$ die Rauschkomponente, modelliert durch eine Zufallsvariable, welche die zufällige Schwankung um die Nulllage modeliiert. Dies wird mathematisch beschrieben durch die Forderung, dass
$$ E( \epsilon ) = 0 $$
gilt. Das Ausmaß des Rauschen wird durch die Varianz
$$ \sigma^2 = Var( \epsilon ) $$
beschrieben. Ein Bild mit einer Auflösung von \( n \times m \) Pixeln können wir durch eine Matrix von Zufallsvariablen modellieren:
$$ \mathbf{I} = \bigl( Y_{ij} \bigr)_{1 \le i \le n \atop 1 \le j \le m} $$
\( Y_{ij} \) bezeichnet hierbei das gemessene Signal des Pixels in der $j$ten Spalte der $i$ten Zeile des Bildes. Für jeden einzelnen Pixel nehmen wir an, dass das obige Modell gilt, d.h.
$$ Y_{ij} = \mu_{ij} + \epsilon_{ij} $$
mit Zufallsvariablen \( \epsilon_{ij} \), für die gilt:
$$ E( \epsilon_{ij} ) = 0 $$
Die Matrix \( \mathbf{M} = ( \mu_{ij} )_{1 \le i \le n \atop 1 \le j \le m} \) repräsentiert also das wahre Bild, das aufgrund der oben beschriebenen Zusammenhänge verrauscht ist, so dass wir anstelle von \( \mathbf{M} \) lediglich die Matrix \( \mathbf{Y} = ( Y_{ij} )_{1 \le i \le n \atop 1 \le j \le m} \) beobachten können.

Ein Kurzdarstellung der Funktionsweise eines Bildsensors finden Sie auch hier:  https://www.youtube.com/watch?v=ZZFVsKobznU