电磁光谱与可见光谱


电磁辐射波

在实际的图像处理应用中, 最主要的图像来源于电磁辐射成像. 电磁辐射波包括无线电波, 微波, 红外线, 紫外线, 可见光, X射线, γ\gamma射线. 电磁辐射波的波谱范围很广, 波长最长的无线电波为3 ×\times 102{10}^{2} m, 其波长是可见光波长的几十亿倍; 波长最短的是γ\gamma射线, 波长为3×10173\times{10}^{-17}m, 其波长比可见光小几百万倍.

image-20200611203701011

image-20200611203731225

太阳的电磁辐射波

太阳的电磁辐射波恰好主要占据整个可见光谱范围. 可见光随波长的不同层次呈现出紫, 蓝,绿, 黄, 橙, 红六种颜色, 白光是有不同颜色的可见光混合而成. 人从一个物体感受到的颜色是由物体反射的可见光的额特性决定的, 若一个物体反射的可见光在所有可见光波长范围内是平衡的, 则对观察者来说显示的是白色; 若一个物体只反射可见光谱中有限范围的光, 则物体就呈现出某种颜色.

相关概念

  • 仅有单一波长成分的光称为单色光, 含有两种以上波长成分的光称为复合光, 单色光和复合光都是有色彩的光
  • 没有色彩的光称为消色光, 消色光就是观察者看到的黑白电视的光, 所以消色是指白色, 黑色和各种深浅程度不同的灰色.
  • 消色光仅有亮度或强度,通常用灰度级(gray level)描述这种光的强度.

电磁辐射波的成像方法及其应用领域

不同电磁辐射波有各自的成像方式, 其应用领域也不尽相同.

image-20200611205107902

image-20200611205123747

image-20200611205141538

image-20200611205153389

image-20200611205206244

image-20200611205220795

人眼的视觉特性

视觉系统的基本构造

眼球结构

  1. 平均直径: 20mm
  2. 虹膜: 2mm~8mm控制入光量
  3. 视网膜: 图像视觉
  4. 视椎体: 颜色和视觉识别600~700万
  5. 视杆体: 亮度敏感, 分辨物体的阴暗7500万~15000万

image-20200620132235793

视觉过程

  • 包括: 光学过程; 化学过程; 神经处理过程

光学过程: 物体在视网膜上成像

image-20200620132534649

整个视觉过程:

image-20200620132639978

视觉=“视”+"觉"

亮度适应能力

实验表明: 主观亮度, 人的视觉系统感受到的亮度与进入人眼的光的强度成对数关系.

image-20200620132929014

  • 特点一: 人眼亮度适应总的范围相当大
  • 特点二: 外界光强确定后, 人眼的亮度适应动态范围并不大
  • 特点三: 当外界光强变化时, 人眼亮度又适应另一个小的动态范围

明亮–>较暗: 逐渐能够看清物体–>暗光适应(20~30s)

较暗–>明亮: 逐渐能够看清物体–>亮光适应(1~2s)

人眼对从亮突变到暗环境的适应能力称为暗适属性.

视觉暂留

人眼对亮度变换跟踪滞后的性质称为视觉惰性(短暂的记忆特性)

image-20200620133729942

同时对比度

亮度对比

  • 背景亮度不同, 人眼所感受到的主观亮度也不一样.
  • 亮背景下显得暗, 暗背景下显得亮, 这种效应叫同时对比度

image-20200620134113113

亮度区分能力

假设一个平面如磨砂玻璃一样散光, 被1个强度为II 且可以变化的光源从背后照亮, 1个照度增量为ΔI\Delta I, 想短促的闪光一样加在均匀照明的平面上, 可使人感到平面中间像一个圆形亮点.

image-20200620134704367

如果ΔI\Delta I不够亮, 实验者没有感知上的变化, 当ΔI\Delta I逐步增强, 感知上发生变化.

如果50% 的机会感知亮度变化, 则量ΔI/I\Delta I/I为韦伯率, 小的韦伯率表示可区分强度的小变化, 有较好的亮度区分能力; 大的韦伯率表示只有大的强度变化才能区分, 有较差的亮度区分能力.

马赫带

image-20200620135209445

视觉错觉

image-20200620135252347

栅格火花错觉

image-20200620135359768

长度与透视

image-20200620135423180

线AB和线CD长度完全相等, 虽然他们看起来相差很大.

曲线正方形

image-20200620135631336

正方形看起来是变形了, 但其实它们的边线都是笔直且平行的. 比尔\cdot切斯赛尔创作了这个曲线幻觉的视觉艺术版本.

图像的采样和量化

图像成像模型

  • f(x,y)f(x,y)i(x,y)i(x,y)r(x,y)r(x,y)都成正比

f(x,y)=i(x,y)r(x,y)f(x,y)=i(x,y)r(x,y)

  • i(x,y)i(x,y)由光源决定 0<i(x,y)<0<i(x,y)<\infty

  • r(x,y)r(x,y)的值由场景中的目标特性所决定 0<r(x,y)<10<r(x,y)<1

{典型值: 黑天鹅绒: 0.01; 不锈钢 : 0.65; 粉刷的白墙平面: 0.80; 白雪: 0.93}

图像的采样和量化

图像数字化

  • 将代表图像的连续(模拟)信号转换为离散(数字)信号的过程称为图像数字化
  • 步骤: 采样和量化
  • 主要技术:
    • 成像: 光信息–>电信号
    • 模数转换(A/D Converter)

数字化(采集)设备

  • 基于图像采集卡或图像卡(扫描仪)
  • 本身带有数字化部件(数码相机)

image-20200620141951128

关键部件

  • 电荷耦合器件CCD(Charge Coupled Devices)
    • 利用电荷存储, 传送和读取方式进行工作
    • 特点: 精确, 尺寸小, 灵敏度高, 分辨率高
    • 主要设备: 摄像机, 扫描仪, 数码相机
  • 互补型金属氧化物半导体CMOS
    • 特点: 集成性好体积更小
    • 主要设备: 可摄像手机
  • 电荷注射器件CID
    • 对光的灵敏度低, 随机访问像素

实例: 数字化过程

image-20200620142518971

采样网络

image-20200620142555686

采样示意图

image-20200620142633493

采样

  • 空间坐标的离散化称为空间采样, 简称采样, 确定了图像的空间分辨率
    • 即用空间上部分点的灰度值代表图像. 这些点称为采样点

量化

  • 对采样点亮度(灰度)值的离散化过程. 确定了图像的灰度分辨率
  • 两种量化: 均匀量化, 非均匀量化
    • 均匀量化: 将样点灰度级值等间隔分档取整, 称为均匀量化
    • 非均匀量化: 将样点灰度级值不等间隔分档取整

采样和量化的级数

  • 假定图像取MNM*N个采样点, 对样点值进行G级分档取整
  • M,N,G一般取2的整数次幂
  • M=2m; N= 2n ;G= 2k;

数字图像表示

  • 函数: 2-D数组f(x,y)f(x,y)
  • 矩阵 F=[f11f12f1Nf21f22f2NfM1fM2fMN]\boldsymbol{F}=\left[\begin{array}{cccc}f_{11} & f_{12} & \cdots & f_{1 N} \\ f_{21} & f_{22} & \cdots & f_{2 N} \\ \vdots & \vdots & \ddots & \vdots \\ f_{M 1} & f_{M 2} & \cdots & f_{M N}\end{array}\right]
  • 矢量 F=[f1f2fN]\boldsymbol{F}=\left[\begin{array}{llll}\boldsymbol{f}_{1} & \boldsymbol{f}_{2} & \cdots & \boldsymbol{f}_{N}\end{array}\right] fi=[f1if2ifMi]T\boldsymbol{f}_{i}=\left[\begin{array}{llll}f_{1 i} & f_{2 i} & \cdots & f_{M i}\end{array}\right]^{\mathrm{T}} i=1,2,,Ni=1,2, \cdots, N

空间分辨率和灰度分辨率

  • 数字图像 f(x,y)=[f(0,0)f(0,1)f(0,M1)f(1,0)f(1,1)f(1,M1)f(N1,0)f(N1,1)f(N1,M1)]f(x, y)=\left[\begin{array}{cccc}f(0,0) & f(0,1) & \cdots & f(0, M-1) \\ f(1,0) & f(1,1) & \cdots & f(1, M-1) \\ \vdots & \vdots & \ddots & \vdots \\ f(N-1,0) & f(N-1,1) & \cdots & f(N-1, M-1)\end{array}\right]
  • 图像(水平)尺寸M: M=2mM=2^{m}
  • 图像(垂直)尺寸N : N=2nN=2^{n}
  • 像素灰度级数G (k-bit) : G=2kG=2^{k}
  • 像素所需的位数b: b=M×N×k=N2k(M=N)b=M \times N \times k=N^{2} k(M=N)
  • 例如:
    • 存储1幅32*32, 16个灰度级的图像需要4096bit
    • 存储一幅128*128, 64个灰度级的图像需要98304bit
    • 存储一幅512*512, 256个灰度级的图像需要2097152bit

空间分辨率所产生的效果

image-20200620144433826

  • a:512*512
  • b: 256*256
  • c: 128*128
  • d: 64*64
  • e: 32*32
  • f: 16*16

图像的质量随着N的增加而增加

  • 在抽样时, 若横向的像素数(列数)为M, 纵向的像素数(行数)为N, 则图像的总像素数为M*N个像素
  • 一般来说, 采样间越大, 所得图像像素数越少, 空间分辨率低, 质量差, 严重时出现马赛克效应;
  • 采样间隔越小, 所得图像的像素数越多, 空间分辨率越高, 图像质量好, 但数据量大.

图像灰度分辨率变化所产生的效果

image-20200620144707241

  • a: 256
  • b: 64
  • c: 16
  • d: 8
  • e: 4
  • f: 2

图像的质量随着G(k)的增加而增加

灰度分辨率变化对图像视觉效果的影响

随着图像分辨率的降低, 图像的细节信息逐渐消失, 伪轮廓信息在逐渐增加.

图中由于伪轮廓信息的积累, 图像已经显现出了木刻画的效果. 由此也说明: 灰度分辨率越低, 图像的视觉效果越差.

空间和灰度分辨率同时变化

image-20200620145826372

  • a: 256*256,128
  • b: 181*181 , 64
  • c: 128*128 , 32
  • d: 90*90 , 16
  • e: 64*64 , 8
  • f: 45*45 , 4

量化等级越多, 所得图像层次越丰富, 灰度分辨率高, 图像质量好, 但数据量大;

量化等级越少, 所得图像的层次欠丰富, 灰度分辨率低, 会出现假轮廓现象, 图像质量变差, 但数据量小.

像素间的关系

像素空间的关系

图像由像素组成, 像素在图像空间上按规律排列, 相互之间有一定的联系.

  • 像素的邻域与连接
  • 连通性
  • 距离度量

像素的邻域- 邻接关系

4邻域----N4(p)N_{4}(p):

p(x,y):(x+1,y);(x1,y)(x,y+1);(x,y1)\begin{array}{c} p(x, y):(x+1, y) ;(x-1, y) \\ (x, y+1) ;(x, y-1) \end{array}

image-20200620150706271

对角邻域----ND(p)N_{D}(p):

p(x,y):(x1,y1);(x+1,y1)(x1,y+1);(x+1,y+1)\begin{aligned} p(x, y):(x-1, y-1) ;(x+1, y-1) & \\ (x-1, y+1) ;(x+1, y+1) \end{aligned}

image-20200620150803478

8邻域----N8(p)N_{8}(p):

image-20200620150846976

image-20200620150913487

连接

邻接仅考虑像素的空间关系

连接: 空间上邻接且像素的灰度值相似

两个像素是否连接:

  1. 是否接触(邻接)
  2. 灰度值是否满足某个特定的相似准则: 灰度值相等 或 同在一个灰度值集合中

三种连接:

假设V为灰度值集合

  1. 4-连接: 两个像素p和r在V中取值且r在N4(p)N_{4}(p)image-20200620151536176
  2. 8-连接: 两个像素p和r在V中取值且r在N8(p)N_{8}(p)image-20200620151639304
  3. m-连接(混合连接): 两个像素p和r在V中取值, 且满足下列条件之一
  • r在N4(p)N_{4}(p)
  • r在ND(p)N_{D}(p)中且集合N4(p)N4(r)N_{4}(p)\cap N_{4}(r)是空集(这个集合是由p和r在V中取值的4-连接像素组成的)

例子: V={1}

image-20200620152229478

当像素间同时存在4-连接和8-连接时, 优先采用4-连接, 屏蔽两个和同一像素间存在的4-连接的像素之间的8-连接.

连通性

像素的连通反应两个像素的空间关系

  1. 通路

    像素p(x,y)到像素q(s,t)的一条通路由一系列具有坐标(x0,y0),(x1,y1),,(xi,yi),,(xn,yn)\left(x_{0}, y_{0}\right),\left(x_{1}, y_{1}\right), \dots,\left(x_{i}, y_{i}\right), \dots,\left(x_{n}, y_{n}\right) 的独立像素组成. 这里(x,y)=(x0,y0),(xn,yn)=(s,t)(x, y)=\left(x_{0}, y_{0}\right),\left(x_{n}, y_{n}\right)=(s, t)(xi,yi)\left(x_{i}, y_{i}\right)(xi1,yi1)\left(x_{i-1}, y_{i-1}\right) 邻接. 其中1in1 \leq i \leq n , n 为通路长度

    • 通路种类: 4- 通路, 8- 通路

    image-20200620153812743

  2. 连通

    通路上的所有像素灰度值满足相似准则, 即: (xi,yi)\left(x_{i}, y_{i}\right)(xi1,yi1)\left(x_{i-1}, y_{i-1}\right) 连接.

    • 种类: 4- 连通, 8-连通, m-连通
    • 实例: 像素s和t间image-20200620154025674
      • 4-连通: 不存在
      • 8-连通: 两条
      • m-连通: 一条
  3. 距离

    定义: 对于像素p,q和z, 分别具有坐标(x,y), (s,t) , (u,v), 如果:

    1. D(p,q)0[D(p,q)=0, 当且仅当 p=q]D(p, q) \geq 0 \quad[D(p, q)=0, \text { 当且仅当 } p=q]
    2. D(p,q)=D(q,p)D(p, q)=D(q, p)
    3. D(p,z)D(p,q)+D(q,z)D(p, z) \leq D(p, q)+D(q, z)

    则D距离函数或度量

    • 欧氏距离DeD_{e}

      定义: De(p,q)=[(xs)2+(yt)2]12D_{e}(p, q)=\left[(x-s)^{2}+(y-t)^{2}\right]^{\frac{1}{2}}

      距点(x, y) 的DeD_{e}距离小于或等于某一值r的像素形成一个中心在(x,y)的半径为r的圆平面

    • D4D_{4}距离(城市距离)

      定义: D4(p,q)=xs+ytD_{4}(p, q)=|x-s|+|y-t|

      距离点(x,y)的D4D_{4}距离小于或等于某一值r的像素形成一个中心在(x , y)的菱形

      D4D_4=1的像素是(x , y)的N4N_4

      image-20200620155003432

    • D8D_8距离(棋盘距离)

      定义: D8(p,q)=max(xs,yt)D_{8}(p, q)=\max (|x-s|,|y-t|)

      距点(x , y )的D8D_8距离小于或等于某一值r的像素形成一个中心在(x , y )的正方形

      D8D_8=1 的像素是(x , y) 的N8N_8

图像文件的类型

图像的分类

  • 按照图像的动态特性:
    • 静止图像
    • 运动图像
  • 按照图像的色彩:
    • 灰度图像
    • 彩色图像
  • 按照图像的维数:
    • 二维图像
    • 三维图像
    • 多维图像

位图是通过许多像素点表示一幅图像, 每个像素具有颜色属性和位置属性.

位图分成如下四种: 二值图像; 亮度图像; 索引图像; RGB图像.

二值图像(binary images)

二值图像只有黑白两种颜色, 一个像素仅占1bit , 0表示黑, 1表示白, 或相反.

image-20200620162929886

亮度图像(intensity images)

在亮度图像中, 像素灰度级用8位表示, 所以每个像素都介于黑色和白色之间的256种灰度中的一种.

image-20200620163121840

索引图像(indexed images)

颜色是预先定义的(索引颜色). 索引颜色的图像最多只能显示256种颜色. 由数据矩阵X和色彩映射矩阵map组成

  • X是一个整数的数据矩阵 X=[X11X12X1nX21X22X2nXm1Xm2Xmn]m×nX=\left[\begin{array}{cccc}X_{11} & X_{12} & \cdots & X_{1 n} \\ X_{21} & X_{22} & \cdots & X_{2 n} \\ \vdots & \vdots & \ddots & \vdots \\ X_{m 1} & X_{m 2} & \cdots & X_{m n}\end{array}\right]_{m \times n}
  • map是一个大小为L*3,取值在[0, 1]的double类的数组, 其长度L同它所定义的颜色数目相等. map=[r1g1b1r2g2b2rigibirLgLbL]L×3\operatorname{map}=\left[\begin{array}{ccc}r_{1} & g_{1} & b_{1} \\ r_{2} & g_{2} & b_{2} \\ \vdots & \vdots & \vdots \\ r_{i} & g_{i} & b_{i} \\ \vdots & \vdots & \vdots \\ r_{L} & g_{L} & b_{L}\end{array}\right]_{L \times 3}

image-20200620163715635

image-20200620163734710

RGB图像(RGB images)

一幅RGB图像就是彩色像素有一个M*N*3数组, 其中每一个彩色像素点都是在特定空间位置的彩色图像对应的红绿蓝三个分量.

image-20200620164015710

"真彩色"是RGB颜色的另一种叫法. 在真彩色图像中 , 每一个像素由红绿蓝三个字节组成, 每个字节为8bit , 表示0~255之间的不同的亮度值, 这三个字节组合可以产生1670万种不同的颜色.

image-20200620164258323