2017-09-12 10:32:50 louishao 阅读数 698

图像处理与机器视觉(1)

本人最近研究方向为图像处理与机器视觉,这个包括:图像的处理、图像的特征提取、图像语义分析与理解以及图像的分类与识别。

由于本科并不是读图像的,因此,只能快速地理解并掌握图像相关的概念,并进行适当的编程实现,加深印象!


1 图像的点运算

点运算是指:对图像中的每个像素依次进行同样的灰度变换运算。

1.1 灰度直方图

灰度直方图描述了一幅图像的灰度级统计信息,主要应用在于图像分割和图像灰度变换处理过程中。

从图形上来说,灰度直方图是一个二维图,横坐标是图像中各个像素点的灰度级别,纵坐标是各个灰度级别的像素在图像中出现的次数或频率。

1.2 灰度的线性变换

线性灰度变换函数f(x)是一个一维线性函数:

其中,参数fa为线性函数的斜率,fb是心啊行函数在y轴的截距,Da是输入图像的灰度,Db表示图像的灰度。其中:

当fa>1时,输出图像的对比度将增大;当fa<1时,输出图像的对比度将减小。

1.3 灰度对数变换

这是一种非线性变换。对数变换的一般表达式:

其中,c为尺度比例常数,s为源灰度值,t为变换后的目标灰度值。

这种变换可以增强一幅图像中较暗部分的细节,从而可以用来拓展被压缩的高值图像中的较暗像素,因此对数变换被广泛地应用于频谱图像的显示中,一个典型的应用就是傅里叶频谱。

1.4 gama变换

gama变换,一般表达式:

其中,x与y的取值范围均为[0,1],也就是说使用gama变换时,图像像素需要归一化。esp是补偿系数,r则是gama系数。

与对数变换不同,gama变换可以根据r的不同取值选择性地增强低灰度区域的对比或是高灰度区域的对比度。

其中:

r>1时,图像的高亮度区域对比度得到增强;

r=1时,灰度变换是线性的,即不改变原图像;

r<1时,图像的低灰度区域对比度得到增强。

gama变换在行人检测中经常会被用到。

1.5 灰度阈值变换

灰度阈值变换可以将一幅图像转换成黑白的二值图像。其表达式为:

某些图像分割的方法会用到。

1.6 直方图均衡化

直方图均衡化是一种实用性极高的直方图修正技术,是指通过某种灰度映射使输入图像转换为在每一灰度级上都有近似相同的像素点数的输出图像(即输出的直方图是均匀的)。

在经过均衡化处理后的图像中,像素将占有尽可能多的灰度级并且分布均匀。因此,这样的图像将具有较高的对比度和较大的动态范围。

以上图像处理技术的python实现

# -*- coding:utf-8 -*-

import cv2
import numpy as np
import matplotlib.pyplot as plt

# 1.1 获取灰度直方图
def gethist(img):
    arr = np.zeros((1, 256))
    for i in range(img.shape[0]):
        for j in range(img.shape[1]):
            arr[0][img[i][j]] += 1
    return arr

# 1.2 灰度的线性变换
def linearchange(img, fa, fb):
    afterimg = img*fa+fb
    return afterimg

# 1.3 对数变换
def logchange(img, c=1):
    logimg = np.zeros(img.shape)
    normimg = img / float(np.max(img))  # 先归一化,再处理,能显示
    for i in range(img.shape[0]):
        for j in range(img.shape[1]):
            logimg[i][j] = c * np.log(1 + normimg[i][j])
    return logimg

# 1.4 gama变换
def gamachange(img, exp, r):
    gamaimg = np.zeros(img.shape)
    normimg = img/float(np.max(img))
    for i in range(normimg.shape[0]):
        for j in range(normimg.shape[1]):
            gamaimg[i][j] = (normimg[i][j]+exp)**(r)
    return gamaimg

# 1.5 灰度阈值变换
def im2bw(img, T):
    bwimg = np.zeros(img.shape)
    for i in range(img.shape[0]):
        for j in range(img.shape[1]):
            if(img[i][j] < T):
                bwimg[i][j] = 0
            else:
                bwimg[i][j] = 255
    return bwimg


if __name__ == '__main__':
    img = cv2.imread("1.bmp", 0)

    # 1.1 灰度直方图
    allpixels = img.shape[0]*img.shape[1]
    arr = gethist(img)
    # 归一化直方图
    normarr = arr / float(allpixels)
    fig = plt.figure("hist")
    fig.add_subplot(121)
    plt.scatter(np.arange(0, 256).reshape(1, 256), arr)
    fig.add_subplot(122)
    plt.scatter(np.arange(0, 256).reshape(1, 256), normarr)
    plt.show()

    # 1.2 线性变换
    linearimg = linearchange(img, 2, 55) # 此时,fa>1,对比度增大
    #fanimg = linearchange(img,-1,255) # 此时为反向显示
    cv2.imshow("Linear transformation", linearimg)
    #cv2.imshow("反向显示",fanimg)
    cv2.waitKey(0)

    # 1.3 对数变换
    logimg = logchange(img, 1)
    cv2.imshow("Log transformation", logimg)
    cv2.waitKey(0)

    # 1.4 gama变换
    normgama = np.zeros(img.shape)
    gamaimg = gamachange(img,0,2)
    cv2.imshow("gama transformation", gamaimg)
    cv2.waitKey(0)

    # 1.5 灰度阈值变换
    bwimg = im2bw(img,100)
    cv2.imshow("gray threshold transformation", bwimg)
    cv2.waitKey(0)

    # 1.6 直方图均衡化
    histimg = cv2.equalizeHist(img)
    cv2.imshow("hist equalization transformation", histimg)
    cv2.waitKey(0)

运行结果:

2018-09-10 19:04:52 weixin_39880579 阅读数 1224

2.1 图像及其表达与性质

在单色图像中最低值对应于黑,而最高值对应于白。在他们之间的亮度值是灰阶(gray-level)

空间分辨率(spatial resolution)是由图像平面上图像采样点间的接近程度确定的。

频谱分辨率(spectral resolution)是由传感器获得的光线频率带宽决定的。

辐射计量分辨率(radiometric resolution)对应于可区分的灰阶数量。

时间分辨率(time resolution)取决于图像获取的时间采样间隔。    ——>  在动态图像分析中很重要,图像的时间序列。

2.2 图像数字化

采样(sampled)将图像函数数字化为一个M行N列的矩阵。

量化(quantization)将图像函数的连续数值(亮度)转变为其数字等阶量的过程。

2.3 数字图像性质

2.3.1 数字图像的度量和拓扑性质

欧式距离(Euclidean distance)

                                               D_{E}\left [ (i,j) ,(h,k)\right ]=\sqrt{(i-h)^{2}+(j-k)^{2}}

优点是它在事实上是直观且显然的。缺点是平方根的计算费时且其数值不是整数。

“城市街区(city block)”距离

 在数字栅格上从起点移动到终点所需的最少的基本步数。只允许横向和纵向的移动。

“棋盘(chessboard)”距离

在数字栅格中允许对角线方向的移动。

4-邻接,8-邻接

2.3.2 直方图

亮度直方图(brightness histogram)h_{f}(z)给出图像中亮度值z出现的频率,一幅有L个灰阶的图像的直方图由具有L个元素的一维数组表示。同一直方图可能对应几幅图像,例如,当背景是常数时物体位置的改变不会影响直方图。

2.3.3 熵

熵H(entropy)估计出图像的信息量。熵可以作为“失调”的度量。当失调水平上升时,熵就增加而事件就越难于预测。

2.3.4 图像的视觉感知

对比度(contrast)、敏锐度(acuity)、视觉错觉(visual illusions)、感知组织(Perceptual grouping)

2.3.5 图像品质

2.3.6 图像中的噪声

白噪声(white noise)具有常量的功率谱,即噪声在所有频率上出现且强度相同。

特例:高斯噪声(Gaussian noise)

加性噪声(additive noise)是独立于出现的图像信号。

信噪比SNR(signal-to-noise ratio)

乘性噪声(multiplicative noise):噪声的幅值与信号本身的幅值有关

量化噪声(quantization noise)

冲击噪声(impulsive noise)是指一幅图像被个别噪声像素破坏,这些像素的亮度与其邻域的显著不同。

胡椒盐噪声(salt-and-pepper noise)饱和冲击噪声,这时图像被一些白的或黑的像素所破坏。该噪声会使二值图像退化。

2.4 彩色图像

2.5 摄像机概述

2.5.1 光敏传感器

基于光反射(photo-emission)原理的传感器  :利用光电效应,被用于光电倍增管和真空管电视摄像机中。

基于光伏(photovoltaic)原理的传感器:半导体。

               类型:CCD(电荷耦合器件 charge-coupled device)  和 CMOS(互补型金属氧化物半导体 complementary metal oxide semi conductor)

CCD摄像机:

注:CCD成像质量好,但成本高。一般摄像头生产厂家采用CMOS采光元件。

Blooming现象:当成像视场中存在亮度较高的点光源或亮区域时,CCD在亮点光源附近区域有Blooming或称为“开花”(亦称光晕或高光溢出)的效应。

它是CCD传感器像素在受到强光照射时,亮点区域像元获得的光照过强,像元光电二极管在强光下产生的光电子数超过CCD电荷存储区可以存储的最大电子数而溢出,溢出的电子将沿行或列方向进入相邻像素,“污染”相邻图像区域 (使相邻区域也饱和),图像出现Blooming “开花”(光晕)现象,Blooming会导致相机图像清晰度明显下降,严重影响成像的质量。

不同程度的“Blooming”会使图像出现不同程度的光晕图像,光晕图像无法真实反映要观测区域的细节信息,会丢失许多有用的信息。焊接实时检测的图像获取系统中,如果没有特殊的抗干扰措施,焊接等离子体的强光会在CCD工业相机上产生严重的光晕,使焊接熔池中心及边缘部分的图像信息全部损失。

2.5.2 黑白摄像机

2.5.3 彩色摄像机

镶嵌滤波器

 

2018-08-15 09:29:54 qq_34356368 阅读数 111

第1章 引言
1.1 总结
1.2 习题
1.3 参考文献
第2章 数字图像及其性质
2.1 基本概念
2.1.1 图像函数
2.1.2 狄拉克(Dirac)分布和卷积
2.1.3 傅里叶变换
2.1.4 作为随机过程的图像
2.1.5 作为线性系统的图像
2.2 数字图像化
2.2.1 采样
2.2.2 量化
2.2.3 彩色图像
2.3 数字图像性质
2.3.1 数字图像的度量和拓扑性质
2.3.2 直方图
2.3.3 图像的视觉感知
2.3.4 图像品质
2.3.5 图像中的噪声
2.4 总结
2.5 习题
2.6 参考文献

第3章 图像分析的数据结构
3.1 图像数据表示的层次
3.2 传统图像数据结构
3.2.1 矩阵
3.2.2 链
3.2.3 拓扑数据结构
3.2.4 关系结构
3.3 分层数据结构
3.3.1 金字塔
3.3.2 四叉树
3.3.3 其他金字塔结构
3.4 总结
3.5 习题
3.6 参考文献
第4章 图像预处理
4.1 像素亮度变换
4.1.1 与位置相关的亮度矫正
4.1.2 灰度级变换
4.2 几何变换
4.2.1 像素坐标变换
4.3 局部预处理
4.3.1 图像平滑
4.3.2 边缘检测算子
4.3.3 二阶导数过零点
4.3.4 图像处理中的尺度
4.3.5 Canny边缘提取
4.3.6 参数化边缘模型
4.3.7 多光谱图像中的边缘
4.3.8 其他局部预处理算子
4.3.9 自适应领域性预处理
4.4 图像复原
4.4.1 容易复原的退化
4.4.2 逆滤波
4.4.3 维纳滤波

第5章 分割
5.1 阈值化
5.1.1 阈值检测方法
5.1.2 最优阈值化
5.1.3 多光谱阈值化
5.1.4 分层数据结构下的阈值化
5.2 基于边缘的分割
5.2.1 边缘图像阈值化
5.2.2 边缘松弛法
5.2.3 边界跟踪
5.2.4 作为图搜索的边缘跟踪
5.2.5 作为动态规划的边缘跟踪
5.2.6 Hough变换
5.2.7 使用边界位置信息的边界检测
5.2.8 从边界构造区域
5.3 基于区域的分割
5.3.1 区域归并
5.3.2 区域分裂
5.3.3 分裂与归并
5.3.4 分水岭分割
5.3.5 区域增长后处理
5.4 匹配
5.4.1 匹配标准
5.4.2 匹配的控制策略
5.5 高级最优边界与表面检测方法
5.5.1 边界对的同时检测
5.5.2 表面检测
5.6 总结
5.7 习题
5.8 参考文献

第6章 形状表示与描述
6.1 区域标识
6.2 基于轮廓的形状表示与描述
6.2.1 链码
6.2.2 简单几何边界表示
6.2.3 边界的傅里叶变换
6.2.4 使用片段序列的边界描述
6.2.5 B样条表示
6.2.6 其他基于轮廓的形状描述方法
6.2.7 形状不变量
6.3 基于区域的形状表示与描述
6.3.1 简单的标量区域描述
6.3.2 距
6.3.3 凸包
6.3.4 基于区域骨架的图表示
6.3.5 区域分解
6.3.6 区域邻近图
6.4 形状总结
6.5 总结
6.6 习题
6.7 参考文献

第7章 物体识别
7.1 知识表示
7.2 统计模式识别
7.2.1 分类原理
7.2.2 分类器设置
7.2.3 分类器学习
7.2.4 聚类分析
7.3 神经元网络
7.3.1 前馈网络
7.3.2 非监督学习
7.3.3 Hopfield 神经元网络
7.4 句法模式识别
7.4.1 语法与语言
7.4.2 句法分析与句法分类器
7.4.3 句法分类器学习与语法推导
7.5 作为图匹配的识别
7.5.1 图与子图的同构
7.5.2 图的相似度
7.6 识别中的优化技术
7.6.1 遗传算法
7.6.2 模拟退火
7.7 模糊系统
7.7.1 模糊集合和模糊隶属函数
7.7.2 模糊集合运算
7.7.3 模糊推理
7.7.4 模糊系统设计与训练
7.8 总结
7.9 习题
7.10 参考文献

第8章 图像理解
8.1 图像理解控制策略
8.1.1 并行和串行处理控制
8.1.2 分层控制
8.1.3 自底向上的控制策略
8.1.4 基于模型的控制策略
8.1.5 混合的控制策略
8.1.6 非分层控制策略
8.2 活动轮廓模型——蛇行
8.3 点分布模型
8.4 图像理解中的模式识别方法
8.5 场景标注和约束传播
8.5.1 离散松弛法
8.5.2 概率松弛法
8.5.3 搜索解释树
8.6 语义图像分割和理解
8.6.1 语义区域增长
8.6.2 遗传图像解释
8.7 隐马尔科夫模型
8.8 总结
8.9 习题
8.10 参考文献

第9章 3D视觉,几何和辐射学
9.1 3D视觉任务
9.1.1 Marr理论
9.1.2 其他视觉范畴:主动和有目的的视觉
9.2 3D视觉的几何
9.2.1 射影几何学基础
9.2.2 单透视摄像机
9.2.3 单摄像机标定概述
9.2.4 从已知场景标定一个摄像机
9.2.5 双摄像机和立体感知
9.2.6 双摄像机几何学——基本矩阵
9.2.7 摄像机的相对运动——本质矩阵
9.2.8 从图像对应点估计基本矩阵
9.2.9 视觉中的极限几何的应用
9.2.10 三摄像机和更多摄像机
9.2.11 立体对应点算法
9.2.12 距离图像的主动获取
9.3 辐射学与3D视觉
9.3.1 在确定灰度量级时的辐射学考虑
9.3.2 表面反射
9.3.3 由阴影到形状
9.3.4 光度测量立体视觉
9.4 总结
9.5 习题
9.6 参考文献

第10章 3D视觉的应用
10.1 由X到形状
10.1.1 由运动到形状
10.1.2 由纹理到形状
10.1.3 其他由X到形状的技术
10.2 完全的3D物体
10.2.1 3D物体,模型以及相关问题
10.2.2 线条标注
10.2.3 体积表示和直接测量
10.2.4 体积建模策略
10.2.5 表面建模策略
10.2.6 为获取完整3D模型的面元标注与融合
10.3 基于3D模型的视觉
10.3.1 一般考虑
10.3.2 Goad算法
10.3.3 基于模型的亮度图像曲面物体识别
10.3.4 基于模型的距离图像识别
10.4 3D场景的2D视图表达
10.4.1 观察空间
10.4.2 多视图表达和示象图
10.4.3 作为2D视图结构化表达的几何基元
10.4.4 利用存储的2D视图显示3D真实世界场景
10.5 总结
10.6 习题
10.7 参考文献

第11章 数学形态学
11.1 形态学基本概念
11.2 形态学四原则
11.3 二值膨胀
11.3.1 膨胀
11.3.2 腐蚀
11.3.3 击中击不中变换
11.3.4 开运算和闭运算
11.4 灰度级膨胀和腐蚀
11.4.1 顶面,本影和灰度级膨胀和腐蚀
11.4.2 本影同胚定理和膨胀,腐蚀及开,闭运算的性质
11.4.3 顶帽变换
11.5 骨架和物体标记
11.5.1 同伦变换
11.5.2 骨架和最大球
11.5.3 细化,粗化和同伦骨架
11.5.4 熄灭函数和最终腐蚀
11.5.5 最终腐蚀和距离函数
11.5.6 测地变换
11.5.7 形态学重构
11.6 粒度测定法
11.7 形态学分割和分水岭
11.7.1 粒子分割,标记和分水岭
11.7.2 二值形态学分割
11.7.3 灰度级分割和分水岭
11.8 总结
11.9 习题
11.10 参考文献

第12章 线性离散图像变换
12.1 基本理论
12.2 傅里叶变换
12.3 哈达马变换
12.4 离散余弦变换
12.5 小波
12.6 其他正交图像变换
12.7 离散图像变换的应用
12.8 总结
12.9 习题
12.10 参考文献

第13章 图像数据压缩
13.1 图像数据性质
13.2 图像数据压缩中的离散图像变换
13.3 预测压缩方法
13.4 矢量量化
13.5 分层的和渐进的压缩方法
13.6 压缩方法比较
13.7 其他技术
13.8 编码
13.9 JPEG和MPEG图像压缩
13.9.1 JPEG——静态图像压缩
13.9.2 MPEG——全运动的视频压缩
13.10 总结
13.11 习题
13.12 参考文献

第14章 纹理
14.1 统计纹理描述
14.1.1 基于空间频率的方法
14.1.2 共生矩阵
14.1.3 边缘频率
14.1.4 基元长度(行程)
14.1.5 Laws的纹理能量度量
14.1.6 分形纹理描述
14.1.7 其他纹理描述的统计方法
14.2 句法纹理描述的统计方法
14.2.1 形状链语法
14.2.2 图语法
14.2.3 分层纹理中的基元分组
14.3 混合的纹理描述方法
14.4 纹理识别方法的应用
14.5 总结
14.6 习题
14.7 参考文献

第15章 运动分析
15.1 差分运动分析方法
15.2 光流
15.2.1 光流计算
15.2.2 全局和局部光流估计
15.2.3 光流计算方法
15.2.4 运动分析中的光流
15.3 基于兴趣点对应关系的分析
15.3.1 兴趣点的检测
15.3.2 兴趣点的对应关系
15.3.3 物体跟踪
15.4 卡尔曼滤波
15.5 总结
15.6 习题
15.7 参考文献

第16章 案例研究
16.1 光学音乐识别系统
16.2 心脏病学中的自动图像分析
16.2.1 冠状血管造影的鲁棒分析
16.2.2 基于知识的脉管内超声分析
16.3 自动气道树识别
16.4 被动监视
16.5 参考文献

数字图像处理,本科生课程
1 引言
2 数字图像及其性质
3 图像分析的数据结构
4 图像预处理(除4.3.6~4.3.9, 4.4.3, 4.3.4的一部分, 4.3.5以外)
5 分割
5.1 阈值化(除5.1.3, 5.1.4以外)
5.2 基于边缘的分割(除5.2.8, 5.2.4的一部分, 5.2.5以外)
5.3 区域增长分割(除5.3.4以外)
5.4 匹配
12 线性离散图像变换
13 图像数据压缩
16 案例研究(挑选的课题)

数字图像分析, 本科生/研究生课程, 数字图像处理可作为先修课
1 引言(简要回顾)
2 数字图像及其性质(简要回顾)
5 分割
5.1.3 多光谱阈值化
5.1.4 分层数据结构下的阈值化
5.2.4 作为图搜索的边缘跟踪
5.2.5 作为动态规划的边缘跟踪
5.3.4 分水岭分割
6 形状表示与分割
7 物体识别
7.1 知识表示
7.2 统计模式识别
7.3 神经元网络
7.4句法模式识别
11 数学形态学
14 纹理
16 案例研究(挑选的课题)

计算机视觉1, 本科生/研究生课程, 数字图像处理可作为先修课。)
1 引言(简要回顾)
2 数字图像及其性质(简要回顾)
4 图像预处理
4.3.3 二阶导数的过零点
4.3.4 图像处理的尺度
4.3.5 Canny边缘检测
4.3.6 参数化边缘模型
4.3.7 多光谱图像中的边缘
4.3.8 其他局部预处理算子
4.3.9 自适应领域性预处理
6 形状表示与描述
7 物体识别
8 图像理解
16 案例研究(挑选的课题)

计算机视觉2, 研究生课程, 计算机视觉1可做先修课
5 分割
5.2.4 作为图搜索的边缘跟踪
5.2.5 作为动态规划的边缘跟踪
5.5 高级边界与表面检测方法
9 3D视觉, 几何和辐射学
10 3D视觉的应用
15 运动分析-实际的3D视觉项目

参考文献:图像处理分析与机器视觉 Milan Sonka,Vaclav Hlavac,Roger Boyle著。

2017-03-08 14:23:23 yuanmengxinglong 阅读数 1258

作者:CV视觉网 链接:http://www.zhihu.com/question/20523667/answer/97384340 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

1. 数学

我们所说的图像处理实际上就是数字图像处理,是把真实世界中的连续三维随机信号投影到传感器的二维平面上,采样并量化后得到二维矩阵。数字图像处理就是二维矩阵的处理,而从二维图像中恢复出三维场景就是计算机视觉的主要任务之一。这里面就涉及到了图像处理所涉及到的三个重要属性:连续性,二维矩阵,随机性。所对应的数学知识是高等数学(微积分),线性代数(矩阵论),概率论和随机过程。这三门课也是考研的三门课,构成了图像处理和计算机视觉最基础的数学基础。如果想要更进一步,就要到网上搜搜林达华推荐的数学数目了。

2. 信号处理

图像处理其实就是二维和三维信号处理,而处理的信号又有一定的随机性,因此经典信号处理和随机信号处理都是图像处理和计算机视觉中必备的理论基础。

2.1经典信号处理

  • 信号与系统(第2版) Alan V.Oppenheim等著 刘树棠译
  • 离散时间信号处理(第2版) A.V.奥本海姆等著 刘树棠译
  • 数字信号处理:理论算法与实现胡广书 (编者)

2.2随机信号处理

  • 现代信号处理 张贤达著
  • 统计信号处理基础:估计与检测理论Steven M.Kay等著 罗鹏飞等译
  • 自适应滤波器原理(第4版) Simon Haykin著 郑宝玉等译

2.3 小波变换

  • 信号处理的小波导引:稀疏方法(原书第3版) tephane Malla著, 戴道清等译

2.4 信息论

  • 信息论基础(原书第2版) Thomas M.Cover等著 阮吉寿等译

3. 模式识别

  • Pattern Recognition and Machine Learning Bishop, Christopher M. Springer
  • 模式识别(英文版)(第4版) 西奥多里德斯著
  • Pattern Classification (2nd Edition) Richard O. Duda等著
  • Statistical Pattern Recognition, 3rd Edition Andrew R. Webb等著
  • 模式识别(第3版) 张学工著

4. 图像处理与计算机视觉的书籍推荐

  • 图像处理,分析与机器视觉 第三版Sonka等著 艾海舟等译
  • Image Processing, Analysis and Machine Vision

这本书是图像处理与计算机视觉里面比较全的一本书了,几乎涵盖了图像视觉领域的各个方面。中文版的个人感觉也还可以,值得一看

  • 数字图像处理 第三版 冈萨雷斯等著
  • Digital Image Processing

数字图像处理永远的经典,现在已经出到了第三版,相当给力。我的导师曾经说过,这本书写的很优美,对写英文论文也很有帮助,建议购买英文版的。

  • 计算机视觉:理论与算法 RichardSzeliski著

  • Computer Vision: Theory and Algorithm

微软的Szeliski写的一本最新的计算机视觉著作。内容非常丰富,尤其包括了作者的研究兴趣,比如一般的书里面都没有的 Image Stitching 和 image Matting 等。这也从另一个侧面说明这本书的通用性不如Sonka的那本。不过作者开放了这本书的电子版,可以有选择性的阅读。

  • Multiple View Geometry in Computer Vision 第二版Harley等著

引用达一万多次的经典书籍了。第二版到处都有电子版的。第一版曾出过中文版的,后来绝版了。网上也可以找到电子版。

  • 计算机视觉:一种现代方法 DAForsyth等著
  • Computer Vision: A Modern Approach

MIT的经典教材。虽然已经过去十年了,还是值得一读。第二版已经在今年(2012年)出来了,在iask上可以找到非常清晰的版本,将近800页,补充了很多内容。期待影印版。

  • Machine vision: theory,algorithms, practicalities 第三版 Davies著

为数不多的英国人写的书,偏向于工业。

  • 数字图像处理第四版 Pratt著
  • Digital Image Processing

写作风格独树一帜,也是图像处理领域很不错的一本书。网上也可以找到非常清晰的电子版

知乎书目问题链接:

没有更多推荐了,返回首页