2016-01-05 22:19:20 gu_gu_ 阅读数 6368
  • 3D图形理论

    课程实现一套软3D,即不依赖任何第三方API(OpenGL,D3D,GDI)等。 课程从建立建立颜色缓冲区,绘制点,绘制线,绘制面,绘制图片,建立纹理,作图形的旋转,图像的混合,建立三维坐标系,实现模型矩阵,投影矩阵,观察矩阵,深度缓冲区等三维核心功能,实现基本的OpenGL核心绘制功能,让开发者从底层,全面的认识3D,为优化,开发出更好的游戏奠定基础。

    19315 人正在学习 去看看 张立铜

最近看图像处理反向投影,看到几本书上说的都不是很清楚,自己也不是十分的理解。就在网上找资料,终于找到了一个说的非常直白清楚的文章:原文

现贴出非常核心的原理:
假设我们有一张100x100的输入图像,有一张10x10的模板图像,查找的过程是这样的:
(1)从输入图像的左上角(0,0)开始,切割一块(0,0)至(10,10)的临时图像;
(2)生成临时图像的直方图;
(3)用临时图像的直方图和模板图像的直方图对比,对比结果记为c;
(4)直方图对比结果c,就是结果图像(0,0)处的像素值;
(5)切割输入图像从(0,1)至(10,11)的临时图像,对比直方图,并记录到结果图像;
(6)重复(1)~(5)步直到输入图像的右下角。

其中第3步用到的进行直方图对比方法应该就是标准的哪几种标准的直方图对比方法。(也可以自己定义,即本着越相似值越大的原则就可以)。在Opencv中可以用compareHist()函数进行直方图对比,当然,我想在opencv中反向投影是默认选择了一种直方图对比方法,因为其函数calcBackProject()并没有提供选择直方图对比的算法。知道了此原理后,自己实现反向投影也会比较简单。

其实相当于直方图匹配。

参考资料:

  1. http://blog.csdn.net/yee_yj/article/details/6035913
  2. Opencv3编程入门
2015-11-29 22:17:19 sjhuangx 阅读数 17113
  • 3D图形理论

    课程实现一套软3D,即不依赖任何第三方API(OpenGL,D3D,GDI)等。 课程从建立建立颜色缓冲区,绘制点,绘制线,绘制面,绘制图片,建立纹理,作图形的旋转,图像的混合,建立三维坐标系,实现模型矩阵,投影矩阵,观察矩阵,深度缓冲区等三维核心功能,实现基本的OpenGL核心绘制功能,让开发者从底层,全面的认识3D,为优化,开发出更好的游戏奠定基础。

    19315 人正在学习 去看看 张立铜

本文介绍使用opencv实现计算一幅图像的水平投影和垂直投影,代码如下:

class HorizontalProjection
{
private:
    int maxLine;//255最大行位置
    int maxNum;//255最多的数目
    int minLine;//0最大行位置
    int minNum;//0最多的数目
public:
    HorizontalProjection();//构造函数
    cv::Mat getHorProjImage(const cv::Mat &image, int threshold);//计算图像的水平投影,并返回一幅图像
};



//构造函数
HorizontalProjection::HorizontalProjection()
{
    maxLine = 0;//255最大行位置
    maxNum = 0;//255最多的数目
    minLine = 0;//0最大行位置
    minNum = 0;//0最多的数目
}

//计算图像的水平投影,并返回一幅图像
cv::Mat HorizontalProjection::getHorProjImage(const cv::Mat &image, int threshold)
{
    cv::Mat matTmp = image.clone();

    if (image.channels() > 1)
    {
        cvtColor(matTmp, matTmp, CV_RGB2GRAY);//彩色图转为灰度图
    }

    maxLine = 0, maxNum = 0;//重置255最大数目和最大行
    minLine = 0, minNum = matTmp.cols;//重置255最小数目和最小行
    int height = matTmp.rows, width = matTmp.cols;//图像的高和宽
    int tmp = 0;//保存当前行的255数目
    int *projArray = new int[height];//保存每一行255数目的数组
    cv::threshold(matTmp, matTmp, threshold, 255, CV_THRESH_BINARY);//对图形进行二值化处理

    //循环访问图像数据,查找每一行的255点的数目
    for (int i = 0; i < height; ++i)
    {
        tmp = 0;
        for (int j = 0; j < width; ++j)
        {
            if (matTmp.at<uchar>(i, j) == 255)
            {
                ++tmp;
            }
        }
        projArray[i] = tmp;
        if (tmp > maxNum)
        {
            maxNum = tmp;
            maxLine = i;
        }
        if (tmp < minNum)
        {
            minNum = tmp;
            minLine = i;
        }
    }

    //创建并绘制水平投影图像
    cv::Mat projImg(height, width, CV_8U, cv::Scalar(255));

    for (int i = 0; i < height; ++i)
    {
        cv::line(projImg, cv::Point(width - projArray[i], i), cv::Point(width - 1, i), cv::Scalar::all(0));
    }

    delete[] projArray;//删除new数组
    return  projImg;
}

结果如下:
这里写图片描述
水平投影图:
这里写图片描述

垂直投影的代码如下:

class VerticalProjection
{
private:
    int maxCol;//255最大行位置
    int maxNum;//255最多的数目
    int minCol;//0最大行位置
    int minNum;//0最多的数目
public:
    VerticalProjection();//构造函数
    cv::Mat getVerProjImage(const cv::Mat &image, int threshold);//计算图像的水平投影,并返回一幅图像
};


//构造函数
VerticalProjection::VerticalProjection()
{
    maxCol= 0;//255最大行位置
    maxNum = 0;//255最多的数目
    minCol = 0;//0最大行位置
    minNum = 0;//0最多的数目
}

//计算图像的水平投影,并返回一幅图像
cv::Mat VerticalProjection::getVerProjImage(const cv::Mat &image, int threshold)
{
    cv::Mat matTmp = image.clone();

    if (image.channels() > 1)
    {
        cvtColor(matTmp, matTmp, CV_RGB2GRAY);//彩色图转为灰度图
    }
    if (threshold == -1)
    {
        threshold = GetThresholdByOtsu(matTmp);//使用大津算法计算阈值
    }

    maxCol = 0, maxNum = 0;//重置255最大数目和最大行
    minCol = 0, minNum = matTmp.rows;//重置255最小数目和最小行
    int height = matTmp.rows, width = matTmp.cols;//图像的高和宽
    int tmp = 0;//保存当前行的255数目
    int *projArray = new int[width];//保存每一行255数目的数组
    cv::threshold(matTmp, matTmp, threshold, 255, CV_THRESH_BINARY);//对图形进行二值化处理

    cv::namedWindow("matTmp", 0);
    cv::imshow("matTmp", matTmp);

    //循环访问图像数据,查找每一行的255点的数目
    for (int col = 0; col < width; ++col)
    {
        tmp = 0;
        for (int row = 0; row < height; ++row)
        {
            if (matTmp.at<uchar>(row, col) == 255)
            {
                ++tmp;
            }       
        }
        projArray[col] = tmp;
        if (tmp > maxNum)
        {
            maxNum = tmp;
            maxCol = col;
        }
        if (tmp < minNum)
        {
            minNum = tmp;
            minCol = col;
        }
    }
    //创建并绘制垂直投影图像
    cv::Mat projImg(height, width,  CV_8U, cv::Scalar(255));

    for (int col = 0; col < width; ++col)
    {
        cv::line(projImg, cv::Point(col, height - projArray[col]), cv::Point(col, height - 1), cv::Scalar::all(0));
    }

    delete[] projArray;//删除new数组
    return  projImg;
}

结果如下:
这里写图片描述

2016-12-07 18:48:00 AUTO1993 阅读数 5927
  • 3D图形理论

    课程实现一套软3D,即不依赖任何第三方API(OpenGL,D3D,GDI)等。 课程从建立建立颜色缓冲区,绘制点,绘制线,绘制面,绘制图片,建立纹理,作图形的旋转,图像的混合,建立三维坐标系,实现模型矩阵,投影矩阵,观察矩阵,深度缓冲区等三维核心功能,实现基本的OpenGL核心绘制功能,让开发者从底层,全面的认识3D,为优化,开发出更好的游戏奠定基础。

    19315 人正在学习 去看看 张立铜
利用OPENCV计算图像的水平积分投影和垂直积分投影
       在做图像处理时会经常需要接触到各种目标提取的方法,其中最常见的就是利用积分投影对目标进行提取分割,下面就直接上代码,通过代码来介绍一下如何获得图像的水平积分投影和垂直积分投影。该代码编写风格较为简单,适合刚入门学习opencv的新手。
#include<opencv2\opencv.hpp>
#include<stdio.h>
using namespace cv;
Mat VerticalProjection(Mat srcImage)//垂直积分投影
{
	if (srcImage.channels() > 1)
		cvtColor(srcImage, srcImage, CV_RGB2GRAY);
	Mat srcImageBin;
	threshold(srcImage, srcImageBin, 120, 255, CV_THRESH_BINARY_INV);
	imshow("二值图", srcImageBin);
	int *colswidth = new int[srcImage.cols];  //申请src.image.cols个int型的内存空间
	memset(colswidth, 0, srcImage.cols * 4);  //数组必须赋初值为零,否则出错。无法遍历数组。
	//  memset(colheight,0,src->width*4);  
	// CvScalar value; 
	int value;
	for (int i = 0; i < srcImage.cols; i++)
	for (int j = 0; j < srcImage.rows; j++)
	{
		//value=cvGet2D(src,j,i);
		value = srcImageBin.at<uchar>(j, i);
		if (value == 255)
		{
			colswidth[i]++; //统计每列的白色像素点  
		}
	}
	Mat histogramImage(srcImage.rows, srcImage.cols, CV_8UC1);
	for (int i = 0; i < srcImage.rows; i++)
	for (int j = 0; j < srcImage.cols; j++)
	{
		value = 255;  //背景设置为白色。 
		histogramImage.at<uchar>(i, j) = value;
	}
	for (int i = 0; i < srcImage.cols; i++)
	for (int j = 0; j < colswidth[i]; j++)
	{
		value = 0;  //直方图设置为黑色
		histogramImage.at<uchar>(srcImage.rows - 1 - j, i) = value;
	}
	imshow(" 垂直积分投影图", histogramImage);
	return histogramImage;
}
Mat HorizonProjection(Mat srcImage)//水平积分投影
{
	if (srcImage.channels() > 1)
		cvtColor(srcImage, srcImage, CV_RGB2GRAY);
	Mat srcImageBin;
	threshold(srcImage, srcImageBin, 120, 255, CV_THRESH_BINARY_INV);
	imshow("二值图", srcImageBin);
	int *rowswidth = new int[srcImage.rows];  //申请src.image.rows个int型的内存空间
	memset(rowswidth, 0, srcImage.rows * 4);  //数组必须赋初值为零,否则出错。无法遍历数组。
	int value;
	for (int i = 0; i<srcImage.rows; i++)
	for (int j = 0; j<srcImage.cols; j++)
	{
		//value=cvGet2D(src,j,i);
		value = srcImageBin.at<uchar>(i, j);
		if (value == 255)
		{
			rowswidth[i]++; //统计每行的白色像素点  
		}
	}
	Mat histogramImage(srcImage.rows, srcImage.cols, CV_8UC1);
	for (int i = 0; i<srcImage.rows; i++)
	for (int j = 0; j<srcImage.cols; j++)
	{
		value = 255;  //背景设置为白色。 
		histogramImage.at<uchar>(i, j) = value;
	}
	//imshow("d", histogramImage);
	for (int i = 0; i<srcImage.rows; i++)
	for (int j = 0; j<rowswidth[i]; j++)
	{
		value = 0;  //直方图设置为黑色
		histogramImage.at<uchar>(i, j) = value;
	}
	imshow("水平积分投影图", histogramImage);
	delete[] rowswidth;//释放前面申请的空间
	return histogramImage;

}
int main()
{
	Mat srcImage = imread("145.png");
	imshow("原图", srcImage);
	Mat VP;
	VP = VerticalProjection(srcImage);
	Mat HP;
	HP = HorizonProjection(srcImage);
	waitKey(0);
	return 0;

}

运行结果:

总的来说,对于计算图像的垂直或水平积分投影,最重要的还是对图像的二值化操作,一个合适的二值化操作,再通过积分投影往往就能比较容易提取出目标;一个垃圾的二值化操作是无法通过投影的方法提取出目标的。


2018-01-26 22:35:29 HHCCWWlxy 阅读数 1034
  • 3D图形理论

    课程实现一套软3D,即不依赖任何第三方API(OpenGL,D3D,GDI)等。 课程从建立建立颜色缓冲区,绘制点,绘制线,绘制面,绘制图片,建立纹理,作图形的旋转,图像的混合,建立三维坐标系,实现模型矩阵,投影矩阵,观察矩阵,深度缓冲区等三维核心功能,实现基本的OpenGL核心绘制功能,让开发者从底层,全面的认识3D,为优化,开发出更好的游戏奠定基础。

    19315 人正在学习 去看看 张立铜

摘要:图像对应方向的投影,就是在该方向取一条直线,统计垂直于该直线(轴)的图像上的像素的黑点数量,累加求和作为该轴该位置的值;基于图像投影的切割就是将图像映射成这种特征后,基于这种特征判定图像的切割位置(坐标),用这个坐标来切割原图像,得到目标图像。即可垂直投影的特点对车牌号进行切割。

        


(1)垂直投影  
vector<Mat> verticalProjectionMat(Mat Image)
{
int perPixelValue;//每个像素的值  
int width = Image.cols;
int height = Image.rows;
printf("图片的宽%d图片的高%d", width, height);
int* projectValArry = new int[width];//创建用于储存每列白色像素个数的数组  
memset(projectValArry, 0, width * 4);//初始化数组  
for (int col = 0; col < width; col++)//列  
{
for (int row = 0; row < height; row++)//行  
{
perPixelValue = Image.at<uchar>(row, col);//每个像素的值 
if (perPixelValue == 255)//黑底白字  if (perPixelValue == 0)//白底黑字  】
{
projectValArry[col]++;//列的叠加
}
}

}

(2)垂直投影的画布  

Mat verticalProjectionMat(height, width, CV_8U, Scalar(255));//垂直投影的画布  
for (int i = 0; i < height; i++)
{
for (int j = 0; j < width; j++)
{
perPixelValue = 255;  //背景设置为白色  
verticalProjectionMat.at<uchar>(i, j) = perPixelValue;
}
}
for (int i = 0; i < width; i++)//垂直投影直方图  
{
for (int j = 0; j < projectValArry[i]; j++)
{
perPixelValue = 0;  //直方图设置为黑色    
verticalProjectionMat.at<uchar>(height - 1 - j, i) = perPixelValue;
}
}
imshow("垂直投影", verticalProjectionMat);
Rect rect(0, 0, 356, 90);
Mat image_cut = Mat(verticalProjectionMat, rect);
Mat image_copy = image_cut.clone();
imshow("切割图片", image_copy);


(3)遍历图片区域

vector<Mat> roiList;//用于储存分割出来的每个字符  
int startIndex = 0;//记录进入字符区的索引  
int endIndex = 0;//记录进入空白区域的索引  
bool inBlock = false;//是否遍历到了字符区内  
for (int i = 0; i < Image.cols; i++)//cols=width  
{
if (!inBlock && projectValArry[i] != 0)//进入字符区  
{
inBlock = true;
startIndex = i;
}
else if (projectValArry[i] == 0 && inBlock)//进入空白区  
{
endIndex = i;
inBlock = false;
Mat roiImg = Image(Range(0, Image.rows), Range(startIndex, endIndex + 1));
roiList.push_back(roiImg);
}
}
delete[] projectValArry;
return roiList;

}

(4)图片的读取和显示结果




参考文献:垂直投影__百度百科

               基  https://wenku.baidu.com/view/23c05e2df78a6529647d5364
   





2017-10-23 16:13:24 yyangzhenjie 阅读数 3031
  • 3D图形理论

    课程实现一套软3D,即不依赖任何第三方API(OpenGL,D3D,GDI)等。 课程从建立建立颜色缓冲区,绘制点,绘制线,绘制面,绘制图片,建立纹理,作图形的旋转,图像的混合,建立三维坐标系,实现模型矩阵,投影矩阵,观察矩阵,深度缓冲区等三维核心功能,实现基本的OpenGL核心绘制功能,让开发者从底层,全面的认识3D,为优化,开发出更好的游戏奠定基础。

    19315 人正在学习 去看看 张立铜

经常听到同事说用投影法做图像处理的相关知识,一直没有理解,所以查找资料,这里做一个总结:

投影,在立体几何中我们学到过,是空间直线在某个方向上的投影,那么图像处理中也是这种投影思想。

最简单的投影:

水平方向投影,将图像数组进行列求和;

垂直方向投影,将图像数组进行行求和;

对于二值图像或明显特征的灰度图分割前景与背景,经常用到投影法。

博文 来自: qq_39653453
没有更多推荐了,返回首页