精华内容
下载资源
问答
  • 常用的算法描述工具有
    千次阅读
    2021-12-09 17:28:43

    一、简述:工业视觉方向,致力于AI算法平台

    base:上海,团队30人+

    主要工作职责:
    1、 负责带领团队负责石化、煤炭、钢铁、园区等场景领域的图像处理分析算法研究落地;进行计算机视觉相关算法的研发工作,包括但不限于人脸检测识别,目标追踪轨迹,动作检测等算法能力的研发和落地,并保持算法应用落地中的技术领先;
    2、 带领团队跟进人工智能的前沿进展,将其工程化应用到公司相关产品和系统上,实现效果、性能等各方面的优化;探索研发快速发展的CV/AI新技术并应用落地;
    3、 保持对学术界最新研究动态跟踪,参与计算机视觉、机器学习等人工智能前沿的基础研究,帮助团队提升学术影响力和技术水平
    任职资格: 
    教育:211/985计算机博士或优秀硕士 
    经验: 
    1. 在ImageNet、LFW、Kaggle等国际著名比赛上成绩优秀者;
    2. 在CVPR、ICCV等会议或期刊上发表过论文者,在学术界或工业界有好的影响力; 
    3. 有海外科研工作或者知名高校或者大型公司背景优先; 
    4. 10年以上计算机视觉相关领域研究经验,5年以上工作和团队管理经验;
    5. 具备良好的团队合作理念和产品服务意识,能够自我驱动带领团队完成既定目标; 
    6. 相关技术领域多年实践经验,有敏锐的洞察力,具备优秀的发现问题、分析问题和解决问题的能力。
    技能: 
    1. 坚实的计算机视觉及机器学习,尤其深度学习等人工智能领域的学术研究经验;
    2. 具有较强的编程能力,熟悉python, C/C++,cuda等编程语言; 
    3. 熟练掌握C++/Python等一种或多种编程语言,熟练掌握OpenCV等传统图像处理工具; 
    4. 熟悉以下一种或多种深度学习开发框架:Tensorflow、 PyTorch 、Caffe等

    二、简述:工业视觉方向,AI芯片+算法平台

    base:深圳,团队10人+

    工作职责:
    1.管理内部算法团队,负责核心 AI 产品的定义、研发及落地
    2.负责前沿算法研究,推进现有产品算法方案的持续迭代和更新
    3.基于公司自研芯片架构在算法方案、网络结构、压缩量化方式等方面进行针对性优化
    4.参与定义公司芯片产品的定义和长期规划
    任职要求:
    1.精通 Tensorflow/Torch 等主流深度学习开发框架
    2.精通 Python 编程,熟悉 C/C++语言
    3.了解安防、自动驾驶、自然语言处理等领域的常见算法和方案思路,至少深入参与过某一
    领域整套方案的研发(优先是安防)
    4.掌握常见数据结构和编程思想
    5.熟悉基于 Git 的多人协作开发模式
    加分项:
    1.有计算机视觉、机器学习领域顶会和期刊论文者优先
    2.有量化计算、剪枝、蒸馏等压缩算法相关经验者优先
    3.有小样本场景算法经验者优先
    4.有团队管理经验者优先

    更多相关内容
  • 常用的图像处理算法: 1、图像变换:(空域和频域、几何变换、色度变换) 几何变换:图像平移、旋转、镜像、转置; 尺度变换:图像缩放、插值算法(最近邻插值、线性插值、双三次插值); 2、图像增强: 灰度...

    机器视觉工业缺陷检测的那些事(四、常用算法与库)

    目录

    机器视觉工业缺陷检测的那些事(四)

    二、算法(预处理算法、检测算法)

    常用的图像处理算法:

    1、图像变换:(空域和频域、几何变换、色度变换、尺度变换)

    2、图像增强:

    3、纹理分析(取骨架、连通性);

    4、图像分割:

    5、图像特征:

    6、图像/模板匹配:

    7、色彩分析

    8、图像数据编码压缩和传输

    9、表面缺陷目标识别算法:

    10、图像分类(识别)

    11、图像复原

    三、现有可用的视觉检测软件/库

    1、做工业视觉检测的公司有哪些?

    2、常用的视觉检测软件/库

    HSV颜色识别-HSV基本颜色分量范围

    【骆驼走得慢,但终能走到目的地。 】


    机器视觉工业缺陷检测的那些事(四)

    二、算法(预处理算法、检测算法)

    常用的图像处理算法:

    1、图像变换:(空域与频域、几何变换、色度变换、尺度变换)

    1. 几何变换:图像平移、旋转、镜像、转置;
    2. 尺度变换:图像缩放、插值算法(最近邻插值双线性插值、双三次插值);
    3. 空域与频域间变换:由于图像阵列很大,直接在空间域中进行处理,涉及计算量很大。因此,有时候需要将空间域变换到频域进行处理。例如:傅立叶变换、沃尔什变换、离散余弦变换等间接处理技术,将空间域的处理转换为频域处理,不仅可减少计算量,而且可获得更有效的处理(如傅立叶变换可在频域中进行数字滤波处理)。

    2、图像增强:

    图像增强不考虑图像降质的原因,突出图像中所感兴趣的部分。如强化图像高频分量,可使图像中物体轮廓清晰,细节明显;如强化低频分量可减少图像中噪声影响。

    1. 灰度变换增强(线性灰度变换、分段线性灰度变换、非线性灰度变换);
    2. 直方图增强(灰度直方图、直方图均衡化);
    3. 图像平滑/降噪(邻域平均法、加权平均法、中值滤波、非线性均值滤波、高斯滤波、双边滤波);
    4. 图像(边缘)锐化:梯度锐化,Roberts算子、Laplace算子、Sobel算子等;

    3、纹理分析(取骨架、连通性);

    4、图像分割:

    图像分割是将图像中有意义的特征部分提取出来,其有意义的特征有图像中的边缘、区域等,这是进一步进行图像识别、分析和理解的基础。

    (1)阈值分割(固定阈值分割、最优/OTSU阈值分割、自适应阈值分割);

    (2)基于边界分割(Canny边缘检测、轮廓提取、边界跟踪);

    (3)Hough变换Hough变换直线检测、Hough变换圆检测);

    (4)基于区域分割(区域生长、区域归并与分裂、聚类分割);

    (5)色彩分割;

    (6)分水岭分割;

    5、图像特征:

    (1)几何特征(位置与方向、周长、面积、长轴与短轴、距离(欧式距离、街区距离、棋盘距离));

    (2)形状特征(几何形态分析(Blob分析):矩形度、圆形度、不变矩、偏心率、多边形描述、曲线描述);

    (3)幅值特征(矩、投影);

    (4)直方图特征(统计特征):均值、方差、能量、熵、L1范数、L2范数等;直方图特征方法计算简单、具有平移和旋转不变性、对颜色像素的精确空间分布不敏感等,在表面检测、缺陷识别有不少应用。

    (5)颜色特征(颜色直方图、颜色矩)

    (6)局部二值模式( LBP)特征:LBP对诸如光照变化等造成的图像灰度变化具有较强的鲁棒性,在表面缺陷检测、指纹识别、光学字符识别、人脸识别及车牌识别等领域有所应用。由于LBP 计算简单,也可以用于实时检测。

    6、图像/模板匹配:

    轮廓匹配、归一化积相关灰度匹配、不变矩匹配、最小均方误差匹配

    7、色彩分析

    色度、色密度、光谱、颜色直方图、自动白平衡

    8、图像数据编码压缩和传输

    图像编码压缩技术可减少描述图像的数据量(即比特数),以便节省图像传输、处理时间和减少所占用的存储器容量。压缩可以在不失真的前提下获得,也可以在允许的失真条件下进行。编码是压缩技术中最重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。

    9、表面缺陷目标识别算法:

    传统方法:贝叶斯分类、K最近邻(KNN)人工神经网络(ANN)支持向量机(SVM)K-means等;

    10、图像分类(识别)

    图像分类(识别)属于模式识别的范畴,其主要内容是图像经过某些预处理(增强、复原、压缩)后,进行图像分割和特征提取,从而进行判决分类。

    11、图像复原

    图像复原要求对图像降质的原因有一定的了解,一般讲应根据降质过程建立“降质模型”,再采用某种滤波方法,恢复或重建原来的图像。

    三、现有可用的视觉检测软件/库

    1、做工业视觉检测的公司有哪些?

    比较出名的有:大恒图像(亚洲Halcon最大代理商)、凌云光技术(VisionPro视觉平台:印刷、3C电子、显示屏、玻璃、线路板检测)、大族激光(振静系统:视觉激光焊接,定视觉位、缺陷检测)、康耐视、基恩士、深圳精锐视觉、深圳市视觉龙科技有限公司、广州超音速、深圳市创科自动化等等。

    可二次开发的视觉系统:Labview、DVT、Halcon、OpenCV等。

    2、常用的视觉检测软件/库

    视觉开发软件工具 Halcon、VisionPro、LabView、OpenCV, 还有eVision、Mil、Sapera等。

    (一)、Halcon:底层功能算法多,运算性能快,功能齐全,容易上手,开发项目周期短。非开源项目,商用收费,价格较贵。

             Halcon:Halcon是德国MVtec公司开发的一套完善的标准的机器视觉算法包,拥有应用广泛的机器视觉集成开发环境。它是一套image processing library,由一千多个各自独立的函数,以及底层的数据管理核心构成。其中包含了各类滤波,色彩以及几何,数学转换,型态学计算分析,校正,分类辨识,形状搜寻等等基本的几何以及影像计算功能。整个函数库可以用C,C++,C#,Visual basic和Delphi等多种普通编程语言访问。 Halcon为大量的图像获取设备提供接口,保证了硬件的独立性。

    (二)OpenCV:功能算法相对较多(比Halcon少),开源,可用于商用,开发周期较长(比Halcon长),有些算法要自己写。

            OpenCV是一个基于(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS操作系统上。其核心轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。OpenCV用C++语言编写,它的主要接口也是C++语言。该库也有大量的Python, Java and MATLAB/OCTAVE的接口,如今也提供对于C#, Ruby的支持。OpenCV可以在 Windows, Android, Maemo, FreeBSD, OpenBSD, iOS,Linux 和Mac OS等平台上运行。

    OpenCV出身:OpenCV是Intel开源计算机视觉库。 其核心由一系列 C 函数和少量 C++ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。 OpenCV 的特点拥有包括300多个C函数的跨平台的中、高层 API 跨平台:Windows, Linux; 免费(FREE):无论对非商业应用和商业应用;速度快;使用方便。

    OpenCV具有以下的特征: (1)开源计算机视觉采用C/C++编写。 (2)使用目的是开发实时应用程序。 (3)独立与操作系统、硬件和图形管理器。 (4)具有通用的图象/视频载入、保存和获取模块。 (5)具有底层和高层的应用开发包。

    应用OpenCV能够实现以下功能: (1)对图象数据的操作,包括分配、释放、复制和转换数据。 (2)对图象和视频的输入输出,指文件和摄像头作为输入,图象和视频文件作为输出。 (3)具有对距陈和向量的操作以及线性代数的算法程序,包括距阵、解方程、特征值以及奇异值。 (4)可对各种动态数据结构,如列表队列集合、树和图等进行操作。 (5)具有基本的数字图象处理能力,如可进行滤波边缘检测、角点检测、采样与差值、色彩转换、形态操作、直方图图象金字塔等操作。

    (6)可对各种结构进行分析,包括连接部件分析、轮廓处理、距离变换、各种距的计算、模板匹配Hongh变换、多边形逼近、直线拟合、椭圆拟合和Delaunay三角划分等。 (7)对摄像头的定标,包括发现与跟踪定标模式、定标、基本矩阵估计、齐次矩阵估计和立体对应。 (8)对运动的分析,如对光流、运动分割和跟踪的分析。 (9)对目标的识别,可采用特征法和隐马尔科夫模型(HMM)法。 (10)具有基本的GUI功能,包括图像与视频显示、键盘和鼠标事件处理及滚动条等。 (11)可对图像进行标注,如对线、二次曲线和多边形进行标注,还可以书写文字(目前之支持中文)。

    (三)VisionPro
             VisionPro是美国康耐视Cognex公司提供全套视觉解决方案。VisionPro提供多种开发工具拖放式界面、简单指令码和编程方式等,全面支持所有模式的开发。用户利用VisionPro QuickBuild™可以无需编程配置读取、选择并优化视觉工具,决定产品是否合格。用户也可以利用C++、C#、VB及.NET开发管理应用程序。Vision Pro提供的.NET程序接口允许用户采用面向对象的高级语言编程访问所有工具,以高效开发客户的专用视觉方案。

    (四)LabView

             LabView是一种程序开发环境,由美国国 家仪器(NI)公司研制开发,使用的是图形化编辑语言G编写程序,产生的程序是框图的形式。 LabView软件是NI设计平台的核心,也是开发测量或控制系统的理想选择。 LabView开发环境集成了工程师和科学家快速构建各种应用所需的所有工具,旨在帮助工程师和科学家解决问题、提高生产力和不断创新。

    HSV颜色识别-HSV基本颜色分量范围

    一般对颜色空间的图像进行有效处理都是在HSV空间进行的,然后对于基本色中对应的HSV分量需要给定一个严格的范围,下面是通过实验计算的模糊范围(准确的范围在网上都没有给出)。

    H:  0 — 180

    S:  0 — 255

    V:  0 — 255

    HSV(色相/饱和度/明度)颜色空间是表示类似于RGB颜色模型的颜色空间的模型。根据色相通道(Channel)对颜色类型进行建模,因此在需要根据颜色对对象进行分割的图像处理任务中非常有用。饱和度的变化代表颜色成分的多少。明度通道描述颜色的亮度。

    【若有转载,须注明出处!!!】

    【骆驼走得慢,但终能走到目的地。 】

    展开全文
  • 它的主要研究目标是利用计算机视觉技术、图像视频处理技术和人工智能技术对监控视频的内容进行描述、分析和理解,并能根据分析的结果对视频监控系统进行控制,从而使视频监控系统具有较高层次的智能化水平。...
  • 十一五国家级规划教 电子工业出版社 材 算法设计与分析 Design and Analysis of Algorithms In c+t...好的算法一个好的算法具有以下4个重要特 性 正确性( correctness:算法的执行结果应当 满足预先规定的功能和性能要
  • 文章目录1 分治算法的一般性描述1.1 分支算法的时间分析1.2 两类常见的递推方程与求解方法2 总结 1 分治算法的一般性描述 设分治算法为:Divide-and-Conquer§ 设计要点 原问题可以划分或者规约为规模较小的...

    本文主要描述分治算法的一般描述和分析方法。衔接上一篇文章:【算法设计与分析】13 分治策略的设计思想

    1 分治算法的一般性描述

    • 设分治算法为:Divide-and-Conquer§

    在这里插入图片描述

    • 设计要点
    1. 原问题可以划分或者规约为规模较小的子问题。其中子问题之间遵循以下的规则:

       	1. 子问题与原问题具有相同的性质
       	2. 子问题的求解彼此独立
       	3. 划分时,子问题的规模尽可能均衡
      
    2. 子问题较小时可以直接求解

    3. 子问题的解综合可以得到原问题的解

    4. 算法的实现:迭代或者递归

    1.1 分支算法的时间分析

    时间复杂度函数的递推方程:

    • W ( n ) = W ( ∣ P 1 ∣ ) + W ( ∣ P 2 ∣ ) + . . . + W ( ∣ P k ∣ ) + f ( n ) W(n)=W(|P_1|)+W(|P_2|)+...+W(|P_k|)+f(n) W(n)=W(P1)+W(P2)+...+W(Pk)+f(n)
    • W ( c ) = C W(c)=C W(c)=C

    其中

    1. P 1 , P 2 , . . . P k w 为 划 分 后 产 生 的 子 问 题 P_1,P_2,...P_kw为划分后产生的子问题 P1,P2,...Pkw
    2. f ( n ) 为 划 分 子 问 题 以 及 将 子 问 题 的 解 综 合 得 到 原 问 题 的 解 的 总 工 足 量 f(n)为划分子问题以及将子问题的解综合得到原问题的解的总工足量 f(n)
    3. 规模为c的最小子问题的工作两为:C

    1.2 两类常见的递推方程与求解方法

    • f ( n ) = ∑ i n a i f ( n − i ) + g ( n ) , ( 1 ) f(n) = \sum_i^n a_i f(n-i)+g(n){, (1)} f(n)=inaif(ni)+g(n)(1)
    • f ( n ) = a f ( n b ) + d ( n ) , ( 2 ) f(n)=af(\frac{n}{b}) + d(n){, (2)} f(n)=af(bn)+d(n)(2)

    例子:

    Hanoi塔, W ( n ) = 2 W ( n − 1 ) + 1 W(n)=2W(n-1)+1 W(n)=2W(n1)+1
    二分检索, W ( n ) = W ( n / 2 ) + 1 W(n)=W(n/2)+1 W(n)=W(n/2)+1
    归并排序, W ( n ) = 2 W ( n / 2 ) + n − 1 W(n)=2W(n/2)+ n-1 W(n)=2W(n/2)+n1

    那么这些递推方程如何求解?

    • 方程1: f ( n ) = ∑ i n a i f ( n − i ) + g ( n ) f(n) = \sum_i^n a_i f(n-i)+g(n) f(n)=inaif(ni)+g(n)
    1. 迭代法、递归树
    • 方程2: f ( n ) = a f ( n b ) + d ( n ) f(n)=af(\frac{n}{b}) + d(n) f(n)=af(bn)+d(n)
    1. 迭代法、换元法、递归树、主定理

    对于方程2,可以使用主定理,该定理可以很快求解出方程的解,前面的文章已经学习过主定理,这里再次提一下:

    • 对于方程 T ( n ) = a T ( n / b ) + d ( n ) T(n)=aT(n/b)+d(n) T(n)=aT(n/b)+d(n)
    1. 如果d(n)为常数:

    T ( n ) = { O ( n l o g b a ) , a ≠ 1 O ( l o g n ) , a=1 T(n)= \begin{cases} O(n^{log_ba}), & \text {$a \not= 1$} \\ O(logn), & \text{a=1} \end{cases} T(n)={O(nlogba),O(logn),a=1a=1

    1. 如果d(n) = c(n)

    T ( n ) = { O ( n ) , a < b O ( n l o g n ) , a=b O ( n l o g b a ) , a>b T(n)= \begin{cases} O(n), & \text {a < b} \\ O(nlogn), & \text{a=b} \\O(n^{log_b{a}}), &\text{a>b} \end{cases} T(n)=O(n),O(nlogn),O(nlogba),a < ba=ba>b

    注:上述的 l o g b a log_ba logba中的b是以b为底的意思,但是上面的公式显示的不明显。

    2 总结

    • 想要彻底理解分治算法的思想,还需要多做练习,后面的文章会结合具体的例子,来讲解分治算法的思想在具体应用中的使用
    展开全文
  • 数据挖掘算法——常用分类算法总结

    万次阅读 多人点赞 2019-06-17 10:55:22
    常用分类算法总结分类算法总结NBC算法LR算法SVM算法ID3算法C4.5 算法C5.0算法KNN 算法ANN 算法 分类算法总结 分类是在一群已经知道类别标号的样本中,训练一种分类器,让其能够对某种未知的样本进行分类。分类算法...

    分类算法

    分类是在一群已经知道类别标号的样本中,训练一种分类器,让其能够对某种未知的样本进行分类。分类算法属于一种有监督的学习。分类算法的分类过程就是建立一种分类模型来描述预定的数据集或概念集,通过分析由属性描述的数据库元组来构造模型。分类的目的就是使用分类对新的数据集进行划分,其主要涉及分类规则的准确性、过拟合、矛盾划分的取舍等。分类算法分类效果如图所示。

    常用的分类算法包括:NBC(Naive Bayesian Classifier,朴素贝叶斯分类)算法、LR(Logistic Regress,逻辑回归)算法、ID3(Iterative Dichotomiser 3 迭代二叉树3 代)决策树算法、C4.5 决策树算法、C5.0 决策树算法、SVM(Support Vector Machine,支持向量机)算法、KNN(K-Nearest Neighbor,K 最近邻近)算法、ANN(Artificial Neural Network,人工神经网络)算法等。

    NBC算法

    NBC 模型发源于古典数学理论,有着坚实的数学基础。该算法是基于条件独立性假设的一种算法,当条件独立性假设成立时,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。
    NBC算法的优点

    1. NBC算法逻辑简单,易于实现;
    2. NBC算法所需估计的参数很少;
    3. NBC 算法对缺失数据不太敏感;
    4. NBC 算法具有较小的误差分类率;
    5. NBC 算法性能稳定,健壮性比较好;

    NBC算法的缺点
    1.在属性个数比较多或者属性之间相关性较大时,NBC 模型的分类效果相对较差;
    2.算法是基于条件独立性假设的,在实际应用中很难成立,故会影响分类效果

    LR算法

    LR 回归是当前业界比较常用的机器学习方法,用于估计某种事物的可能性。它与多元线性回归同属一个家族,即广义线性模型。简单来说多元线性回归是直接将特征值和其对应的概率进行相乘得到一个结果,逻辑回归则是在这样的结果上加上一个逻辑函数。在此选择LR 作为回归分析模型的代表进行介绍。
    LR算法的优点
    1.对数据中小噪声的鲁棒性好;
    2.LR 算法已被广泛应用于工业问题中;
    3.多重共线性并不是问题,它可结合正则化来解决。

    LR算法的缺点
    1.对于非线性特征,需要转换
    2.当特征空间很大时,LR的性能并不是太好

    SVM算法

    SVM 算法是建立在统计学习理论基础上的机器学习方法,为十大数据挖掘算法之一。通过学习算法,SVM 可以自动寻找出对分类有较好区分能力的支持向量,由此构造出的分类器可以最大化类与类的间隔,因而有较好的适应能力和较高的分准率。SVM 算法的目的在于寻找一个超平面H,该超平面可以将训练集中的数据分开,且与类域边界的沿垂直于该超平面方向的距离最大,故SVM 法亦被称为最大边缘算法。

    SVM算法的优点
    1.SVM 模型有很高的分准率;
    2. SVM 模型有很高的泛化性能;
    3. SVM 模型能很好地解决高维问题;
    4. SVM 模型对小样本情况下的机器学习问题效果好。

    SVM算法的缺点
    1.SVM 模型对缺失数据敏感;
    2.对非线性问题没有通用解决方案,得谨慎选择核函数来处理。

    ID3算法

    ID3 算法是一种基于决策树的分类算法,该算法是以信息论为基础,以信息熵和信息增益为衡量标准,从而实现对数据的归纳分类。信息增益用于度量某个属性对样本集合分类的好坏程度。ID3 算法的时间复杂度为O(n*|D|*log|D|)。

    ID3算法的优点

    1. ID3 算法建立的决策树规模比较小;
    2. 查询速度快。

    ID3算法的缺点
    1.不适合处理连续数据;
    2.难以处理海量数据集;
    3.建树时偏选属性值较大的进行分离,而有时属性值较大的不一定能反应更多的数据信息。

    C4.5 算法

    C4.5 算法是ID3 算法的修订版,采用信息增益率来加以改进,选取有最大增益率的分割变量作为准则,避免ID3 算法过度的适配问题。

    C4.5算法优点
    1.C4.5 继承了ID3 优点;
    2.在树构造过程中进行剪枝;
    3.能对不完整数据进行处理;
    4.能够完成对连续属性的离散化处理;
    5.产生的分类规则易于理解,准确率较高;
    6.用增益率来选择属性,克服了用增益选择属性时偏向选择取值多的属性。

    C4.5 算法缺点
    1.构造树时,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效;
    2.只适合于能驻留于内存的数据集,当训练集达到内存无法容纳时程序无法运行。

    C4.5 用于遥感分类过程中,首先依据通常的方式建立第一个模型。随后建立的第二个模型聚焦于被第一个模型错误分类的记录。以此类推,最后应用整个模型集对样本进行分类,使用加权投票过程把分散的预测合并成综合预测。Boosting 技术对于噪声不大的数据,通常通过建立的多模型来减少错误分类的影响,提高分类精度。

    C5.0算法

    C5.0 算法是 Quinlan 在C4.5 算法的基础上改进而来的产生决策树的一种更新的算法,它除了包括C4.5 的全部功能外,还引入许多新的技术,其中最重要的技术是提升(Boosting)技术,目的是为了进一步提高决策树对样本的识别率。同时C5.0 的算法复杂度要更低,使用更简单,适应性更强,因此具有更高的使用价值。

    C5.0算法的优点
    1.C5.0 模型能同时处理连续和离散的数据
    2.C5.0 模型估计
    模型通常不需要很长的训练时间;
    3.C5.0 引入Boosting 技术以提高分类的效率和精度;
    4.C5.0 模型易于理解,模型推出的规则有非常直观的解释;
    5.C5.0 模型在面对数据遗漏和特征很多的问题时非常稳健。

    C5.0算法的缺点
    目标字段必须为分类字段。

    美国地质调查局(USGS)在进行土地覆盖分类项目过程中研发了支持决策树分类的软件。软件分类模块主要是针对庞大数据量的数据集进行数据挖掘,找出特征,然后建立规则集进行决策分类。在分类模块中采用C5.0 模型来完成决策树分类、形成分类文件,实现遥感影像的分类。

    KNN 算法

    KNN 算法是Cover 和Hart 于1968 年提出的理论上比较成熟的方法,为十大挖掘算法之一。该算法的思路非常简单直观:如果一个样本在特征空间中的k 个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

    KNN算法的优点
    1.KNN 算法简单、有效;
    2.KNN 算法适用于样本容量比较大的类域的自动分类;
    3.由于KNN 方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,KNN 方法较其他方法更为适合。

    KNN算法的缺点
    1.KNN 算法计算量较大;
    2.KNN 算法需要事先确定K 值;
    3.KNN 算法输出的可解释不强;
    4. KNN 算法对样本容量较小的类域很容易产生误分。

    ANN 算法

    人工神经网络(ANN)算法就是一组连续的输入/输出单元,其中每个连接都与一个权相关。在学习阶段,通过调整神经网络的权,使得能够预测样本的正确类标号来学习。

    ANN算法的优点
    1.能处理数值型及分类型的属性;
    2.分类的准确度高,分布并行处理能力强;
    3.对包含大量噪声数据的数据集有较强的鲁棒性和容错能力。

    ANN算法的缺点
    1.不能观察之间的学习过程;
    2.学习时间过长,甚至可能达不到学习的目的;
    3.对于非数值型数据需要做大量数据预处理工作;
    4.输出结果难以解释,会影响到结果的可信度和可接受程度;
    5.神经网络需要大量的参数,如网络拓扑结构、权值和阈值的初始值。

    小结:

    算法名称收敛时间是否过度拟合是否过渡拟合缺失数据敏感度训练数据量
    NBC存在不敏感无要求
    LR存在敏感无要求
    SVM一般存在敏感小数据量
    ID3存在不敏感小数据集
    C4.5存在不敏感小数据集
    C5.0不存在不敏感大数据集
    ANN存在敏感大数据集
    KNN存在敏感数据量多

    创建了一个技术闲聊群:有兴趣可加我微信,拉你一起讨论杂七杂八的技术,虽然大家都不怎么活跃!
    加好友备注:你的博客名 && 随便给我的任意文章点个赞或留言
    在这里插入图片描述

    展开全文
  • 采用家族谱系的描述方法,提出了一种适用于复杂现场监测的工业无线传感器网络路由和通信资源分配算法。该算法利用无线传感器网络的广播特性,采用分层、分时和分频相结合的策略实现路由和通信资源的分配,具有条理...
  • 分类算法分类算法介绍概念分类算法常见分类算法NBSLRSVM算法ID3算法C4.5 算法C5.0算法KNN 算法ANN 算法选择分类算法分类算法性能评估 分类算法介绍 概念 数据挖掘任务通常分为两大类: 预测任务,根据其他属性的值...
  • 工业大数据分析综述:模型与算法

    千次阅读 2018-12-13 13:03:18
    工业大数据分析综述:模型与算法王宏志,梁志宇,李建中,高宏哈尔滨工业大学计算机科学与技术学院,黑龙江 哈尔滨 150001摘要:随着条形码、二维码、RFID、工业传感器...
  • 常用算法的特点及适用场景

    千次阅读 2019-04-01 14:04:26
    本文主要回顾下几个常用算法的适应场景及其优缺点! 机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。...
  • 一文理解分布式常见的一致性算法

    千次阅读 2021-03-08 00:23:20
    在Raft算法中,节点初始化后具有相同初始状态。为了提供相同的输入指令集这个条件,raft将一个客户端请求(command)封装到一个log entry中。Leader负责将这些log entries 复制到所有的Follower节点,然后节点按照...
  • 机器视觉工业缺陷检测(光源,相机,镜头,算法)

    千次阅读 多人点赞 2021-10-12 00:45:01
    向AI转型的程序员都关注了这个号????????????机器学习AI算法工程 公众号:datayx一般机器视觉系统:相机、镜头、光源、运动系统。 视觉工业检测大体分为工件尺寸测量与定位,...
  • 在进化过程中对种群状态进行客观度量, 自适应更新种群的权重和学习因子等重要参数, 使种群进化具有自我调节能力. 将提出的算法分别应用于标准多目标测试函数、PID控制器参数优化和甲醇转化烃类物质的工业过程模型...
  • 机器学习-常用回归算法归纳(全网之最)

    千次阅读 多人点赞 2021-10-28 17:31:55
    下面整理只给出每个算法常用的解法。 关于机器学习&深度学习中,损失、代价、目标、成本含义解释 损失函数:真实值与预测值的差距 代价函数:所有样本损失值加总 / 样本数 目标函数:损失函数加了正则项 成本函数...
  • 文章目录关于模型评估逻辑回归 Logistic Regression决策树朴素贝叶斯 NBKNN 最近邻算法 关于模型评估 Error = Bias(偏差) + Variance(方差)。这里的Error可以理解为模型的预测错误率,是有两部分组成的,一部分...
  • 本论文结合上述情况,在某项目中总结出了一套对PID算法的参数进行整定的方法。PID调节方法是三阶系统中一种常用的有效控制方法。... 位置式PID控制算法描述为:  式中:k——采样序号;  u(k)——第k次
  • 自动驾驶中的9种传感器融合算法

    千次阅读 2021-12-08 01:42:56
    3DCVer-学术论文写作投稿 交流群已成立 扫码添加小助手微信,可申请加入3D视觉坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。 同时也可申请加入我们的细分方向交流群,目前...
  • 摘 要: 本文详细介绍数控系统的NURBS...数控加工时经常遇到诸如飞机的机翼、汽车流线型覆盖件、成型模具型腔、汽轮机叶片等许多具有复杂外形型面的零件,CAD/CAM通常用列表曲线来描述它们。列表曲线的拟合方法很多,如
  • 常见分类算法优缺点

    万次阅读 2018-10-21 21:36:54
    本文主要回顾下几个常用算法的适应场景及其优缺点! 机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。...
  • 数据结构与算法之循环算法

    千次阅读 2021-04-08 21:24:23
    数据结构与算法之循环算法 循环算法基本概念 我们借助计算机快速处理数据的功能,让计算机重复的加工计算,这就构成了循环算法,其关键在于构建循环条件和循环体。 循环条件:每个循环有其循环的开始和结束的条件,...
  • 演化算法是一种具有鲁棒性的随机搜索优化算法,它通过模拟大自然的生物进化过程,依据简单的遗传操作和优胜劣汰的自然选择法则来寻求问题的最优解。 演化算法具有适于高度并行与自组织、自学习、自适应等特征。 一...
  • 本文根据三种护技能水平和老人需求的组合,假设老人接受服务的时长服从正态分布,并通过设置不同的均值和方差值,研究了需求波动对算法和机构决策的影响.实际业务中老人一般会向机构事先提出预约,因此通过设置...
  • 大家好,我是千与千寻,一名专注于后端研发与算法工程领域的程序员,最近我的作息快赶上yp哥的作息了,不过习惯就好。昨天晚上深夜回家发了个pyq,我大致表达的意思:谁说算法岗不加班的?活没干完...
  • OpenCV中八种不同的目标追踪算法

    千次阅读 2022-01-06 00:49:49
    3DCVer-学术论文写作投稿 交流群已成立 扫码添加小助手微信,可申请加入3D视觉坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。 同时也可申请加入我们的细分方向交流群,目前...
  • 一文详解点云分割算法

    千次阅读 2022-02-25 00:41:35
    作者丨书生意封侯@知乎来源丨https://zhuanlan.zhihu.com/p/470782623编辑丨3D视觉坊从某种意义上说,地面点剔除(分割)也属于点云分割的一种,但两者技术...
  • 本文总结了常用的数学模型方法和它们的主要用途,主要包括数学和统计上的建模方法,关于在数学建模中也挺常用的机器学习算法暂时不作补充,以后有时间就补。至于究竟哪个模型更好,需要用数据来验证,还有求解方法也...
  • 研究图像特征检测已经有一段时间了,图像特征检测的方法很多,又加上各种算法的变形,所以难以在短时间内全面的了解,只是对主流的特征检测算法的原理进行了学习。总体来说,图像特征可以包括颜色特征、...
  • 局部路径规划:基于部分区域信息理解的路径规划——局部路径规划是在机器人执行任务过程中根据自身携带传感器采集到的局部环境信息进行的实时动态路径规划,具有较高的灵活性和实时性。但由于依靠的是...
  • 智能优化算法:灰狼优化算法-附代码

    万次阅读 多人点赞 2020-07-31 16:31:41
    GWO算法具有结构简单、需要调节的参数少,容易实现等特点,其中存在能够自适应调整的收敛因子以及信息反馈机制,能够在局部寻优与全局搜索之间实现平衡,因此在对问题的求解精度和收敛速度方面都有良好的性能。...
  • (本文转载自:当SLAM遇见小王同学)在前不久发布的OpenCV4.5中更新了很多新特性:从4.5版本开始,OpenCV将正式使用Apache2协议,从而避免专利算法带来的潜在纠纷SIFT...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 40,143
精华内容 16,057
热门标签
关键字:

常用的算法描述工具有