2019-11-08 11:07:33 qq_16414293 阅读数 40
  • 遥感影像深度学习样本制作

    本课程主要讲解遥感数据影像分类和目标检测的样本格式,通过结合遥感影像数据的特点和是否有对应的矢量数据,利用计算机视觉工具、PS、ArcGIS等软件制作遥感分类和目标检测深度学习的样本。

    22 人正在学习 去看看 郑新杰

用三张图理解深度学习的原理


目前正在学习用深度学习的方法进行遥感影像分类,在这里做下学习记录。

神经网络中每层对输入数据所做的具体操作保存在该层的权重(weight)中,其本质是一
串数字。用术语来说,每层实现的变换由其权重来参数化(parameterize,见图1-7)。权重有时也被称为该层的参数(parameter)。在这种语境下,学习的意思是为神经网络的所有层找到一组权重值,使得该网络能够将每个示例输入与其目标正确地一一对应。但重点来了:一个深度神经网络可能包含数千万个参数。找到所有参数的正确取值可能是一项非常艰巨的任务,特别是考虑到修改某个参数值将会影响其他所有参数的行为。
引自书籍中
想要控制一件事物,首先需要能够观察它。想要控制神经网络的输出,就需要能够衡量该
输出与预期值之间的距离。这是神经网络损失函数(loss function)的任务,该函数也叫目标函数(objective function)。损失函数的输入是网络预测值与真实目标值(即你希望网络输出的结果),然后计算一个距离值,衡量该网络在这个示例上的效果好坏(见图1-8)。
引自书籍
深度学习的基本技巧是利用这个距离值作为反馈信号来对权重值进行微调,以降低当前示
例对应的损失值(见图1-9)。这种调节由优化器(optimizer)来完成,它实现了所谓的反向传播(backpropagation)算法,这是深度学习的核心算法。
引自书籍
一开始对神经网络的权重随机赋值,因此网络只是实现了一系列随机变换。其输出结果自
然也和理想值相去甚远,相应地,损失值也很高。但随着网络处理的示例越来越多,权重值也在向正确的方向逐步微调,损失值也逐渐降低。这就是训练循环(training loop),将这种循环重复足够多的次数(通常对数千个示例进行数十次迭代),得到的权重值可以使损失函数最小。具有最小损失的网络,其输出值与目标值尽可能地接近,这就是训练好的网络。再次强调,这是一个简单的机制,一旦具有足够大的规模,将会产生魔法般的效果。

2019-08-15 22:16:07 qq_34616741 阅读数 1040
  • 遥感影像深度学习样本制作

    本课程主要讲解遥感数据影像分类和目标检测的样本格式,通过结合遥感影像数据的特点和是否有对应的矢量数据,利用计算机视觉工具、PS、ArcGIS等软件制作遥感分类和目标检测深度学习的样本。

    22 人正在学习 去看看 郑新杰

这篇文章说一下怎么分析医学影像图像,并利用统计学和机器学习建模,实现预后等回归学习。这篇文章会不断的修改,因为我也会不断的学习,不断的添加和改正文章中的内容。
医学影像已经是非常火的一个方向了,对于医学图像的处理有很多不同的领域,也有很多不同的方法。随着人工智能的发展,很多的人工智能算法已经在医学图像的处理中取得非常不错的进展。比如说深度学习中,Unet对HE染色和IHC染色图像的细胞核分割,CT或者MR图像的肿瘤分割等。在深度学习没有火起来的时候,对医学影像的处理更多的是基于从图像中提取特征,然后在通过机器学习对特征进行建模,实现分类(预后好坏等)。我下面就从流程上说说如何进行图像数据的评估,如何对图像进行特征提取,如何建模等。
首先是图像的获取。一般的影像图像有,CT,X光,MR等。病理图像(HE,WSI,ICH等)是用显微镜拍的,虽然也可以按照类似的方法来做,但这里不涉及病理图像。我们一般都是用肿瘤的CT或者MR,一个是因为这种预测更有意义:对临床上对肿瘤的治疗很大程度上是根据肿瘤的分级和分期来指定治疗方案的,而且对肿瘤的准确预后也对治疗决策的指定有着非常大的影响。传统的分级分期和预后的方法大多数是根据一些临床检测的指标,比如说各种体内成分的含量,有无转移,有无浸润,肿瘤大小,肿瘤边缘的情况等等等等。这些指标都是比较传统医学的指标,一个是预测不是准确,一个是主观性太强,很依赖医生的经验(比如说有无浸润的判断,肿瘤边缘是否清晰等)。一个是这个工作几乎只有计算机可以做。因为这类影像图像灰度级别差距很小,虽然可以通过窗宽窗位来进行观察,但人眼还是有很大的局限。计算机的辅助还是很有必要的。
所以图像一般都是医学里面对患者的真实数据资料,一个是公开数据库的资料。如今医学影像的研究已经很普及,网上也有很多公开的数据库,很多机构也举行了类似的比赛,想要下载资料的话应该开始比较容易的。
图像拿到以后,我们还需要一点处理。一般来说,我们都会划定我们需要提取体征的区间。也就是我们所说的ROI。我们都看过CT或者MR的图片,我们会发现图片上并不是所有区域都是肿瘤或者不正常的组织,很大一部分是正常的。所以我们就要把病灶圈出来
在这里插入图片描述
类似这样子,把肿瘤区域画出来,我们把绿色的线叫做roi。如果是CT这样的的断层扫描图像,那我们就有不同的处理方式。一个是每一张图片都画ROI,然后对所有层的图片进行提取。一种是挑一张具有代表性的层(可以是肿瘤最大的一层),画ROI。ROI的储存形式有很多种,不懂的格式有不同的存储方式。ROI一般都是医生画的,公开的数据库里面很多都会带有ROI。如果不对图像进行画ROI,直接进行处理这种方式现在几乎不会做这么做了,我个人也认为不画ROI是非常不可取的,因为提取的时候涉及了太多的非肿瘤区域,得出的结果也不可信。
接着我们就是对图像进行特征提取。特征有很多种,有我们一般的形态特征(就是肿瘤的大小等),一阶灰度特征(灰度直方图等),灰度共生矩阵等,小波特征等。这些特征总得加起来数量也会非常可观。形态特征可以提取10多到几十个,一阶特征也可以有很多个,小波各种参数加起来可以几百到上万个。
在特征方面,其实也有挺多问题的,比如说图像本身就有很多不同。不同机型,不同参数拍出来的图片其实是有很大的区别的,如果我们不做标准化,我们收集到的图像本来就不在一个维度,所以这个就会造成很多的差异,但这个好像并没有很好的解决方法。现在报道的好像没有很统一好用的标准化方法。
特征提取出来后,一般是要进行ICC检验的。(具体可以维基百科查一下,或者看我的另一篇博文)
ICC后选出ICC值较高的特征(一般都要大于0.75,大于0.9最好),我们就要进行降维了。降维的方法和建模方法一样,多的数不清。我们可以用统计学的方式,比如说我们可以算每个特征的KM曲线,选取相关性高的特征。也可以做C-index。同时,我们也可以用机器学习的方法降维,降维方法也有很多种,比如常用的lasso,岭回归,MRMR等等。一般特征数量不超过样本数的10%。比如说有200个样本,那么特征数就不要超过20个。在建模完成后也可以用AIC评估模型。一般是在能取得好的回归效果的前提下,特征数越少越好,多了会过拟合。
在选取了特征后,一般都要进行特征的归一化,这样子可以均衡特征的权重,不会使得一些特征值很大的特征占据过大的权重,而小值的特征占据过小的权重。
然后就是建模和调参了。模型可以选取很多种,lasso啊,svm啊,cox回归啊之类的。总是就是都试一遍,看看那个效果好。还有就是对模型的调参,这个就不细说。
最后的就是结果的conclusion了。这个是非常重要的。一般的工科生都会在这里吃亏。工科并不注重结果的意义,只是求出来一个好的结果就收工。但是如果是想要发表临床相关的文章,就要对结果进行详尽的分析。分析才是文章的大头。
分析的方法多种多样,评估的方式,图表也是多种多样,这里也不细说,详细的去看看一些相关文献吧。
以后会不定时修改这篇文章。查漏补缺。
欢迎指正。
第一次补充。
这种形式的影像组学已经出现了几年,现在更多的成为临床医生用来发文章的方向。虽然研究很多,但是并没有一套能够在CT图像甚至是单病种的CT图像通用的方法和特征。建模方法简单,临床意义明确,成为了水文章的好方向。现在的影像组学更加需要严格的统计学意义,需要临床意义上的总结分析才能够发文章。

2017-08-13 18:45:00 Beans___Lee 阅读数 1451
  • 遥感影像深度学习样本制作

    本课程主要讲解遥感数据影像分类和目标检测的样本格式,通过结合遥感影像数据的特点和是否有对应的矢量数据,利用计算机视觉工具、PS、ArcGIS等软件制作遥感分类和目标检测深度学习的样本。

    22 人正在学习 去看看 郑新杰

介绍了Radiomics的工作流程及每一步的常用软件

Dicom图像


  Dicom就是是医学图像和相关信息的国际标准,Dicom图像就是指标准的医学图像格式。Dicom图像深度比正常图像大得多,而不同的深度则可以表示不同的信息。一般情况下以HU描述。

下表描述了人体中常见物质的HU值

7239122-cefc1ce287261e90.png

影像组学的应用


  影像组学的概念真正提出来是2012年。当时它刚提出来时只是针对CT数据,把它用组学的方法进行分析。后续则将数据从CT扩展到磁共振、超声等,涉及到多影像。大数据和AI和影像组学的结合,主要有以下三个方面的应用:

* 辅助诊断
  结合计算机的分析计算辅助发现病灶,提高诊断准确率。

* 肿瘤预测
  预测疾病的可能病程和结局,包括症状、体征和并发征等异常情况
  的出现消失和死亡。

* 疗效评估
  借助计算机进行评估

影像组学工作流程


  影像组学就是从医疗大数据中提取数据,利用AI方法挖掘肿瘤信息,实现临床辅助决策。这个流程和日常医生读片的过程是一致的,医生读片是先有影像数据,然后用人眼提取它的形状特征。最终给出诊断结果。
影像组学工作流程:

1.  确定要研究的问题和患者群体,获得标准医学图像
2.  在医学图像中分割出感兴趣的区域(ROI),主要就是病灶部分
3.  获取图像的特征
4.  进行分析统计并建模

影像组学关键技术


图像分割

  根据上述工作流程,得到患者数据后,第一步就是进行图像分割,得到病灶区。图像分割一般包括全自动分割、半自动分割和人工手动分割。

目前比较成熟的分割算法有以下几种:

区域生长
图割算法
水平集
分水岭

  目前没有普适的分割算法能够应用于所有的医学影像。现阶段可用于该步的工具有以下几种:

3DSlicer
官方网址:www.slicer.org
是一款用于图像分析的免费开源软件包,可用于图像分割

MIM软件
官方网址:www.mimsoftware.com
商业软件包,可应用于图像分割,其中包括了手动轮廓和自动轮廓,
已经应用于肺部和食管癌的研究

Itk-SNAP
官方网址:www.itksnap.org

Definiens
官方网址:www.definiens.com
主要应用于肺肿瘤分析
特征提取量化

  一旦肿瘤区域被确定,影像特征即可被提取。目前常用的特征有4大类:形状特征、强度特征、纹理特征和高阶特征,具体如下:

强度  :最大值、标准方差、能量等
形状  :紧密度、最长直径、体积等
纹理  :灰度共生矩阵、熵等
小波  :边界、自由粘贴面积比

目前使用的特征提取软件有以下几种:

TexRAD
官方网址:www.texrad.com
TexRAD特征分析使用拉普拉斯高斯滤波,其允许计算对应于不同
尺度和强度变化的各种特征。

MaZda
官方网址:http://eletel.eu/mazda
是一种二维和三维图像纹理分析软件程序,添加了ROI定义,规范化,
功能统计分析和分类的工具。

CGITA
官方网址:http://code.google.com/p/cgita
基于MATLAB的开源纹理分析软件程序,可以导入任何DICOM图像
建模/统计分析

  提取出来的数百上千的特征必须进行统计分析,统计分析中重要的一步也就是减少特征的数量,找到少数真正的关键的特征,术语称作降维。统计完成之后就是建立预测模型或分类模型。

统计分析有以下几种方法:

众测信度分析
主成份分析
相关性分析
聚类分析

分类与预测模型:

肿瘤分类
肿瘤分期
预后预测

可用于建模/统计分析的软件包:

R
官方网址:www.r-project.org/
R是用于统计计算的自由软件环境

MedCalc
官方网址:www.medcalc.org

Weka
官方网址:www.cs.waikato.ac.nz/ml/weka/

辅助诊断


医学影像分析算法平台

MITK集成化医学影像分析c++类库
    下载地址:http://www.mitk.net/download_mitk1.html

3DMed面向用户的医学影像分析平台
    下载地址:http://www.mitk.net/download_med1.html

肺癌影像组软件

Radiomics影像组学软件
参考
  1. 中科院田捷:基于医疗大数据和AI技术的影像组学及其应用
  2. 《Computational resources for radiomics 》 Laurence E. Court, Xenia Fave, Dennis Mackin, Joonsang Lee, Jinzhong Yang, Lifei Zhang
2017-05-12 16:12:26 u010138055 阅读数 1623
  • 遥感影像深度学习样本制作

    本课程主要讲解遥感数据影像分类和目标检测的样本格式,通过结合遥感影像数据的特点和是否有对应的矢量数据,利用计算机视觉工具、PS、ArcGIS等软件制作遥感分类和目标检测深度学习的样本。

    22 人正在学习 去看看 郑新杰


学习这门课程的方法和建议:多看几遍视频,建议每周花 10 小时;用好 wiki 和 notebook;遇到问题先自己试着解决,善于运用 forum 查找答案和提问。



  1. 回顾上一节的内容,介绍稀疏编码。(P2)
  2. 稀疏编码的推理。(P3-P6)
  3. ISTA算法解释。(P7 - P9)
  4. 用于稀疏编码推理的坐标下降(P10)



  1. 回顾上一节课的内容,主要讲解随机梯度下降法。(P2)
  2. L2 正则化。(P3)
  3. L1 正则化。(P4)
  4. 偏差——方差权衡。(P5)


本课程主要内容包括:
 
  1. Kaggle 实战分析 Dogs vs Cats
  2. CNN 初步入门
  3. Excel 中处理 DNN
  4. 从零开始写线性模型
  5. Keras 实现线性模型
  6. 泛逼近器

  1. 回顾上一节的内容,介绍非监督学习。(P2)
  2. 稀疏编码的定义。(P3-P8)
  3. 稀疏编码的例子解释。(P9 - P11)

图像识别
  1. 为什么深度学习那么有效;
  2. 深度学习环境设置;
  3. 介绍 Jupyter ,Markdown 和一些 Python 科学包;
  4. Kaggle 实战,猫狗分类;
  5. VGG 模型的分析;
  6. Theano 和 TensorFlow 对比分析。
2019-04-03 16:00:22 dQCFKyQDXYm3F8rB0 阅读数 2157
  • 遥感影像深度学习样本制作

    本课程主要讲解遥感数据影像分类和目标检测的样本格式,通过结合遥感影像数据的特点和是否有对应的矢量数据,利用计算机视觉工具、PS、ArcGIS等软件制作遥感分类和目标检测深度学习的样本。

    22 人正在学习 去看看 郑新杰

近日,推想科技发布 AI 学者科研平台 InferScholar® Center,该平台为更多的医生提供零门槛的 AI 科研能力,让医生可以快速将深度学习、影像组学以及文本数据处理相关的前沿技术应用到自己的临床科研实践中,他们将为平台上的医疗科研人员提供基础模型以及临床研究的各类开发、培训、辅助等服务。

推想科技方面表示,InferScholar® Center 可提供临床科研全流程的可视化操作,并且预置了深度学习模型和影像组学算法,医学研究人员无需进行任何代码编程即可开展 AI 医学研究。当然,InferScholar® Center 也支持创建、修改、编辑模型源代码的功能,使具备代码基础的研究人员可依据个性化需求编辑预置模型代码或创建全新模型。

据了解,在挖掘医学大数据价值的同时,InferScholar® Center 考虑了医学临床科研的安全性需求,采用软硬件一体机的方式,直接交付到医院,做到数据不出院,保证医院所有的科研数据、模型算法、研究成果均无泄漏风险。

 

​​​​

具体而言,推想科技 AI 学者科研平台 InferScholar® Center是一款集软、硬件一体的医学人工智能专用设备,可用于医学影像大数据管理与分析、数据标记、深度神经网络模型构建、影像组学特征提取、组学特征分析与机器学习模型构建等研究。它可应用于 X 线、CT、MRI、PET/CT、病理切片、消化内镜等多种影像数据深度学习与影像组学建模。除医学影像数据外,InferScholar® Center 同时还能够合并利用临床结构化文本信息,研究各类医学命题。

在 InferScholar® Center 平台上,医学专家可自主选择孵化 AI 的数据、模式、逻辑、参数等,将让 AI 更加契合医疗业务特性,并从临床角度获得更多科研成果。其模型研究和孵化工具,可广泛应用于肿瘤、心血管、神经系统、呼吸系统等疾病影像检查的智能化、精准化研究,尤其是对于疾病早期诊断、治疗监测、预后预测的影像人工智能研究具有重要价值。

 

​​​​

从市场需求来看,需要回答两个问题:AI 学者科研平台是否是医生的小众需求?该平台在医生实际使用过程中究竟能为科研带来多大助益?

推想科技方面表示,随着医疗信息化水平的提升,医疗设备的升级,医疗数据无论从数据量、数据产生的速度或是数据种类,一直保持高速增长。大数据颠覆了临床、科研对医疗数据的利用方式,能否让海量医疗数据发挥最大的医学价值,成为关键所在。

此外《中国医生生存现状调研报告》显示,77% 的医生曾一周工作超 50 小时,更有 24.6% 医生曾一周工作超过 80 小时,导致学习和使用基于大数据的AI模型的处理和运用对医生是一个巨大的挑战。

因此,越来越多的医学研究者不仅希望使用 AI 产品,也希望结合自身的医疗大数据和临床经验优势,进行 AI 方面的自主临床研究。推想科技推出如今推出 InferScholar® Center,显然是希望将 AI 科研服务能力开放给更多的医院与医生,通过其零门槛的易用性激发医者的主动性,从而进行自主的临床和研究实践,加速 AI 在医疗领域的应用进程。

至于该 AI 科研平台会给医生的医学研究带来多大裨益,还得看后期部署系统后医生会利用该平台产出的科研成果。

记录遥感影像分割

阅读数 260

没有更多推荐了,返回首页