精华内容
下载资源
问答
  • TORC2基因多态性与有氧耐力关联性研究,夏小慧,胡扬,目的:研究TORC2基因多态性分布特点与有氧耐力的关联性,寻找可以作为有氧耐力的遗传标记。方法:应用基质辅助激光解吸附电离飞�
  • SSR标记研究粉花石斛的遗传多样性,蔡小彦,冯震宇,本论文利用磁珠富集法构建粉花石斛微卫星文库,筛选出有效SSR标记,共获得12对多态性引物。通过对9个粉花石斛居群的95个个体的扩增�
  • 遗传多态性,免疫相关基因,TCF4和ZNF804A与microRNA,神经调节蛋白基因,染色体13q32和11p15.4(通过精神分裂症和脑结构参与谷氨酸能基因)似乎与精神分裂症的发生有关。 结论:一些研究表明基因参与导致疾病发病...
  • 基于SSR分子标记的9个北沙柳居群遗传多样性,李小龙,张国盛,采用SSR标记的方法对9个居群的266份北沙柳种质资源进行了遗传多样性分析,结果表明:12对SSR引物扩增得到73条带,多态性百分率为86.3%�
  • 杨树杂交亲本AFLP标记遗传变异分析,李善文,张志毅,利用13对AFLP引物对杨属4个派21个种55个无性系进行遗传变异分析,共检测到858个标记,其中多态性标记为771个,多态性水平为89.9%,每对
  • 在两个标记系统中,多态性片段/引物的“多态性”分别为17和7.14。 另一方面,Triple-SCoT表现出阳性和阴性基因型特异性标记的最高平均数。 使用这些不同的标记系统对研究的基因型进行聚类分析,发现四个树状图的...
  • 表征了驯化的盐敏感性番茄品种(CA4)与天然耐盐的野生型番茄品种(LA1606)杂交后代的耐盐性。... RAPD标记OPX-17和MRTOMR-022表现出2种阳性分子标记多态性),仅在抗性亲本(LA1606)和抗性F2体中发现。
  • repens的SSRs能够揭示亚历山大草中的高种内多态性,并成功地区分了本研究中调查的不同物种。 本文确定的不同种质提供了进一步培育亚历山大草的优良资源。 T. alexandrinum与T. subterraneum和T.鲑科的高度等位基因...
  • 作为一种生活信息和通信系统,基因组以单核苷酸多态性(SNP)编码模式,反映了人类的适应性,从而优化了不同环境下的种群生存。 本文对环境诱导的适应力进行数学建模,以量化种群之间SNP频率分布的变化。 我们在生物...
  • 结果表明,68对InDel标记中39对标记具有强多态性,在48份材料共检测出79个等位基因,平均每对标记检测到2.0256个等位基因,遗传距离在0-0.9551的范围,相似性系数在0.44-1,平均相似性系数为0.72...

    基于InDel标记的黄瓜种质资源遗传多样性分析

    | 摘要 | 为明确黄瓜自交系间的亲缘关系,筛选适宜作杂交亲本的种质资源,利用InDel标记对48份黄瓜自交系进行遗传多样性分析。

    结果表明,68对InDel标记中39对标记具有强多态性,在48份材料共检测出79个等位基因,平均每对标记检测到2.0256个等位基因,遗传距离在0-0.9551的范围,相似性系数在0.44-1,平均相似性系数为0.72,说明48份材料总体亲缘关系较近,遗传多样性不够丰富。

    NTSYS2.1软件聚类的结果表明,在相似性系数为0.44时,48份材料被划分为2大类群,主要为密刺黄瓜和水果黄瓜,用Power Marker 3.25软件进行树状图分析,结果与NTYSYS聚类结果一致。研究结果为了解黄瓜种质资源遗传背景及亲本组合的选配奠定基础。

    cc6668db63819549d391e0e4b7fbb735.png

    图1. 标记InDel250对48份黄瓜种质资源的电泳图

    从本实验室前期开发出的10470个InDel标记中初步选择68对InDel标记对48份黄瓜自交系进行分析,结果表明39对InDel标记具有强多态性。图1为标记InDel250对48份黄瓜种质材料扩增出两个等位基因的电泳图。

    dd08b6149bcfd31a735e9bc34404a95e.png

    图2. 48份黄瓜资源聚类分析


    采用NTSYS 2.1软件中的UPGMA对48份黄瓜种质资源进行聚类分析作图,结果见图2.在相似系数为0.44时,将黄瓜种质划分为2个类群,第1类群包括D1、D2、D3、D12、D5等31份材料,且大部分密刺黄瓜被聚为此类;第2类群包括X1、X3、X7、X4、X11等17份材料,且该类群76.5%为水果黄瓜;白绿黑刺黄瓜、白绿稀刺黄瓜全部在第1大类群,2份白绿无刺黄瓜在第2大类群。

    为了验证NTYSYS软件的分析结果,用Power Marker3.25软件进行了聚类分析,发现48份黄瓜自交系也是被聚为2大类群(图3),且聚类结果与上述NTSYS软件分析结果完全一致。

    ceba78f48db1dae4e2b348508fc9e6e6.png

    图3. 48份黄瓜资源聚类树状图

    展开全文
  • 设计了针对100个基因座的特异性引物,其中32种为多态性,其多态性信息含量值范围为0.12至0.81(平均0.54)。 扩增的微卫星区域每个位点平均产生4.44个等位基因(范围为1到13)。 尽管转移的基因座数目有所不同,但...
  • 石榴枯萎病菌的遗传多样性研究,余磊,蒋涛,利用随机扩增多态性DNA (RAPD)和小卫星标记(DAMD)技术分析中国石榴枯萎病菌(Ceratocystis fimbriata)的遗传多样性,并对来自印度、巴西、美�
  • 新疆野生狗牙根遗传多样性的SRAP分析,李江华,高文伟,本实验采用SRAP标记对48份新疆野生狗牙根材料进行遗传多样性分析,结果表明:14对SRAP引物共扩增产生133条带,其中123条显示多态性,多
  • 十个歪头菜居群遗传多样性ISSR分析,陈辉,强维亚,采用ISSR分子标记对10个歪头菜自然居群的样本进行遗传多样性的分析,筛选出的10条ISSR引物共扩增出115个扩增位点,其中多态性位点110个,平
  • 每个引物的多态性条带数目为4至7,每个测定单位平均为5.4条带。 根据Nei的无偏系数,所研究兰花之间的遗传差异(GDs)为0.10至0.94。 树状图的构建表明,巴布亚特有兰花(PEO)样品彼此不同,并在0.40系数值和0.6...
  • 鸭茅四倍体与四倍体杂交F2代SSR遗传稳定性分析,蒋林峰,张新全,本研究运用微卫星标记对4个鸭茅亲本品种及其3个杂交F2代组合共50份材料进行遗传稳定性分析。筛选出具有多态性的15对SSR引物,SSR标记
  • 对二元随机扩增多态性DNA(RAPD)数据和形态特征进行的聚类分析表明,紫色胡瓜的全球种群由两个进化枝组成。 RAPD数据的聚类分析支持将紫色无核种质分离为两个不同的11和33种种质。 除被认定为加利福尼亚*和...
  • 山猪群体遗传结构的RAPD分析,伍革民,许晓风,应用RAPD标记技术,对山猪群体内遗传结构情况进行分析。利用经过筛选的14条引物,在36个山猪样本内共扩增出105条带,其中多态性带57�
  • SRAP、TRAP、SSR、ISSR分子标记在水稻籼粳分型中的系统学研究,戴小军,,利用SRAP、TRAP新型分子标记,并结合SSR、ISSR标记对水稻47个材料进行了遗传多样性分析,四种分子标记多态性ISSR>SRAP>SSR>TRAP,SRAP标记的...
  • 从富集的S.bidwillii库中分离并表征了十个多态性微卫星标记,该库显示出二核苷酸和三核苷酸重复。 在五个种群中,每个基因座的平均等位基因数目分别为1.3至2.5,平均预期和观察到的杂合度分别为0.06至0.33和0.03至...
  • 这项研究的目的是通过使用分子标记(扩增片段长度多态性—AFLP)来估计当地品种当前的遗传变异水平。 我们选择在两个不同的微观区域中进行收集,以识别地理隔离和不同水平的市场需求对最大隐孢子虫遗传变异性保护的...
  • 使用ASMap构建高密度遗传图谱

    千次阅读 2019-10-06 17:07:49
    当时我用的SSCP(单分子构象多态性)技术区分单个碱基存在差异的等位基因,要放在4度过夜12小时,然后第二天银染显色,放在一个医学看片的设备上读条带。 现在测序便宜了,简化基因组测序随随便便就能获得成千上万的...

    在我大学的时候,构建遗传图谱靠的是人工跑胶,然后看胶图统计基因型。当时我用的SSCP(单分子构象多态性)技术区分单个碱基存在差异的等位基因,要放在4度过夜12小时,然后第二天银染显色,放在一个医学看片的设备上读条带。

    现在测序便宜了,简化基因组测序随随便便就能获得成千上万的分子标记。然而标记多有标记多的烦恼,就是以前的作图软件不好用了。以前的暴力穷举的方法在海量标记面前,几乎不可能在有限的时间里完成构图任务,而且更加麻烦的是高通量的SNP标记还容易出错。

    R语言中有一些建图软件包,不过都有一些问题。qtl包的建图算法太老,onemap的算法是SERIATION, RECORD, RCD, UG, 但是代码不是C/C 写的,所以运行速度太让人着急。

    在2017年,出现了一个新的R包,ASMap,它其实就是将MSTmap移植到了R语言中。MSTmap是很久之前就提出的高通量作图方法,只不过需要编译,有点不太友好。

    ASMap支持如下群体:

    • BC: 回交群体
    • DH: 双单倍体群体
    • ARIL: 高世代重组近交系, 理论上是已经纯合的遗传群体(除了部分剩余杂合位点), 属于永久性群体
    • RILn: 低世代重组近交系,n=2时,就是F2群体。

    算法说明简分为两个部分:

    • 聚类算法: 如果分子标记 $mj$ 和$mk$ 来自于两个不同的连锁群,那么$P{jk}=0.5$, 并且标记间的加权距离(hamming distance)为 $E(d{djk}) = n/2$。 根据定义,MSTmap使用Hoeffding不等式确定标记是否来自于同一个连锁群
    • 标记排序: 先根据遗传距离对标记进行分箱,也就是将共分离的标记当做一个对象。之后排序问题就视作 TSP(旅行商问题), 也就是寻找所有标记间最短的路径。

    可用函数

    图谱构建函数: 一共有两个,注意p.value的调整

    • mstmap.data.frame()
    • mstmap.cross(): 从qtl包的对象进行转换,对于高世代的RIL群体,要用conver2riself转换类型, 对于BCnFn群体要用conver2bcsft转换类型

    标记调整函数:

    • pullCross(): 抽取异常分子标记
    • pushCross(): 检查完毕后,将符合要求的标记放回原处
    • pp.init(): 调整偏分离的阈值

    可视化诊断:

    • profileGen(): 统计基因型中交换数,双交换数,缺失情况。 适用于对遗传图谱质量进行评估
    • profileMark: 统计标记的偏分离,缺失比例,等位基因分布,双交换数
    • heatMap(): 以标记间RF(重组率)绘制热图

    使用案例

    内容翻译自: R Package ASMap: Effcient Genetic Linkage Map Construction and Diagnosis

    第一步: 环境准备

    加载环境和数据,其中数据集为300个群体,3023个标记的回交群体

    library("qtl")
    library("ASMap")
    data("mapBCu")
    summary(mapBCu)

    如果是自己的数据集,有两种方法可以构建,一种是用mstmap.cross 转换qtl包中read.cross得到的对象,如下

    mapthis <- read.cross("csv", "http://www.rqtl.org/tutorials", "mapthis.csv",
                          estimate.map=FALSE)
    mapthis <- convert2bcsft(mapthis, BC.gen = 0, F.gen = 2, estimate.map = FALSE)
    mapthis <- mstmap.cross(mapthis, id = "id")

    或者用mstmap.data.frame, 要调整如下的参数:

    • object: 数据框, 行对应的标记名, 列是每个个体对应的基因型. , 构建数据框时,一定要保证字符串不能被当做是因子(stringsAsFactors=FALSE)。
    • pop.type: 群体类型,“BH","BC", "RILn"(低世代的近交系,RIL2可以认为是F2), "ARIL"(高世代的近交系)
    • dist.fun: 计算遗传距离的函数, 默认是"kosambi", 不需要更改。
    • p.value: 和群体大小有关,群体越大,p值要越小,也就是要更严格。

    对于低世代的近交系,亲本基因型编码为"A"或"a", "B"或"b", 杂合基因型编码为"X". 所谓的缺失值编码为"U"或"-"

    mstmap.data.frame这一步运行会比较慢,这是由于它会预先对数据进行分箱,减少标记量,提高后续的运算效率。

    运行案例

    第二步: 预处理

    在正式构建遗传图谱之间,我们需要谨慎的按照如下清单检查我们用于构图的基因型/分子标记的质量,包括但不限于

    • 检查每个个体对应的标记缺失比例,以及每个标记在所有个体中的缺失失比例。缺失比例过高说明标记或个体存在问题
    • 检查群体间是否存在标记高度相似的两个个体。
    • 检查过度偏分离(segregation distortion)的标记。 高度偏分离的标记可能不会定位到唯一的座位上。
    • 检查交换等位基因的标记。这些标记在构建图谱期间,难以聚类,或者和其他标记有关联,因此需要在分析前修复他们的匹配。
    • 检查共分离的标记。 共分离的标记会严重影响构图时的计算效率,所以可以先暂时把它们忽略掉。

    检查每个个体的基因型缺失情况

    plot.missing(mapBcu)

    缺失分布

    水平的黑线表示一些个体中,大部分的标记都没有对应的基因型,因此我们将这些个体移除。

    sg <- statGen(mapBCu, bychr=FALSE, stat.type = "miss")
    mapBC1 <- subset(mapBCu, ind=sg$miss < 1600)

    从图谱构建的角度来看,高度相关的个体会增强标记的偏分离. 因此对于基因型几乎一模一样的个体,最好在建立图谱前移除

    gc <- genClones(mapBC1, tol=0.95)
    gc$cgd

    从R返回的结果中,可以发现有将近11组的基因型几乎一样。但是第一组的BC045和BC039由于存在大量的基因型缺失,不足以说明两者相同,同样情况的还有BC052和BC045,以及BC168和BC045, 可以排除这三项。

    cgd <- gc$cgd[-c(1,4,5)]
    mapBC2 <- fixClones(mapBC1, cgd, consensus = TRUE)

    接下来,可以进一步检查特定位点的观测等位基因频率和期望频率的偏差。这有可能是基因型考察错误,也有可能意味着该区域受到潜在的生物学和遗传学机制影响。这一步,同时检查分子标记的偏分离情况,不同基因型的占比,和缺失率。

    profileMark(mapBC2, stat.type = c("seg.dist", "prop","miss"),
                crit.val = "bonf", layout = c(1,4), type="l")
    

    基因型总体情况

    对于高度的偏分离的标记,我们应该直接忽略掉

    mm <- statMark(mapBC2, stat.type = "marker")$marker$AB
    dm <- markernames(mapBC2)[(mm > 0.98) | (mm < 0.2)]
    mapBC3 <- drop.markers(mapBC2, dm)

    而对于不偏分离不怎么严重的标记,最好的方法是先把他们放在一边,等图谱构建完成之后再把它们放回到遗传图谱中。

    pp <- pp.init(miss.thresh = 0.1, seg.thresh = "bonf")
    mapBC3 <- pullCross(mapBC3, type = "missing", pars=pp)
    mapBC3 <- pullCross(mapBC3, type="seg.distortion", pars=pp)
    mapBC3 <- pullCross(mapBC3, type="co.located")

    第三步: 构图

    构图通常不是一次性完成的工作,需要多次迭代。先进行第一次尝试,运行时间取决于计算机性能和标记数目

    mapBC4 <- mstmap(mapBC3, bychr = FALSE, trace = TRUE, p.value = 1e-12)
    chrlen(mapBC4) #每个连锁群的长度

    对构建出图谱进行可视化检查

    heatMap(mapBC4, lmax = 70)

    热图

    热图分为两个部分看。上三角展示的是标记间的重组率,下三角则是标记间的LOD值,两者模式要是一样,那就说明图谱还是靠谱的。中间的正方形为连锁不平衡区(LD block), 一般在连锁不平衡区极少发生交换,而不同的连锁不平衡区交换频繁。

    但是光看热图还是不够的,我们还得保证遗传图谱里个体的交换次数不应该太多。也就是,每个个体能发生的交换是有限的,比如说如果染色体长度为200cM,那么在回交后代中,每个个体的重组次数应该不多于14次。

    水稻每条染色体平均0.5~1次交换。人类每次减数分裂平均30次。

    pg <- profileGen(mapBC4, bychr = FALSE, stat.type = c("xo", "dxo", "miss"),
                     id="Genotype", xo.lambda = 14, layout=c(1,3),lty=2)

    交换数分析

    从上图可以发现,一些个体的重组次数明显过高,而且这些个体的双交换次数明显多于其他个体,缺失率也是如此。

    我们需要将这些个体剔除,对遗传图谱进行升级

    mapBC5 <- subsetCross(mapBC4, ind = !pg$xo.lambda)
    mapBC6 <- mstmap(mapBC5, bychr = TRUE, trace = TRUE, p.value = 1e-12)
    chrlen(mapBC6)

    和上次相比,每个连锁群的长度明显减少,一般而言遗传图谱越小,图谱越可靠。

    profileMark(mapBC6, stat.type = c("seg.dist", "prop", "dxo", "recomb"),
                layout = c(1, 5), type = "l")

    交换数分析

    最后结果表明,每个个体的双交换次数都没有超过1 个。

    第四步: 加入前提剔除的标记

    对于前期放在一边的标记,可以在图谱构建完成后放回到完成的图谱中,同时要仔细的检查。

    先将515个缺失率在10%~20%的标记塞到图谱上。这一步是将当前的标记和图谱上的标记计算重组率,选择最近位置插入。然后展示长度明显小于其他连锁群的4个连锁群,判断是否能够将他们进行合并。

    pp <- pp.init(miss.thresh = 0.22, max.rf = 0.3)
    mapBC6 <- pushCross(mapBC6, type = "missing", pars = pp)
    heatMap(mapBC6, chr = c("L.3", "L.5", "L.8", "L.9"), lmax = 70)

    热图诊断

    从图中,我们可以发现,L.3和L.5之间有明显的连锁,L8和L.9有明显的连锁。我们使用mergeCross()将这两个连锁群进行合并,这个时候的mstmap要保证bychr=TRUE, 对不同的连锁群分别计算标记距离,而不是从聚类开始。

    mlist <- list("L.3" = c("L.3", "L.5"), "L.8" = c("L.8", "L.9"))
    mapBC6 <- mergeCross(mapBC6, merge = mlist)
    names(mapBC6$geno) <- paste("L.", 1:7, sep = "")
    mapBC7 <- mstmap(mapBC6, bychr = TRUE, trace = TRUE, p.value = 2)
    chrlen(mapBC7)

    这样子就得到了更加优化的图谱。但是L1, L2, L.4的连锁群距离有一些轻微的提高,说明可能存在过多的交换现象

    pg1 <- profileGen(mapBC7, bychr = FALSE, stat.type = c("xo", "dxo","miss"), 
                      id = "Genotype", xo.lambda = 14, layout = c(1,3), lty = 2)

    交换分析

    我们发现新引入的部分个体是导致该现象的元凶,这就需要我们将这些株系次移除掉,然后重建图谱

    mapBC8 <- subsetCross(mapBC7, ind=!pg1$xo.lambda)
    mapBC9 <- mstmap(mapBC8, bychr = TRUE, trace = TRUE, p.value = 2)
    chrlen(mapBC9)

    移除的株系不会对连锁群的数目造成影响,连锁图谱只会在组内进行重建。大部分连锁群的长度都有了一定程度的下降。继续观察一下标记的遗传图谱的表现情况

    profileMark(mapBC9, stat.type = c("seg.dist", "prop"), layout = c(1, 5),
                type = "l")

    频率变化

    从图中可以发现,在L.2里面有一个诡异的突起(偏分离), 需要被移除。当然我们也能看到在L.3, L.5, L.7中,新增的缺失率10%~20%的标记,有一定程度的偏分离。剩下的295个标记为"seg.distortion"的标记说不定能解释这个情况,所以下一步就是把它们塞回去

    sm <- statMark(mapBC9, chr = "L.2", stat.type = "marker")
    dm <- markernames(mapBC9, "L.2")[sm$marker$neglog10P > 6]
    mapBC10 <- drop.markers(mapBC9, dm)
    pp <- pp.init(seg.ratio = "70:30")
    mapBC11 <- pushCross(mapBC10, type = "seg.distortion", pars = pp)
    mapBC12 <- mstmap(mapBC11, bychr = TRUE, trace = TRUE, p.value = 2)
    round(chrlen(mapBC12) - chrlen(mapBC9), 5)
    nmar(mapBC12) - nmar(mapBC10)

    最后一步就是加入共分离的标记

    mapBC <- pushCross(mapBC12, type = "co.located")

    最后结果如下

    结果统计

    版权声明:本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。

    扫码即刻交流

    展开全文
  • 从微卫星获得的平均多态信息含量(0.51)显示出较高的多态性,可在突变体及其亲本之间获得广泛的遗传多样性。 生成的树状图揭示了8个群体,其中大多数突变体与其父母分开聚集。 序列分析揭示了插入/缺失(InDels)...
  • 在循环水产养殖系统(RAS)中评估了选定的F1虹鳟鱼的生长性能,该虹鳟在基因上具有Omy207UoG基因座(NA = 13,PIC = 0.891,HE = 0.9003)多态性。 在连接到循环水产养殖系统(RAS)的6个5 m3的鱼缸中的每一个中,...
  • 总共鉴定出iPBS-反转录转座子标记的63个多态性条带和SSR标记的25个等位基因,每个引物平均分别为2.7和1.6。 iPBS标记的多态信息含量(PIC)的平均值(0.73)高于SSR标记的平均值(0.69)。 将邻居结合法应用于结合...
  • 共检测到五个多态性SSR基因座的10个等位基因,每个引物平均2.00个等位基因。 基因多样性范围从0.333到1.00,平均为0.567。 SSR引物的多态信息含量(PIC)值介于0.255至0.500之间,平均值为0.371。 相似度指标矩阵的...
  • 本研究采用扩增片段长度多态性研究农民田间本地香蕉植物的遗传变异。 使用四十四根茎(从总共860株稳定生产的植物中选择)作为植物材料,并使用了先前报告中选择的6种引物组合。 将存在于给定基因型中的多态片段...
  • powermarker.zip

    2020-08-29 20:36:58
    利用分子标记数据来计算观测等位基因数目(Na)、遗传多样性指数(He)和多态性信息含量(PIC)应用PowerMaker 3.25软件[17]计算观测等位基因数目(Na)、遗传多样性指数(He)和多态性信息含量(PIC)
  • PIC_CALC计算工具

    2014-09-29 10:12:29
    多态信息含量(PIC polymorphism information content):在连锁分析中一个遗传标记多态性可提供的信息量的度量。它是一个亲本为杂合子,另一亲本为不同基因型的概率。现常用来衡量座位多态性高低的程度。

空空如也

空空如也

1 2 3
收藏数 47
精华内容 18
关键字:

多态性遗传标记