精华内容
下载资源
问答
  • 甘蓝型油菜产量相关性状关联分析,蔡东芳,肖英杰,油菜是世界范围内广泛种植的油料作物,油菜产量性状越来越被人们重视和关注。关联分析是一种高效,分辨率较高的研究作物重要农艺
  • 猪趋化因子CXCL12及受体基因CXCR4和CXCR7的克隆、SNP检测及性状关联分析,李小平,任云斌,母胎界面的血管发育是胚胎正常发育的关键,近年来,大量的研究表明母胎界面存在的趋化因子及其受体对胎盘母面与子面的血管...
  • 玉米GBSS基因序列变异及其与籽粒淀粉品质性状关联分析,潘亮,刘静,GBSSI和GBSSIIa基因是颗粒结合型淀粉合成酶(GBSS)家族的2个重要成员。GBSSI基因主要参与胚乳等贮藏器官中颗粒结合型蛋白的合成。GBSSIIa�
  • 猪IDH3y基因的分离、克隆以及与性状关联分析,周永强,赵艳和,目的:分离与大白×梅山猪正反向杂交组合亲子代间脂肪性状差异相关的基因IDH3γ并做功能上的初步研究。方法:利用mRNA差异显示技术获
  • 采用灰色系统理论和方法对129份中国南瓜F1代品系的10个主要经济性状进行了关联分析。结果表明,与单瓜重关联度最大的为第一雌花节位和蔓粗;与可溶性固形物含量关联度较大的是节间长度、瓜横径、蔓粗;而与第一雌花...
  • 以初步筛选的肉鸡VLDL-RAPD关联引物扩增检测第三世代肉鸡高、低脂系个体的基因型,寻找与肥度性状关联的RAPD标记谱带.初步结果表明,随机引物A-08在第三世代肉鸡高、低脂系的扩增产物存在明显差异,其中150 bp位点的...
  • 猪miR-29c的克隆、组织表达谱及与部分免疫性状关联分析,黄菁,谢胜松,miRNA是一类长约22nt的非编码RNA,通过与靶基因的3′UTR 区结合来调控基因表达,在调节生物体生长、发育、疾病发生过程等方面发挥重要�
  • 利用PCR-SSCP法对AA肉鸡、仙居鸡(兼用型)和罗曼蛋鸡神经肽Y(NPY)基因全序列进行了单核苷酸多态(SNPs)检测.在基因内含子2中发现了5个紧密连锁的碱基变异位点:T2623C,C2704T,T2776G,T2787C和A2821G,这5个位点以...
  • 对大豆主要性状关联度的计算及关联序的排 列。结果表明,在窄行密植栽培模式下,产量与主要性状的关联度大小依次为株高>单株粒重>主茎节数>有效荚 数>百粒重>地上部干物重>单株粒数>底荚高;在垄三栽培模式下,关联度...
  • 应用相关性和灰色关联度方法分析了黑龙江省54份栽培大豆品种的异黄酮含量与主要性状的关系。经方法学验证建立的大豆异黄酮高效液相色谱法准确、可靠;初步明确了黑龙江省栽培大豆品种异黄酮及其主要成分含量的特点,...
  • 选取黑龙江省中、晚熟玉米对照品种及杂交组合共160份,采用灰色关联分析方法,对影响玉米产 量(单株粒重)的主要农艺性状进行研究。结果表明,与玉米单株粒重相关的农艺性状中,穗粗、百粒重和穗长最 为重要,整体关联度...
  • 基于50K SNP芯片技术对金华猪和嵊县花猪繁殖性状的全基因组关联分析.pdf
  • 试验以33个三色堇品种的8个重要数量性状为研究对象,分 别采用相关分析和灰关联分析,研究了这些性状对5个育种目标性状影响的主次关系及相关程度。结果表 明,对花径影响最大的为叶长,其次为叶宽,再次为茎粗,它们均与...
  • 最佳性状是基于多元 CCA 模型的最优 BIC 和 P 值,系统地将多变量关联分解为中心性状。 绘制变异跟踪结果并进行聚类,以剖析和提高表型-基因型关联的特异性。 20 年 7 月 1 日发布,LD 人口聚集 ...
  • 基于600K SNP芯片技术对宁海黄鸡和广西黄鸡繁殖性状的全基因组关联分析.pdf
  • 使用Python(版本3.6.9),R(版本4.0.2)和RStudio(版本1.2.5033)进行数据处理,分析和可视化。 细胞类型和组织特异性的Hi-C数据可在或数据库中获得(登录号:GSE77565,GSE105194,GSE105513,GSE105544,GSE...
  • 一、Case-Control 关联分析模型 (第一...二、(动植物)数量性状关联分析模型 加性模型(GAM) 当线性模型的种种条件不能满足时,就要考虑用平滑性模型来替代。平滑性模型可以对非线性关...

    一、Case-Control 关联分析模型 (第一部分主要是在人类中)

    卡方检验

    举例



    逻辑回归

    逻辑混合模型

    二、(动植物)数量性状关联分析模型



    加性模型(GAM)
    当线性模型的种种条件不能满足时,就要考虑用平滑性模型来替代。平滑性模型可以对非线性关系建模,也被称之作加性模型。加性模型是一般加性模型(GAM)的一类,是具有高斯分布的一般加性模型。
    参考网址https://www.jianshu.com/p/54595077f142

    非连锁相关的影响:
    1,人工填补的位点
    2,群体结构,材料亚群分化会有一定的特异性位点,就可能导致结果跟群体相关,但是跟性状无关的位点被关联出来,需要提前在群体结构那部分就检测一下,如果存在群体结构的影响就要把群体结构当成协方差,把这种位点校正掉。
    但是会存在一些问题,比如你的性状刚好跟群体结构有关,如果去掉了就关联不到想要的位点了。
    3,亲缘关系,材料间的共祖关系也会导致非连锁相关。这样的话就要加上kinship作为随机效应(也就是误差项)。

    GLM

    GLM 模型里面只有固定效应,没有随机效应。
    Y ,表型
    SNP ,固定效应(就是我们要的基因型)这个是我们要检测的
    Q or PCs ,固定效应,去校正群体结构(二者选一,都可以,没有哪一个更好的说法) 这个是作为一个背景控制
    e ,残差,系统误差,测量误差

    MLM

    MLM 相较于 GLM 多了一个随机效应,Kinship 。

    MLMM

    QTN ,数量性状SNP,就是控制 QTL 的 SNP
    然后就是不停的进行迭代

    关联分析模型

    综述文章

    模型评价

    t-test 模型最差
    FarmCPU 模型最优,最贴合期望值(实线部分)。这个如果理解 QQ plot 的应该很容易理解这个图

    三、关联分析常用软件介绍

    plink

    这里一定要注意在平常动植物中,不使用plink 进行关联分析,可以在数据过滤处理的时候使用,但是在关联分析的时候不使用。一般是在人类 GWAS 才会使用 plink 进行关联分析。因为它没办法实现复杂模型,就是 MLM 那些。

    tassel

    在动植物中关联分析 tassel 使用的最多。
    上百万标记,几百个样本要几十G 上百G 内存。

    gapit

    主要是基于 R 软件

    emmax

    在 gapit 中可以实现

    gemma

    主要是多了一个 BSLMM(贝叶斯稀疏线性混合模型)

    其他软件

    比如现在常见的 GCTA(全基因组复杂性状分析)(主要用在人类中)等等其他的

    eQTL

    首先 QTL 是数量性状位点,比如身高是一个数量性状,其对应的控制基因的位点就是一个数量性状位点,而eQTL就是控制数量性状表达位点,即能控制数量性状基因(如身高基因)表达水平高低的那些基因的位点。
    数量性状基因座:控制数量性状的基因在基因组中的位置称数量性状基因座。常利用DNA分子标记技术对这些区域进行定位,与连续变化的数量性状表型有密切关系

    表达数量性状基因座(expression Quantitative Trait Loci,eQTL)是对上述概念的进一步深化,它指的是染色体上一些能特定调控mRNA和蛋白质表达水平的区域,其mRNA/蛋白质的表达水平量与数量性状成比例关系。eQTL可分为顺式作用eQTL和反式作用eQTL,顺式作用eQTL就是某个基因的eQTL定位到该基因所在的基因组区域,表明可能是该基因本身的差别引起的mRNA水平变化;反式作用eQTL是指某个基因的eQTL定位到其他基因组区域,表明其他基因的差别控制该基因mRNA水平的差异。

    eQTL就是把基因表达作为一种性状,研究遗传突变与基因表达的相关性: 就好像研究遗传突变与身高的相关性一样。
    早年可以通过同时做一个个体的SNP芯片和cDNA芯片, 在全基因组尺度研究突变与表达的相关性, 这种研究需要较多个体(例如1000个); 现在随着深度测序的出现,很多人开始用RNA-Seq在较少量个体中研究allele-specific expression,本质上就是eQTL。
    简单地说, 遗传学研究经常发现一些致病或易感突变, 这些突变怎样导致表型有时候不太直观; 所以用某个基因的差异表达作为过渡: 突变A-->B基因表达变化-->表型;

    这部分主要能掌握 tassel 就可以了 !!

    展开全文
  • 采用灰色关联度系统理论,对云南农业大学选育的籼粳亚种间杂交后代12个常规籼稻品种和稳定品系的8个主要性状与产量的关系进行了综合分析评判,结果表明:应用灰色关联排序结果与实际表现和应用一致;高产品种应表现植株...
  • 采用单链构象多态性(PCR-SSCP)和DNA测序的方法检测了GH基因单核苷酸多态性(SNPs),针对该群体的特点建立合适的统计分析模型,并进行了GH基因多态性与生长性状的相关分析。结果表明,在北极狐GH基因的外显子2、内含子2和...
  • 利用最小二乘法拟合线性模型,探索了与鸡体型参数和屠体性状紧密相关的10个微卫星座位与商品代固始鸡体型参数和屠体性状的关系。用变性聚丙烯酰胺凝胶电泳法,分析了这10个微卫星位点在100只商品代固始鸡中的遗传...
  • 通过对14个甘薯品种(系)的随机区组试验,分析了其农艺性状与产量的相关性和灰色关联度,结果表明:在相关性分析中,鲜薯产量与干率、淀粉率和病情指数均呈极显著负相关关系,与大中薯率显著正相关,与小薯率显著负相关。...
  • breast_milk_HMOs_infant_appetite 分析母乳中的糖(人乳寡糖/ HMO)与婴儿食欲性状之间的关联
  • 全基因组关联分析(GWAS)简介

    千次阅读 2021-02-25 11:08:46
    目前,全世界范围内已开展了4000多项GWAS研究,发现了超过10万个与各种疾病(如癌症,高血压,II型糖尿病,类风湿性关节炎等)以及重要生理性状关联的基因位点。全基因组关联分析应用基因组中数以百万计的单核苷酸多...

    全基因组关联分析(GWAS)简介

    全基因组关联分析(GWAS)是广泛用于寻找复杂遗传疾病关联基因的重要手段。通过遗传学研究找到了很多致病突变体,这些突变体是指染色体上的变异位点。全基因组关联分析试图找到染色体上的变异位点,并研究这些变异位点与疾病或其他性状的关联。目前,全世界范围内已开展了4000多项GWAS研究,发现了超过10万个与各种疾病(如癌症,高血压,II型糖尿病,类风湿性关节炎等)以及重要生理性状关联的基因位点。全基因组关联分析应用基因组中数以百万计的单核苷酸多态性(SNP)为分子遗传标记,利用回归分析的方法进行全基因组水平上的对照分析或相关性分析,是一种通过关联分析发现影响复杂性状的基因变异的一种分析策略。

    GWAS分析结果解释
    在这里插入图片描述

    1. This plot is based on -log10 (P-value) from GWAS and imputation analysis against chromosome position.
    2. Each color represents a different chromosome.
    3. Blue horizontal line indicates the suggestive association threshold, P = 1 × 10-4.

    分析流程简述:

    1. 用BAW构建索引并进行比对。
    2. 用samtools进行格式转换。
    3. GATK 变异检测,对SNP进行检测并过滤。
    4. 性状和表型进行关联分析,制作图表,如曼哈顿图。
      具体分析流程可参考
      [添加链接描述]GWAS全基因组关联分析流程(https://blog.csdn.net/genetics/article/details/109153909?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&dist_request_id=fbd8a5ab-a826-4507-b3a1-f2ff691fef8e&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control)

    References

    1. Leone M A, et al. Association of Genetic Markers with CSF Oligoclonal Bands in Multiple Sclerosis Patients[J]. Plos One, 2013, 8.
    2. Myoungsook, et al. Genome-wide association study for the interaction between BMR and BMI in obese Korean women including overweight [J]. Nutrition Research & Practice, 2016. Feb; 10(1): 115–124.
    展开全文
  • 通过对在碳酸盐草甸土上种植的9个大豆抗线品种(系)主要性状关联度的计算及关联序的排列,研 究了在此种土壤上影响大豆抗线品种(系)产量的主要因素。结果表明,单株粒重在大豆抗线品种(系)中对产量的 作用居所有性状之...
  • 该项目的目的是估计儿童和青春期的自主神经系统功能的心脏测量值与call弱的情绪特征之间的平均关联。 该存储库包含项目的主要数据和代码库。 如何使用储存库 该存储库用作项目的记录,并且可以用于查看一段时间内的...
  • 随着分子生物学和基因组学的飞速发展,关联分析成为植物数量性状研究的重要手段。对连锁不平衡、关联分析、单核苷酸多态性的概念、原理进行了简要介绍,综述了关联分析在玉米种质资源方面的研究进展,并探讨了关联分析...
  • 最近提出的全转录组关联分析(transcriptome-wide association studies,TWAS)是研究与变异性状关联的潜在基因调控机制的宝贵工具。具体来说,TWAS整合了GWAS和基于一组共同变异的表达图谱研究,旨在确定其GReX与...

    全转录组关联分析(TWAS)简介

    简介

    全基因组关联研究(GWAS)已经确定了数千种与许多复杂特征相关的遗传变异。然而,它们的生物学机制在很大程度上仍然是未知的。最近提出的全转录组关联分析(transcriptome-wide association studies,TWAS)是研究与变异性状关联的潜在基因调控机制的宝贵工具。具体来说,TWAS整合了GWAS和基于一组共同变异的表达图谱研究,旨在确定其GReX与表型相关的基因。目前已经开发了各种方法或软件(如PrediXcan,S-prediXcan,Fusion,UTMOST)来执行TWAS综合分析。为了解决不同的生物学问题,每一种分析方法或者软件都有不同的建模假设。在生物医学研究中,TWAS已经成功应用于多种疾病,如精神分裂症,乳腺癌,前列腺癌,低密度脂蛋白胆固醇和克罗恩氏病等疾病中。

    TWAS分析策略
    Fig1. TWAS分析策略. (Wainberg, M, et al. 2019)

    TWAS分析优势
    与全基因组关联研究相比,TWAS研究策略具有以下优点:

    • 与SNP相比,基于基因的分析具有更低的多重比较压力。
    • 分析结果以特定基因而非SNP的形式呈现,基因的生物学意义更为直接,便于后续的功能研究和结果转化。
    • GTEx数据库提供了极为丰富的基因组和转录组数据。研究人员可以使用各种人体组织和细胞数据作为参考面板来构建模型。从GWAS到TWAS的过渡无需额外的样本测试即可实现。
    • TWAS研究中使用了越来越成熟的人工智能分析方法,并且预测结果变得越来越准确。

    TWAS 应用领域

    • 肿瘤和复杂疾病易感基因的研究。
    • 分析动植物的特殊性状。
    • 疾病预警,遗传咨询,早期诊断,风险评估和药物选择。

    TWAS分析要点
    1.将GTEx作为参考面板(reference panel)训练来自基因型的表达预测模型(training a predictive model);
    2.使用该模型预测GWAS队列中个体的表达;
    3.将该预测结果进行基因表达与性状关联分析。

    References

    1. Wainberg, M, et al. Opportunities and challenges for transcriptome-wide association studies[J]. Nature Genetics, (2019). 51(4), 592–599. doi:10.1038/s41588-019-0385-z.
    2. Gusev A, et al. Integrative approaches for large-scale transcriptome-wide association studies[J]. Nature Genetics, (2016). doi:10.1038/ng.3506.
    展开全文
  • 白皮小麦抗穗发芽候选基因位点的关联分析,周勇,李净琼,小麦穗发芽是小麦籽粒成熟前穗上发芽的一种现象,这种现象是一种复杂性状。该性状同时受环境和基因型的影响,且还是受多基因共同
  • 欢迎关注”生信修炼手册”!case/control的关联分析,本质是寻找在两组间基因型分布有差异的SNP位点,这些位点就是候选的关联信号,常用的分析方法有以下几种卡方检验费舍尔精确检验逻...

    欢迎关注”生信修炼手册”!

    case/control的关联分析,本质是寻找在两组间基因型分布有差异的SNP位点,这些位点就是候选的关联信号,常用的分析方法有以下几种

    1. 卡方检验

    2. 费舍尔精确检验

    3. 逻辑回归

    卡方检验是一种用途广泛的假设检验,属于非参数的检验一种,适合针对分类变量的分析。从形式上看,数据是由行和列对应的两个分类变量构成的表格,示意如下

    对于case/control的关联分析,我们有两个分类变量,第一个就是样本的分组, 有case和control两组;第二个是Allel或者基因型的类别,对于Allele而言有两种,major和minor allele。对于基因型而言, 在上图中有AA, Aa, aa3种,当然在实际分析中,还会考虑遗传模型进一步对基因型的类别进行划分,常用的遗传模型有以下几种

    1. domanant model, 显性遗传模型,只要有突变位点就会致病,所以杂合突变和纯合突变归位一类,基因型就划分为两类,第一类为AA和Aa, 第二类为aa

    2. recessive model, 隐性模型, 只有纯合突变会致病,基因型同样划分为两类,第一类为纯合突变AA, 第二类为非纯合突变,Aa和aa

    3. additive model, 相加模型,突变位点的个数会影响性状的表型值,而且是累加关系,纯合突变的突变位点个数是杂合突变的2倍,对应的性状是不同的,基因型划分为3类, AA,Aa, aa

    4. multiplicative model, 相乘模型,突变位点的个数会影响性状的表型值,而且是相乘关系,纯合突变的突变位点个数是杂合突变的4倍,对应的性状是不同的,基因型划分为3类, AA,Aa, aa

    以上模型根据划分的类别可以分为3大类,第一类是显性遗传模型,第二类是隐性遗传模型,第三类是additive, multiplicative model和常规的基因型分类,这三种模型都是划分为了3种基因型。

    对于卡方检验,首先需要根据表格中的频数分布计算卡方统计量,公式如下

    A表示实际频数,T表示理论频数,从公式可以看到,卡方统计量代表的是实际值与理论值之间的差异。看一个具体的例子

    GenotypeAAAaaa
    Case30
    1555
    Control281260

    上图表示的是两组实际观测到的基因型频数分布,对应的频率分布如下

    GenotypeAAAaaa
    Case30%15%55%
    Control28%12%60%

    从数值上看,直观的可以看两组间分布有差异,但是这个差异是由抽样导致的误差还是真实存在的差异不知道。先假设两组间没有差异,合并样本,再次统计对应的频率,分别为29%, 13.5%,57.5% ,这3个数值就是理论频率, 根据这个频率来计算理论频数

    GenotypeAAAaaa
    Case100 x 29%100 x 13.5%100 x 57.5%
    Control100 x 29%100 x 13.5 %100 x 57.5 %

    然后通过公式来计算卡方值,最终的计算结果为0.61969, 对应的R代码如下

    从上图可以看到,对于卡方检验,除了卡方值X-squared之外,还有df和p-value两个值。df表示自由度,取值为(行数 - 1) X (列数 - 1), 上述数据为2X3的表格,自由度为2。为什么要考虑自由度呢?

    这就要从卡方分布的定义说起,对于N个符合标准正态分布的变量,其平方和服从卡方分布,自由度指的就是这里的N, 不同自由度卡方分布是不同的,如下图所示

    上图所示是不同自由度下卡方值的密度分布,不同自由度之间差别很大,所以我们需要先明确对应的自由度才可以利用卡方值来做出判断。利用自由度和卡方值,我们需要去查询卡方值分布表,获得对应的p值。在R中对应的操作代码如下

    1 - pchisq(0.6196902, df = 2)
    [1] 0.7335606

    pchisq代表是卡方值的累计分布函数,代表卡方值小于0.6196902的概率。卡方分布表中为大于阈值的概率,示意如下

    卡方值越小,对应的概率越大。自由度为2,P=0.05对应的卡方临界值为5.99, 上述示例的卡方值小于该临界值,说明发生的概率大于0.05,拒绝原假设,case/control组间差异不显著。

    卡方检验虽然使用范围广泛,但还是有一些限制,样本量必须大于40, 而且最小的频数不能小于5,  这里的频数指的是理论频数

    对于2X2的数据,当不满足要求时,推荐使用费舍尔精确检验来进行分析。

    ·end·

    —如果喜欢,快分享给你的朋友们吧—

    扫描关注微信号,更多精彩内容等着你!

    展开全文
  • MAGMA软件被设计用于基于基因的(gene-based)或基因集的(gene-set-based)的关联分析,可以直接找到与目的性状相关的功能基因或功能模块(如基因调控通路等),也有利于发现由多个微效 SNP 关联的基因。 MAGMA 的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 693
精华内容 277
热门标签
关键字:

性状关联分析