精华内容
下载资源
问答
  • 生信技能树

    2018-12-07 11:45:05
    生信技能树的创始人做的,有需求下载。生信技能树的创始人做的,有需求下载生信技能树的创始人做的,有需求下载
  • linux下安装软件 echo $PATH ##查看路径 echo $PATH|tr ":" "\n"|xargs ls -lh ls -lh /usr/bin 下载安装Bowtie2 首先在root下新建一个Biosoft的文件夹,切换目录到该文件夹 cd Biosoft 再在该文件夹下,新建一个...

    linux下安装软件

    echo $PATH  ##查看路径
    

    在这里插入图片描述

     echo $PATH|tr ":" "\n"|xargs ls -lh
    ls -lh /usr/bin
    下载安装Bowtie2
    首先在root下新建一个Biosoft的文件夹,切换目录到该文件夹
    cd Biosoft
    再在该文件夹下,新建一个Bwotie2的文件夹
    mkdir Bowtie2
    下载Bowtie2的网址
    wget https://sourceforge.net/projects/bowtie-bio/files/bowtie/1.3.0/bowtie-1.3.0-linux-x86_64.zip ##wget 后面加下载的网址
    这一步,下载出错,直接在Windows上下载,然后传输到linux上
    
    
    

    在这里插入图片描述
    传输完了可以查看,然后再解压

    unzip bowtie2-2.4.1-linux-x86_64.zip
    进一步的切换进入bowtie2-2.4.1-linux-x86_64文件夹目录
    然后查看该文件夹下的文件
    ls
    

    在这里插入图片描述

    其中的绿色的是可执行文件
    接下来在该目录下运行bowtie2

    重点记得在执行bowtie2前加./,不然的话,这个点加斜杠让你怀疑人生,另外在加了./后(./是一个相对路径),只用打出bowtie2的前四个字母,用TAB键可以补充完整
    在这里插入图片描述
    或者将bowtie2的路径进行赋值

    在这里插入图片描述

    第三步手动添加环境变量,然后就可以直接执行bowtie2
    
    环境变量export PATH="$PATH:/root/Biosoft/Bowtie2/bowtie2-2.4.1-linux-x86_64/"
    
    

    在这里插入图片描述在bowtie2里面有example文件,可以查看
    在这里插入图片描述

    构建索引
     ./bowtie2-build example/reference/lambda_virus.fa tmp
    用给的病毒的基因组进行构建索引
    
    
    进行比对,并输出SAM文件, -x 是比对,-1是第一个需要比对的reads,后面直接放的是该reads的fastq文件,-2是第二个reads文件, 比对完之后的数据以tmp.sam文件输出
     ./bowtie2 -x tmp -1 example/reads/reads_1.fq -2 example/reads/reads_2.fq -S tmp.sam
    
    

    比对的结果如下图所示

    采用tail tmp.sam 进行查看文件的尾行
    

    在这里插入图片描述

    echo $PS1是查看用户的环境变量
    
    在linux下echo相当于print 可以打印出想要看的材料
    

    用while进行循环,在linux下,后面的lkjfew是id是一个变量
    在这里插入图片描述

    用for 进行循环

    在这里插入图片描述

    for i in SRR103952*,后面的*号是一个通配符,在此相当于模糊匹配的意思
    在这里插入图片描述
    在这里插入图片描述

    ln-s 软连接。可以对无权限操作的文件进行重新操作

    赋值操作和for 循环
    file%%.*是去除两个点.后面的字符串

    在这里插入图片描述

    在这里插入图片描述

    进行WES分析文件质量检查
    在这里插入图片描述

    展开全文
  • 1.首先添加conda的镜像 conda的软件源有很多,其中专门收录了生物信息学软件的软件源,亦即bioconda。所以bioconda仅仅是conda的软件源之一,与bioconductor之于CRAN,bioperl之于CPAN是类似的。...

    1.首先添加conda的镜像

    本文后续的分析主要参考的是这篇文章,主要是想用E.coil的数据进行后续的分析
    https://zhuanlan.zhihu.com/p/33891718
    但是再下载SRA数据的时候一直没下载下来
    因为后续下载到了GATK上bundel上的100G的数据,所以直接俄按照jimmy后续的分析操作进行了。

    conda的软件源有很多,其中专门收录了生物信息学软件的软件源,亦即bioconda。所以bioconda仅仅是conda的软件源之一,与bioconductor之于CRAN,bioperl之于CPAN是类似的。所以掌握bioconda,事实上也就是掌握conda,反之亦然。

    常用的镜像有,清华大学的镜像,中科大的镜像和兰州大学的镜像等。
    安装Anaconda或者miniconda,如若没有root权限,建议安装后者,后者包轻便,前者包含自带的一个python,安装过程如下:

    #下载包 
    wget "https://repo.continuum.io/archive/Anaconda3-5.0.1-Linux-x86_64.sh"
    #安装程序
    bash  Anaconda3-5.0.1-Linux-x86_64.sh
    #添加环境变量
    vim /etc/bashrc
    export PATH=/tools/anaconda3/bin:$PATH  ##是你安装Anaconda的路径
    

    配置bioconda
    如果root身份运行则添加到全局,如果是用户身份运行则会修改用户主目录下的.condarc文件,与bashrc, bashprofile等类似

    conda config --add channels conda-forge
    conda config --add channels defaults
    conda config --add channels r
    conda config --add channels bioconda
    
    

    以上,无论是conda默认的软件源还是bioconda软件源都是国外的,速度非常慢,
    所以需要增加国内软件源,同时bioconda已经有清华,中科大两个国内镜像,也添加进去。

    conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
    conda config --set show_channel_urls yes
    conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
    conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
    #bioconda
    conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
    conda config --set show_channel_urls yes
    #在广州应该使用中科大的bioconda源(清华的源可能远水救不了近火...) 
    conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/bioconda/
    conda config --set show_channel_urls yes
    #查看目前conda软件源情况
    conda info
    
    

    gatk数据下载

    先在目录下新建文件夹 input output 和bin
    在这里插入图片描述

    然后在input数据里下载E.coli K12的参考基因组序列,进行数据测试
    可以在NCBI的FTP上进行下载

    ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/005/845/GCF_000005845.2_ASM584v2/GCF_000005845.2_ASM584v2_genomic.fna.gz  
    
    wget ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/005/845/GCF_000005845.2_ASM584v2/GCF_000005845.2_ASM584v2_genomic.fna.gz 
    
    

    得到的时Ecoil K12的全基因组序列
    如下图所示
    在这里插入图片描述

    然后解压缩,并命名为 E.coli_K12_MG1655.fa
    gzip -dc GCF_000005845.2_ASM584v2_genomic.fna.gz > E.coli_K12_MG1655.fa
    head E.coli_K12_MG1655.fa
    

    在这里插入图片描述作者接着使用samtools进行构建参考基因组的索引
    因此在Biosoft文件夹下载samtools

    mkdir ~/Biosoft/samtools
    cd /root/Biosoft/samtools
    
    
    
    
    
    
    展开全文
  • 首先友情宣传生信技能树首先使用bowtie2软件自带的测试数据生成sam/bam文件,还有vcf文件。代码如下:mkdir -p ~/biosoftcd ~/biosoftwget ...

    首先友情宣传生信技能树

    首先使用bowtie2软件自带的测试数据生成sam/bam文件,还有vcf文件。代码如下:

    mkdir -p ~/biosoft

    cd ~/biosoft

    wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh

    bash Miniconda3-latest-Linux-x86_64.sh

    source ~/.bashrc

    conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free

    conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge

    conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda

    conda config --set show_channel_urls yes

    conda create -y -n test

    conda activate test

    conda install -y samtools bcftools

    wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.3.4.3/bowtie2-2.3.4.3-linux-x86_64.zip

    unzip bowtie2-2.3.4.3-linux-x86_64.zip

    cd ~/biosoft/bowtie2-2.3.4.3-linux-x86_64/example/reads

    ../../bowtie2 -x ../index/lambda_virus -1 reads_1.fq -2 reads_2.fq | samtools sort -@ 5 -o tmp.bam -

    bcftools mpileup -f ../reference/lambda_virus.fa tmp.bam |bcftools call -vm > tmp.vcf

    LINUX练习题

    把突变记录的vcf文件区分成INDEL和SNP条目

    $grep '^##' tmp.vcf | grep 'INDEL'

    ##INFO=

    $grep -v '^#' tmp.vcf | grep 'INDEL' > tmp_INDEL.vcf

    $cat tmp_INDEL.vcf | wc -l

    69

    $grep -v '^#' tmp.vcf | grep -v 'INDEL' > tmp_SNP.vcf

    $cat tmp_SNP.vcf | wc -l

    36

    统计INDEL和SNP条目的各自的平均测序深度

    $grep '^##' tmp.vcf | grep 'depth'

    ##INFO=

    $egrep -o 'DP=[0-9]+;' tmp_INDEL.vcf | awk -v FS='=' 'BEGIN{num=0;}{num=num+$2}END{print(num/NR)}'

    40.6087

    $egrep -o 'DP=[0-9]+;' tmp_SNP.vcf | awk -v FS='=' 'BEGIN{num=0;}{num=num+$2}END{print(num/NR)}'

    37

    把INDEL条目再区分成insertion和deletion情况

    $awk '$4>$5{print}' tmp_INDEL.vcf > tmp_deletion.vcf

    $cat tmp_deletion.vcf |wc -l

    68

    $awk '$4 tmp_insertion.vcf

    $cat tmp_insertion.vcf | wc -l

    1

    统计SNP条目的突变组合分布频率

    $awk '{print $4"->"$5}' tmp_SNP.vcf | sort | uniq -c

    7 A->C

    1 A->G

    4 A->T

    2 C->A

    4 C->G

    3 G->A

    2 G->C

    4 G->T

    6 T->A

    1 T->C

    2 T->G

    找到基因型不是 1/1 的条目,个数

    $grep -v '^#' tmp.vcf | grep -v '1/1' |wc -l

    26

    $grep -v '^#' tmp.vcf | grep -v '1/1' |less -SN

    eadfcd7e23ee?utm_campaign=hugo&utm_content=note&utm_medium=writer_share&utm_source=weibo

    筛选测序深度大于20的条目

    $egrep -o "DP=[0-9]+;" tmp.vcf |awk '{print(length($0)-4)}'| sort | uniq -c#查看测序深度位数

    2 1

    103 2

    #测序深度最多只有2位数

    $egrep "DP=2[1-9];|DP=[3-9][0-9];" tmp.vcf |wc -l

    100

    $egrep "DP=2[1-9];|DP=[3-9][0-9];" tmp.vcf |less -SN

    eadfcd7e23ee?utm_campaign=hugo&utm_content=note&utm_medium=writer_share&utm_source=weibo

    筛选变异位点质量值大于30的条目

    $grep -v '^#' tmp.vcf |awk '$6>30{print}' > tmp_QUALmorethan30.vcf

    $cat tmp_QUALmorethan30.vcf | wc -l

    99

    $less -SN tmp_QUALmorethan30.vcf

    eadfcd7e23ee?utm_campaign=hugo&utm_content=note&utm_medium=writer_share&utm_source=weibo

    组合筛选变异位点质量值大于30并且深度大于20的条目

    $egrep "DP=2[1-9]|DP=[3-9][0-9]" tmp_QUALmorethan30.vcf | wc -l

    97

    $egrep "DP=2[1-9]|DP=[3-9][0-9]" tmp_QUALmorethan30.vcf | less -SN

    eadfcd7e23ee?utm_campaign=hugo&utm_content=note&utm_medium=writer_share&utm_source=weibo

    理解DP4=4,7,11,18 这样的字段,就是 Number of high-quality ref-forward , ref-reverse, alt-forward and alt-reverse bases 计算每个变异位点的 AF

    DP4,高质量测序碱基,4个数字分别对应ref-前,ref-后,alt-前,alt-后

    【理解DP4=4,7,11,18】

    参考序列变异位点之前有4个高质量测序碱基,之后有7个高质量测序碱基;

    变异序列变异位点之前有11个高质量测序碱基,之后有18个高质量测序碱基

    AF:Allel Frequency 等位基因频率

    参考:简书:刘小泽 - VCF格式

    AC、AF、AN【和等位基因有关】: AC:Allele Count该位点变异的等位基因数目; AF:Allel Frequency 等位基因频率; AN:Allel Number 等位基因的总数目

    【单看这个不好理解,举一个二倍体diploid例子:基因型0/1表示为杂合子,该位点只有一个等位基因发生突变,AF=0.5(在该位点只有50%的等位基因发生突变),总的等位基因数目为2;基因型1/1表示为纯合子,AC=2,AF=1,AN=2】

    所以,

    0/0的AF=0;

    0/1的AF=0.5;

    1/1的AF=1;

    另外,AF标签属于INFO列

    $grep -v "^#" tmp.vcf | awk '{print$10}' |awk -F":" '{print$1}' | sort | uniq -c #查询样本基因型

    26 0/1

    79 1/1

    $grep -v "^#" tmp.vcf | awk '{if ($0~"1/1"){$8=$8";AF=1";print$0} else if ($0~"0/1"){$8=$8";AF=0.5";print$0}}' > tmp_addAF.vcf

    在前面步骤的bam文件里面找到这个vcf文件的某一个突变位点的测序深度表明的那些reads,并且在IGV里面可视化bam和vcf定位到该变异位点。

    $grep -v "^#" tmp.vcf |head -10 |less -SN

    eadfcd7e23ee?utm_campaign=hugo&utm_content=note&utm_medium=writer_share&utm_source=weibo

    10.1 如图,选择1104突变位点,DP=43,参考序列为C,突变成A

    10.2 检索bam文件

    参考:徐洲更hoptop - SAMtools: SAM格式的处理利器

    bam文件:

    第4列:比对到的位置

    第10列:segment序列

    $samtools-1.9 view tmp.bam | awk '{if ($3!="*" && $4<=1104 && substr($10,1104-$4+1,1)=="A") print}' | wc -l

    45#与vcf文件中DP=43不符合

    10.3 tmp.vcf在IGV中可视化

    eadfcd7e23ee?utm_campaign=hugo&utm_content=note&utm_medium=writer_share&utm_source=weibo

    IGV-vcf

    10.4 tmp.bam在IGV中可视化

    eadfcd7e23ee?utm_campaign=hugo&utm_content=note&utm_medium=writer_share&utm_source=weibo

    IGV-bam

    展开全文
  • 1. 在任意文件夹下面创建形如 1/2/3/4/5/6/7/8/9 格式的文件夹系列。# 在自己的目录下创建一个专门用于做练习的文件夹先cd /trainee/Judemkdir pracitcecd practicemkdir -p 1/2/3/4/5/6/7/8/92....

    1. 在任意文件夹下面创建形如 1/2/3/4/5/6/7/8/9 格式的文件夹系列。

    # 在自己的目录下创建一个专门用于做练习的文件夹先

    cd /trainee/Jude

    mkdir pracitce

    cd practice

    mkdir -p 1/2/3/4/5/6/7/8/9

    2. 在创建好的文件夹下面,比如我的是 /Users/jimmy/tmp/1/2/3/4/5/6/7/8/9 ,里面创建文本文件 me.txt。

    # 需要明确去什么地方,做什么

    cd 1/2/3/4/5/6/7/8/9

    touch me.txt

    3. 在文本文件 me.txt里面输入如下内容:

    Go to: http://www.biotrainee.com/

    I love bioinfomatics.

    And you ?

    # 编辑文本内容用vim

    vim me.txt

    i

    Go to: http://www.biotrainee.com/

    I love bioinfomatics.

    And you ?

    esc

    :wq

    4. 删除上面创建的文件夹1/2/3/4/5/6/7/8/9 及文本文件me.txt.

    # 强制删除目录

    cd /trainee/Jude/practice

    rm -rf 1

    5. 在任意文件夹下面创建 folder1~5这5个文件夹,然后每个文件夹下面继续创建 folder1~5这5个文件夹。

    # 我的方法(开始以为简单,后来发现很naive)

    mkdir folder{1..5} #第一步创建5个文件夹

    vim script #第二步写脚本

    i

    #!/bin/bash

    for folder in folder1 folder2 folder3 folder4 folder5

    do cd $folder; mkdir folder{1..5}; cd ..

    done

    esc

    :wq

    ./script #第三部运行脚本,创建套娃文件夹

    # 其他同学的方法,主要在第二步

    mkdir -p folder{1..5}/folder{1..5}

    6. 在第五题创建的每一个文件夹下面都创建第二题文本文件 me.txt ,内容也要一样.

    # 开始是不会的,看了别人的答案,需要用到 xargs

    touch me.text

    echo folder{1..5}/folder{1..5} | xargs -n 1 cp -v me.txt

    注释:

    xargs:并不是所有命令都可以把管道符前面的输出作为输入,xargs就可以实现这个转换,建议参考:xargs命令详解

    -n:表示每次传递给后面命令几个参数,后面跟数字“1”表示传递1个参数

    7. 再次删除掉前面几个步骤建立的文件夹及文件.

    rm -rf folder*

    wget http://www.biotrainee.com/jmzeng/igv/test.bed

    cat -n test.bed | grep H3K4me3

    cat -n test.bed | wc

    wget http://www.biotrainee.com/jmzeng/rmDuplicate.zip

    unzip rmDuplicate.zip

    cd rmDuplicate/

    tree -d

    打开第九题解压的文件,进入 rmDuplicate/samtools/single 文件夹里面,查看后缀为.sam的文件,搞清楚 生物信息学里面的SAM/BAM 定义是什么。

    cd rmDuplicate/samtools/single

    less -S -N tmp.sam

    注释*:

    SAM文件:是sequence alignment/map format的缩写,记录序列比对信息的文件,分为标头注释部分和序列比对部分,其中序列比对部分至少11列。

    BAM文件是SAM文件的二进制格式,可用samtools view命令查看,格式转化便于储存更多的数据。

    11. 安装 samtools软件

    # 如果已经安装了conda,很简单

    conda install samtools

    # 如果单独安装

    wget -c https://github.com/samtools/samtools/releases/download/1.9/samtools-1.9.tar.bz2

    tar -jxvf samtools-1.9.tar.bz2

    cd samtools-1.9/

    ./configure --prefix=/trainee/Jude/practice/samtools-1.9

    make

    make install

    echo 'export PATH="/trainee/Jude/practice/samtools-1.9:$PATH"'>>~/.bahsrc

    source ~/.bashrc

    12. 打开后缀为BAM的文件,找到产生该文件的命令。

    # 打开BAM文件

    samtools view tmp.sorted.bam | less -SN

    # 产生bam文件的命令一般都在头部注释信息中,不过是在头部信息的最后一行,所以用tail命令

    which samtools

    /usr/bin/samtools view -H tmp.sorted.bam | tail

    # 经过上面的操作可知生成BAM文件的命令如下:

    /home/jianmingzeng/biosoft/bowtie/bowtie2-2.2.9/bowtie2-align-s --wrapper basic-0 -p 20 -x /home/jianmingzeng/reference/index/bowtie/hg38 -S /home/jianmingzeng/data/public/allMouse/alignment/WT_rep2_Input.sam -U /tmp/41440.unp

    13. 根据上面的命令,找到我使用的参考基因组 /home/jianmingzeng/reference/index/bowtie/hg38 具体有多少条染色体。

    # 方法一:通过看BAM文件标头信息确认染色体数量,筛选时用到正则表达式

    samtools view -H tmp.rmdup.bam | grep -o -E "SN:chr[0-9]+|SN:chr[a-zA-Z]"| sort | uniq -c | wc -l

    # 方法二:直接找打hg38.fa文件查看染色体数量(hg38.fa需要绝对路径)

    less -S hg38.fa | grep ">chr" | cut -d "_" -f 1 | sort | uniq -c | wc -l

    14. 上面的后缀为BAM 的文件的第二列,只有0和16 两个数字,用 cut/sort/uniq等命令统计它们的个数。

    # 方法一(复杂)

    samtools view tmp.sorted.bam | less -SN | cut -f 2 | grep 0 | wc

    samtools view tmp.sorted.bam | less -SN | cut -f 2 | grep 16 | wc

    # 方法二(简单)

    samtools view tmp.sorted.bam | less -SN | cut -f 2 | sort | uniq -c

    15. 重新打开rmDuplicate/samtools/paired文件夹下面的后缀为BAM的文件,再次查看第二列,并且统计。

    cd /trainee/Jude/practice/rmDuplicate/samtools/paired

    samtools view tmp.sorted.bam | less -SN | cut -f 2 | sort | uniq -c

    wget -c http://www.biotrainee.com/jmzeng/sickle/sickle-results.zip

    unzip sickle-results.zip

    cd sickle-results/

    tree

    17. 解压 sickle-results/single_tmp_fastqc.zip文件,并且进入解压后的文件夹,找到fastqc_data.txt 文件,并且搜索该文本文件以 >>开头的有多少行?

    cd sickle-results

    unzip single_tmp_fastqc.zip

    cd single_tmp_fastqc/

    less -SN fastqc_data.txt | grep \>\> | wc

    18. 下载 http://www.biotrainee.com/jmzeng/tmp/hg38.tss 文件,去NCBI找到TP53/BRCA1等自己感兴趣的基因对应的 refseq数据库 ID,然后找到它们在hg38.tss 文件的哪一行。

    # 涉及到refseq数据库中对应基因的ID查找

    wget http://www.biotrainee.com/jmzeng/tmp/hg38.tss

    less -SN hg38.tss | grep -n NM_001126115

    less -SN hg38.tss | grep -n NM_007294

    19. 解析hg38.tss 文件,统计每条染色体的基因个数。

    # 某染色体有多少个重复就对应着多少个基因

    less hg38.tss | awk '{print$2}' | cut -c 1-5 | sort |uniq -c

    # 或者

    less hg38.tss | cut -f 2 | cut -c 1-5 | sort |uniq -c

    注释:

    .tss 文件记录基因坐标,第一列是基因的Refseq ID,第二列是染色体号,第三列是基因起始坐标,第四列是基因终止坐标。

    20. 解析hg38.tss 文件,统计NM和NR开头的数量,了解NM和NR开头的含义。

    less -SN hg38.tss | grep NM | wc

    less -SN hg38.tss | grep NR | wc

    注释*:

    NM含义:表示标准序列(转录产物序列,成熟mRNA转录本序列)

    NR含义:非编码蛋白的mRNA序列

    参考文章

    展开全文
  • data(iris) Q1: 载入R中自带的数据集 iris,指出其每列是定性还是定量数据 str(iris) 'data.frame': 150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... ...
  • 作者:钱胜原载于本实验室微信公众号EvoDevo好好玩(http://mp.weixin.qq.com/s/pGZdmSkwt9Rb9NeCEg-C3Q )先给大家安利一个网站,生信技能树,里面有几千个帖子,有问题的时候不妨在里面搜索,或许就有你想要解决的...
  • (试题是生信菜鸟团论坛上爬过来的,使用的服务器是转发生信技能树推文在朋友圈集3个赞换的,学习的教程是生信技能树放在B站上的。神呀,保佑Jimmy大神吧,愿他老人家福寿、安康~~~)重点: (去可视化概念+练习) 了解 ...
  • 前段时间偶然看到生信技能树举办第一届生物信息人才发展论坛的消息,看到会议主旨和大概内容,觉得和自己的事还挺相关的,恰逢周末,不耽误工作,于是就报了名。 结果去了才发现这只是一个线下网友见面交流会,会场...
  • 生信学习网站推荐

    2020-10-15 22:40:57
    B站上有好多免费的生信课程,最近在学习“生信技能树”出品的生信教程,很干货,收获很多,推荐给初学的小伙伴们。 生命不息,学习不止,想学好生信在于多听多看和多多练习,同时不断思考,保持兴趣。这一阶段的目标...
  • bio 生信博主网站 blog

    2018-09-02 00:43:59
    整理了一下收藏的生信博客链接 ...- 生信技能树 http://www.biotrainee.com/ - 生信人 https://shengxin.ren/ - omicShare http://www.omicshare.com/forum/ - PLoB https://www.plob.org...
  • 感谢生信技能树 感谢jimmy 一、Linux系统简介 1.文件结构 在Linux中,一切皆为文件 文件(特殊)种类:d(目录)、l(链接) 文件权限:r4、w2、x1 一图以蔽之 2.命令格式 命令 + 参数 + 文件 command [-options ...
  • 生信数据下载(转)

    2019-10-04 08:54:12
    需要了解的知识点: 测序仪原理 一、数据下载 生物信息学常见的数据下载,包括基因组,gtf,bed,...http://www.bio-info-trainee.com/1469.html(生信技能树) 测试数据及参考基因组准备: http://www.biotr...
  • 在接下来的日子里,我也会继续关注生信星球以及生信技能树这两个优秀的公众号,继续学习生信的相关知识;同时在学习的过程中,我也会保持在学习小组这七天养成的记笔记(思维导图)的好习惯,便于自己更好的掌握学习...
  • 生信人学习R(day01)

    2018-09-30 18:45:44
    这是我看生信技能树的视屏记得笔记 #读取一个.txt文件(此处还可以为csv文件,但是不可以是Excel,当读取CSV时不需要后面的参数) Q = read.table("GSM1545535_10_6_5_11.txt", header = T, sep = "\t") #此处...
  • 生信人的20个R语言习题的答案

    千次阅读 2018-11-04 23:53:52
    这是生信技能树关于生信人的20个R语言习题的答案: 1 安装R包 数据包: ALL, CLL, pasilla, airway 软件包:limma,DESeq2,clusterProfiler 工具包:reshape2 绘图包:ggplot2 ################################# 1...
  • TCGA生信技能树66个教程 1.手把手教你“破译”武汉新型冠状病毒(一天完成中文期刊《生物信息学》文章的工作) 2.1 寻找 Nankai回文序列 2.2 构建进化树 2.3 寻找“可变翻译” 2.构建系统发育树: 只靠这个就能发...
  • GEO数据挖掘全流程分析

    万次阅读 2020-02-29 19:45:43
    声明:以下学习资料根据“生信技能树”网络系列免费教学材料整理而成,代码来自“生信技能树”校长jimmy的github。GEO数据库挖掘系列知识分享课程,于2016年首发于生信菜鸟团博客。配套教学视频在B站,特此声明。 ...
  • 六框翻译

    2018-08-14 17:49:00
    六框翻译-生信人必练的200个数据处理任务-生信技能树 http://www.biotrainee.com/thread-1444-1-1.html(出处: 生信技能树) 密码子是按3个碱基翻译的, 所以从第一位开始翻译会得到一个氨基酸序列, 从第二位...
  • 生物信息学常见1000个软件的安装代码 尊重原创,我这里链接了一个原创的教程 官网:生信技能树 软件安装教程 jimmy写的教程。
  • 给GSVA制作自己的GMT文件

    千次阅读 2018-09-20 12:41:19
    https://www.jianshu.com/p/1818267528bd 来自生信技能树 讲gmt文件的结构以及如何将gene set输出成gmt格式。 如何操作gmt格式的gene set?比如去掉重复基因。
  • biostars ... 生信技能树 http://www.biotrainee.com/ 生信人 https://shengxin.ren/ omicShare http://www.omicshare.com/forum/ PLoB https://www.plob.org/ Y叔 https://guangchuangyu.gith...
  • 生信入门一个月,感谢生信技能树平台。 Homework Response to: 重复一篇WGCNA分析的文章。WGCNA学习教程:一文学会WGCNA分析。 复现的文献:A novel microglial subset plays a key role in myelinogenesis in ...
  • Linux CommandsF-I

    2018-10-19 23:58:59
    这些与之前发的一起,是linux的一些常用命令,是生信技能树论坛创始人jimmy师兄整理的,按照字幕顺利从A-Z,很有用。 Command Description factor Display prime factors of specified integer numbers. false ...
  • RNA-seq + 下游分析:一条龙代码

    千次阅读 2020-04-29 22:11:13
    这段时间太多事,生信学习耽误了很长一段时间,这几天终于撸完了生信技能树B站的RNA-seq视频。本人黑眼圈纯粹是熬夜写生信代码所致,无任何不良嗜好,请大家放心交友。 将一台老电脑改装成了win+linux双系统,取了1...
  • SQL基础教程笔记

    2018-07-18 23:58:00
    首先非常感谢生信技能树的赠书活动送了我这么棒的一本书~ 活动链接: 【好书分享】数据库必知必会 https://mp.weixin.qq.com/s?src=11&timestamp=1531923110&ver=1006&signature=zKUTJuOiAQYBSCYL8...
  • 生信技能树的转录组学习开班了, 第一个任务是安装软件, 于是我花了一个下午时间和Linux斗智斗勇。 系统准备 windows10: Unbuntu on windows10 微软的良心 软件准备 我的习惯: 家目录下创建src文件夹,用于...
  • 转载生信技能树https://mp.weixin.qq.com/s/JB_329LCWqo5dY6MLawfEA TCGA数据源 - R包RTCGA的简单介绍 - 首先安装及加载包 - 指定任意基因从任意癌症里面获取芯片表达数据 - 绘制指定基因...

空空如也

空空如也

1 2 3 4
收藏数 63
精华内容 25
关键字:

生信技能树