精华内容
下载资源
问答
  • PYTHON生物信息学数据管理_卢宏超译_2017年基本信息书名:Python生物信息学数据管理定价:69元作者:(意)AllegraVia (阿莱格拉 维亚)等著,卢宏超 等译出版社:电子工业出版社出版日期:2017-01-01ISBN:...

    PYTHON生物信息学数据管理_卢宏超译_2017年基本信息书名:Python生物信息学数据管理定价:69元作者:(意)Allegra

    Via (阿莱格拉 维亚)

    等著,卢宏超 等译出版社:电子工业出版社出版日期:2017-01-01ISBN:9787121303821页码:318版次:1编辑推荐--------------------------------------------------------------------------------生命科学学院的Python课程教材,适合本科教学或行业人士的Python短期培训。内容提要--------------------------------------------------------------------------------本书实例意在解决生物学问题,通过“编程技法”的形式,涵盖尽可能多的组织、分析、表现结果的策略。在每章结尾都会有为生物研究者设计的编程题目,适合教学和自学。本书由六部分组成:Python语言基本介绍,语言所有成分介绍,高级编程,数据可视化,生物信息通用包Biopython,*后给出20个"编程秘笈”,范围涵盖了从二级结构预测、多序列比对到蛋白质三维结构的广泛话题。此外,本书附录还包括了大量的生物信息常用资源的信息。目录--------------------------------------------------------------------------------部分入门第1章Python

    shell1.1本章知识点1.2案例:

    计算ATP水解的ΔG1.2.1问题描述1.2.2Python会话示例1.3命令的含义1.3.1如何在电脑上运行这个例子1.3.2变量1.3.3导入模块1.3.4计算1.4示例1.5自测题第2章个Python程序2.1本章知识点2.2案例:

    如何计算胰岛素序列中的氨基酸频率2.2.1问题描述2.2.2Python会话示例2.3命令的含义2.3.1如何执行程序2.3.2程序如何工作2.3.3注释2.3.4字符串变量2.3.5用for进行循环2.3.6缩进2.3.7打印至屏幕2.4示例2.5自测题部分小结第二部分数

    据 管 理第3章分析数据列3.1本章知识点3.2案例:

    树突长度3.2.1问题描述3.2.2Python会话示例3.3命令的含义3.3.1读取文本文件3.3.2写入文本文件3.3.3将数据收入列表3.3.4将文本转换为数字3.3.5将数字转换为文本3.3.6将数据列写入文本文件3.3.7计算数值列表3.4示例3.5自测题第4章解析数据记录4.1本章知识点4.2案例:

    整合质谱数据,

    转化到代谢通路中4.2.1问题描述4.2.2Python会话示例4.3命令的含义4.3.1if/elif/else语句4.3.2列表数据结构4.3.3简洁列表创建方式4.4示例4.5自测题第5章搜索数据5.1本章知识点5.2案例:

    将RNA序列翻译为相应的蛋白质序列5.2.1问题描述5.2.2Python会话示例5.3命令的含义5.3.1字典5.3.2while语句5.3.3用while循环搜索5.3.4字典搜索5.3.5列表搜索5.4示例5.5自测题第6章过滤数据6.1本章知识点6.2案例:

    使用RNAseq输出数据6.2.1问题描述6.2.2Python会话示例6.3命令的含义6.3.1用简单的for...if组合过滤6.3.2合并两个数据集6.3.3两组数据之间的差异6.3.4从列表、

    字典和文件中删除元素6.3.5保持或不保持顺序地删除重复6.3.6集合6.4示例6.5自测题第7章管理表数据7.1本章知识点7.2案例:

    确定蛋白浓度7.2.1问题描述7.2.2Python会话示例7.3命令的含义7.3.1二维表的表示方法7.3.2访问行和单元格7.3.3插入和删除行7.3.4访问列7.3.5插入和删除列7.4示例7.5自测题第8章数据排序8.1本章知识点8.2案例:

    数据表排序8.2.1问题描述8.2.2Python会话示例8.3命令的含义8.3.1Python列表有利于排序8.3.2内置函数sorted()8.3.3用itemgetter排序8.3.4按升序/降序排序8.3.5数据结构(元组、

    字典)排序8.3.6按长度对字符串排序8.4示例8.5自测题第9章模式匹配和文本挖掘9.1本章知识点9.2案例:

    在蛋白质序列中搜索磷酸化模体9.2.1问题描述9.2.2Python会话示例9.3命令的含义9.3.1编译正则表达式9.3.2模式匹配9.3.3分组9.3.4修改字符串9.4示例9.5自测题第二部分小结第三部分模块化编程第10章将程序划分为函数10.1本章知识点10.2案例:

    处理三维坐标文件10.2.1问题描述10.2.2Python会话示例10.3命令的含义10.3.1如何定义和调用函数10.3.2函数参数10.3.3struct模块10.4示例10.5自测题第11章用类化繁为简11.1本章知识点11.2案例:

    孟德尔遗传11.2.1问题描述11.2.2Python会话示例11.3命令的含义11.3.1用类创建实例11.3.2类以属性的形式包含数据11.3.3类包含的方法11.3.4__repr__方法可打印类和实例11.3.5使用类有助于把握复杂程序11.4示例11.5自测题第12章调试12.1本章知识点12.2案例:

    程序无法运行时应该怎样处理12.2.1问题描述12.2.2Python会话示例12.3命令的含义12.3.1语法错误12.3.2运行时错误12.3.3处理异常情况12.3.4未报告出错信息12.4示例12.5自测题第13章使用外部模块:

    R语言的Python调用接口13.1本章知识点13.2案例: 从文件中读取数据,

    并通过Python使用R计算其平均值13.2.1问题描述13.2.2Python会话示例13.3命令的含义13.3.1rpy2和r实例的robjects对象13.3.2从Python中读取R对象13.3.3创建向量13.3.4创建矩阵13.3.5将Python对象转换成R对象13.3.6如何处理包含点的函数参数13.4示例13.5自测题第14章构建程序流程14.1本章知识点14.2案例:

    构建NGS流程14.2.1问题描述14.2.2Python会话示例14.3命令的含义14.3.1如何使用TopHat和Cufflinks14.3.2什么是程序流程14.3.3在程序中交换文件名和数据14.3.4编写程序包装器14.3.5关闭文件时的延迟14.3.6使用命令行参数14.3.7测试模块:

    if__name__=='__main__'14.3.8处理文件和路径14.4示例14.5自测题第15章编写良好的程序15.1本章知识点15.2问题描述:

    不确定性15.2.1程序编写存在不确定性15.2.2程序项目实例15.3软件工程15.3.1将编程项目分成小任务15.3.2将程序分为函数和类15.3.3编写格式良好的代码15.3.4使用存储库控制程序版本15.3.5如何将自己的程序分发给其他人15.3.6软件开发的周期15.4示例15.5自测题第三部分小结第四部分数据可视化第16章创建科学图表16.1本章知识点16.2案例:

    核糖体的核苷酸频率16.2.1问题描述16.2.2Python会话示例16.3命令的含义16.3.1matplotlib库16.3.2绘制竖的柱状图16.3.3为x轴和y轴添加标注16.3.4添加刻度16.3.5添加一个图例框16.3.6添加图的标题16.3.7设置图表的边界16.3.8以低分辨率和高分辨率导出一个图像文件16.4示例16.5自测题第17章使用PyMOL创建分子图像17.1本章知识点17.2示例:

    锌指17.2.1什么是PyMOL17.2.2PyMOL会话示例17.3用七个步骤来创建高分辨率的图像17.3.1创建一个PyMOL脚本文件17.3.2加载和保存分子17.3.3选取分子的局部17.3.4为每个选取选择展现形式17.3.5设置颜色17.3.6设置摄影位置17.3.7导出高分辨率图像17.4示例17.5自测题第18章处理图像18.1本章知识点18.2案例:

    画一个质粒18.2.1问题描述18.2.2Python会话示例18.3命令的含义18.3.1创建一个图像18.3.2读和写图像18.3.3坐标18.3.4绘制几何形状18.3.5旋转图像18.3.6添加文本标记18.3.7颜色18.3.8辅助变量18.4示例18.5自测题第四部分小结第五部分Biopython第19章使用序列数据19.1本章知识点19.2案例:

    如何将一条DNA编码序列翻译成对应的蛋白质序列,

    并把它写入FASTA文件19.2.1问题描述19.2.2Python会话示例19.3命令的含义19.3.1Seq对象19.3.2把序列当成字符串工作19.3.3MutableSeq对象19.3.4SeqRecord对象19.3.5SeqIO模块19.4示例19.5自测题第20章从网络资源中检索数据20.1本章知识点20.2案例:

    在PubMed中用关键词搜索文献,

    下载并解析对应的记录20.2.1问题描述20.2.2Python会话示例20.3命令的含义20.3.1Entrez模块20.3.2Medline模块20.4示例20.5自测题第21章使用三维结构数据21.1本章知识点21.2案例:

    从PDB文件中提取原子名及其三维坐标21.2.1问题描述21.2.2Python会话示例21.3命令的含义21.3.1Bio.PDB模块21.3.2SMCRA结构层次21.4示例21.5自测题第五部分小结第六部分编

    程 秘 笈编程秘笈1: PyCogent库编程秘笈2:

    反向互补和化序列编程秘笈3: 用概率创建序列编程秘笈4:

    用Biopython解析多序列联配编程秘笈5:

    从多序列联配中计算共有序列编程秘笈6: 计算系统发生树的节点间的距离编程秘笈7:

    核苷酸序列的密码子频率编程秘笈8:

    解析Vienna格式的RNA二级结构编程秘笈9:

    解析BLAST的XML输出编程秘笈10: 解析SBML文件编程秘笈11:

    运行BLAST编程秘笈12: 访问、 下载和读取网页编程秘笈13:

    解析HTML文件编程秘笈14: 将PDB文件分割成PDB链文件编程秘笈15:

    在PDB结构上找到两个靠近的Cα原子编程秘笈16:

    提取两个PDB链间的界面编程秘笈17:

    用Modeller建立同源模型编程秘笈18:

    用ModeRNA分析RNA三维同源模型编程秘笈19:

    从三级结构计算RNA碱基配对编程秘笈20: 结构重叠的真实实例:

    丝氨酸蛋白酶催化三分子附录附录A命令概览附录BPython资源附录C记录样板附录D处理目录和用UNIX编程

    展开全文
  • Python生物信息学⑥绘制热图及火山图 Python生物信息学③提取差异基因 通过上Python生物信息学③提取差异基因得到了该数据集的差异分析的两个关键参数,1.差异倍数(foldchange)以及2.差异的P值。本篇目的是得到...

    Python生物信息学⑥绘制热图及火山图

    Python生物信息学③提取差异基因

    通过上Python生物信息学③提取差异基因得到了该数据集的差异分析的两个关键参数,1.差异倍数(foldchange)以及2.差异的P值。本篇目的是得到满足差异倍数和差异P值的基因,同时进行可视化(包括差异分析常见的火山图和热图)。


    绘制火山图

    (1)第一步制作差异分析结果数据框

    genearray = np.asarray(pvalue)
    
    result = pd.DataFrame({'pvalue':genearray,'FoldChange':fold})
    
    result['log(pvalue)'] = -np.log10(result['pvalue'])

    (2)第二步制作火山图的准备工作

    选定的差异基因标准是 I.差异倍数的绝对值大于1,II. 差异分析的P值小于0.05

    result['sig'] = 'normal'
    
    result['size']  =np.abs(result['FoldChange'])/10
     
    result.loc[(result.FoldChange> 1 )&(result.pvalue < 0.05),'sig'] = 'up'
    result.loc[(result.FoldChange< -1 )&(result.pvalue < 0.05),'sig'] = 'down'
    ax = sns.scatterplot(x="FoldChange", y="log(pvalue)",
                          hue='sig',
                          hue_order = ('down','normal','up'),
                          palette=("#377EB8","grey","#E41A1C"),
                          data=result)
    ax.set_ylabel('-log(pvalue)',fontweight='bold')
    ax.set_xlabel('FoldChange',fontweight='bold')

    筛选差异基因

    fold_cutoff = 1
    pvalue_cutoff = 0.05
    
    filtered_ids = []
    for i in range(0, number_of_genes):
        if (abs(fold[i]) >= fold_cutoff) and (pvalue[i] <= pvalue_cutoff):
            filtered_ids.append(i)
            
    filtered = data2.iloc[filtered_ids,:]
    print("Number of DE genes: ")
    print(len(filtered.index))

    绘制热图

    热图(heatmap)是生物学文章里(尤其是RNA-seq相关论文)经常出现的图片。热图的用途一般有两个。以RNA-seq为例,热图可以:1)直观呈现多样本多个基因的全局表达量变化;2)呈现多样本或多基因表达量的聚类关系。热图一般使用颜色(例如红绿的深浅)来展示多个样本多个基因的表达量高低,既直观又美观。同时可以对样本聚类或者对基因聚类。

    sns.clustermap(filtered, cmap='RdYlGn_r', standard_scale = 0)

    (1)每一行为一个基因,每一列为一个sample。 (2)绿色代表相对低表达,红色代表相对高表达。 (3)相对接近的样本或者基因会聚类在一起,比如探针名为101695_at的基因在GSM130370相对高表达,而在GSM130366低表达。

    参考:

    https://www.jianshu.com/p/3d810f41e76d


    DrugAI
    展开全文
  • Python生物信息学数据管理》这是我两三年前学习过的一本书,我觉得这本书挺好,把生物学的问题直接在python学习中解决了,推荐给大家,之前还整理了习题代码,分享一下。之前分享在了github上,收获了10颗星,惭愧...

    《Python生物信息学数据管理》

    这是我两三年前学习过的一本书,我觉得这本书挺好,把生物学的问题直接在python学习中解决了,推荐给大家,之前还整理了习题代码,分享一下。之前分享在了github上,收获了10颗星,惭愧,已经是我最多星的一个。还有一两个习题记得没有解答出来,如果你解答出来了,欢迎交流!代码有的肯定不是最优的,只是一种解答方法,可能有错误,也欢迎指正,谢谢!我坚信分享使我们快乐,加油!我是用python3完成的,当然二者区别也很小(目前我基本只认识到了print函数的区别),除非遇上那种多年不遇的bug。

    https://github.com/zd200572/Managing_Your_Biological_Data_with_Python

    我的经验是,想要入门一门编程语言真的要翻上好几本书才够,因为一本书的风格并不一定符合你的喜好和水平,可能读完了没有产生共鸣,提升不大。而且,只有把知识反复看,相当于复习才能初步掌握嘛。虽然不必要每本书都买回来,图书馆借来读下也是极好的。总有一本书会是你豁然开朗的寻一本,就拿我的R语言学习来说吧,买来的《R语言实战》和之前的实战书系列读得不明不白,中间间隔时间又有点长,反而是讲量化投资的那本R语言书让我有点茅塞顿开的感觉。这里要说下技能树赠送的《生物信息学讲义》,R语言的知识点讲的清晰明了,再次加深了这种感觉。虽然对于R语言还是在门口徘徊,但坚定了继续翻几本书将入门进行到底的决心。之前我还推荐过一本R的达人迷系列,书也不错。

    再有就是从项目中学习,可以实现一个自己特别需要的小功能,在学习阶段可以重复造个小轮子,比如实现excel公式可以实现的小功能,列拆分这种。Happy Coding!

    展开全文
  • 本书由六部分组成:Python语言基本介绍,语言所有成分介绍,高级编程,数据可视化,生物信息通用包Biopython,最后给出20个"编程秘笈”,范围涵盖了从二级结构预测、多序列比对到蛋白质三维结构的广泛话题。...

    内容简介

    本书实例意在解决生物学问题,通过"编程技法”的形式,涵盖尽可能多的组织、分析、表现结果的策略。在每章结尾都会有为生物研究者设计的编程题目,适合教学和自学。本书由六部分组成:Python语言基本介绍,语言所有成分介绍,高级编程,数据可视化,生物信息通用包Biopython,最后给出20个"编程秘笈”,范围涵盖了从二级结构预测、多序列比对到蛋白质三维结构的广泛话题。此外,本书附录还包括了大量的生物信息常用资源的信息。

    教材特色

    该书是面向生物学读者的编程好书之一。随着高通量技术(例如DNA微阵列或DNA/RNA测序)的改进,生物数据量正在迅速增长。管理和分析生物数据的需求越来越多,编程技术的应用将成为标准做法。Python由于其功能强大,语言优雅简单,成为提高编程技能的优秀工具!本书以Python数据管理为核心,主题广泛,结构合理,各章相互依赖程度低,便于读者自定学习的切入点。

    作者清晰地诠释了Python在数据管理(解析数据记录、过滤和排序数据)与数据可视化(使用Python接口R)中的应用。本书还提供了模块化编程的描述,引导读者编写简单的函数,通过编写类而构建程序流程……一切都按照Python编码标准和易于提高的方式进行。

    对于面临计算挑战的生物学家和从业者,本书既适合Python入门学习,又可助力中级Python用户学习一些新的技巧,进而在自己的代码中实现。书中实例意在解决生物学问题,通过“编程技法”的形式,涵盖尽可能多的组织、分析、表现结果的策略。在每章结尾都会有为生物研究者设计的编程题目,适合教学和自学。本书由六部分组成:Python语言基本介绍,语言所有成分介绍,高级编程,数据可视化,生物信息通用包Biopython,以及最后给出的20个“编程秘笈”。“编程秘笈”的范围涵盖了从二级结构预测、多序列比对到蛋白质三维结构的广泛话题。此外,本书附录还包括了大量的生物信息常用资源的信息和简单的UNIX教程。

    前言

    在几年前, 编程只是计算科学工作者的特权。虽然如此, 编程正加速变成生物等其他领域专家的一种需要。作为一个生物学研究者, 不需要对成为一个编程专家感兴趣, 但是需要把编程作为多个工具中的一种来继续科学工作。可能读者已经意识到编程技巧可以大幅地加速管理和分析数据。可能读者需要处理大规模的数据, 多次重复某种相同的分析, 或者从一个非通用格式的文件中解析数据。可以确信的是, 在所有这些情形下, 编程可以帮助你。然而, 因为读者从来没有对“枯燥无味”和“概念艰深”的计算机科学学科有很大兴趣, 就可能会感到不习惯。如果是这样的情况, 这本书是适合你的。

    本书是为那些需要更多地掌控数据, 因此需要学习一些编程的生命科学工作者而写的。目标是使得那些以前没有编程经验的生物科学工作者能够自己用Python对生物数据进行分析。

    在前言中, 包括全书内容的概述及编程介绍, 最后是对Python编程语言的概览。

    我们希望这本编程书是为生物学工作者的读者量身定制的, 能帮助分析读者的数据, 从而尽早有所收获。

    译者序

    随着生命科学科研领域的需要和测序技术的发展,生物信息这个交叉学科近年来愈来愈兴旺起来,从业者也越来越多。与传统的理论和实验学科不同,生物信息是一门数据科学,这就需要从业者具备一定数据收集、管理、处理和分析的能力。在海量的组学数据面前,使用别人开发的软件及图形界面操作往往不能解决工作中的问题,而简单的编程就可能解决问题,因而编程即成为一个生物信息工作者的必备技能。这本书就是为生物信息初学者设计的编程教程。

    我从事生物信息工作以来,编程语言开始一直以PERL和C为主,从2007年开始使用Python,初时也因为块缩进的问题不习惯,但很快被其可读性和开放性所吸引,喜欢上了这门语言,并作为最主要的脚本语言使用至今。回国后,发现国内大部分的生物信息工作者还是以PERL作为主要的工作语言,就想为Python在这个领域的推广做些工作,有幸得到出版社马岚老师的推荐,见到本书,就与陈一情,李少娟合作进行了翻译。

    正如书中所说,编程就像写菜谱做饭或者是按流程做生物实验一样,不是一件很难的事情。对于有过逻辑训练的生物研究者只要能熟悉了编程的思想,掌握这项技能是容易的。但是如何选择一个切门点和提高途径,真正把它运用到自己的工作中就是另外一件事情,为什么推荐这本Python书作为生物信息数据管理编程的入门书呢?

    Python语言提供了从入门到高手的良好的学习曲线。Python语言是至今为止最接近自然语言的编程语言,学过其它一些编程语言的学员甚至不需要太多的训练就能读写其代码;模块化和面向对象的支持使得学员能不费力地从一个只能写几行代码的操作员变成一个管理千行代码的程序员,同时书写良好可读性代码的编程习惯也会令其受益终生;丰富的标准库和第三方包使得Python语言成为当前最好的“胶水语言”,把多方资源整合到一起来解决工作中的问题。

    本书的风格非常适合对编程的初学者。它从生物数据管理分析实践出发,由浅入深地介绍编程的基础知识,特别是对错误处理和程序调试等初学者常见的问题做了精辟的阐述;本书在内容上对生物信息中的经常遇到的数据整理和做图分析有较重的篇幅,还包含了大量的Python第三方工具库接口充分地体现了Python开放性“胶水语言”的特点。该书采用章节的篇幅都不长,每每切中要点,便于读者围绕主题、消化概念,且后面的练习难度适中,所以很适合作为本科生或是研究生低年级的教材;书后的编程秘诀对于进入科研实践的研究者也有颇多的参考价值。

    非常感谢我的博士导师陈润生院士能在百忙中为本书作序。感谢陈一情和李绍娟以及所有参与工作的同学,陈一情翻译本书的第一到十五章,李绍娟翻译了第十六到十八章,我翻译了其它的部分并校正了本书的译稿。感谢李大伟博士对蛋白质结构翻译部分的意见。非常荣幸能得到出版社马岚老师的支持,才得以出版此书。

    希望这本书能对有志于生物信息的同道有所帮助。

    目录

    第一部分入门第1章Python shell

    第2章第一个Python程序

    第二部分数 据 管 理第3章分析数据列

    第4章解析数据记录

    第5章搜索数据

    第6章过滤数据

    第7章管理表数据

    第8章数据排序

    第9章模式匹配和文本挖掘

    第三部分 模块化编程第10章 将程序划分为函数

    第11章用类化繁为简

    第12章调试

    第13章使用外部模块: R语言的Python调用接口

    第14章构建程序流程

    第15章编写良好的程序

    第四部分数据可视化第16章创建科学图表

    第17章使用PyMOL创建分子图像

    第18章处理图像

    第五部分Biopython第19章使用序列数据

    第20章从网络资源中检索数据

    第21章使用三维结构数据

    第六部分编 程 秘 笈编程秘笈1: PyCogent库编程秘笈2: 反向互补和随机化序列

    编程秘笈3: 用概率创建随机序列

    编程秘笈4: 用Biopython解析多序列联配

    编程秘笈5: 从多序列联配中计算共有序列

    编程秘笈6: 计算系统发生树的节点间的距离

    编程秘笈7: 核苷酸序列的密码子频率

    编程秘笈8: 解析Vienna格式的RNA二级结构

    编程秘笈9: 解析BLAST的XML输出

    编程秘笈10: 解析SBML文件

    编程秘笈11: 运行BLAST

    编程秘笈12: 访问、 下载和读取网页

    编程秘笈13: 解析HTML文件

    编程秘笈14: 将PDB文件分割成PDB链文件

    编程秘笈15: 在PDB结构上找到两个最靠近的Cα原子

    编程秘笈16: 提取两个PDB链间的界面

    编程秘笈17: 用Modeller建立同源模型

    编程秘笈18: 用ModeRNA分析RNA三维同源模型

    编程秘笈19: 从三级结构计算RNA碱基配对

    编程秘笈20: 结构重叠的真实实例: 丝氨酸蛋白酶催化三分子

    附录附录A命令概览附录BPython资源

    附录C记录样板

    附录D处理目录和用UNIX编程

    丛书名:生命科学与信息技术丛书

    著 者:(意)Allegra Via (阿莱格拉 维亚) 等

    作 译 者:卢宏超等

    策划编辑:马岚

    出版时间:2017-01

    版 次:01-01

    I S B N :9787121303821

    定价:¥69.00

    展开全文
  • else: no_in.append(i) 三、在蛋白质序列中搜索磷酸化模体 蛋白质磷酸化:指由蛋白质激酶催化的把ATP的磷酸基转移到底物蛋白质氨基酸残基(丝氨酸、苏氨酸、酪氨酸)上的过程,或者在信号作用下结合GTP,是生物体内一...
  • pythonnnnn生物信息
  • 示例数据 ACGATACAA 0.129 0.287 0.423 0.476 0.641 0.742 0.783 示例结果 -5.737 -5.217 -5.263 -5.360 -5.958 -6.628 -7.009 Python 实现 本题思路参考自下述博客: Rosalind – Introduction to Random Strings...
  • 编辑推荐适读人群 :本书除可以作为高等院校生物信息、生物系的高年级学生和研究生的编程教材之外,对于从其他学科如数学、物理、计算机等转到生物信息领域工作的广大科研人员和高校学生也可起到参考作用。...
  • #第二部分#文件neuron_data.txt16.38139.90441.4629.0340.93202.70142.30346.00300.00>>> data=[]>>> for line in open('neuron_data.txt'):#for循环逐行读取文件... length=float(line.strip())#...
  • 目录Python从零开始第五章生物信息学③kegg查询==================================================正文导入必须的python包from bioservices.kegg import KEGGs = KEGG()KEGG拥有许多数据库。 该列表可以在属性...
  • 在海量的组数据面前,使用别人开发的软件及图形界面操作往往不能解决工作中的问题,而简单的编程就可能解决问题,因而编程即成为一个生物信息工作者的必备技能。这本书就是为生物信息初学者设计的编程...
  • 导语内容提要Allegra Via、Kristian Rother、Anna Tramontano著,卢宏超、陈一情、李绍娟译的《Python生物信息学数据管理/生命科学与信息技术丛书》实例意在解决生物学问题,通过“编程技法”的形式,涵盖尽可能多的...
  • Python生物信息学③提取差异基因

    千次阅读 2019-03-28 20:49:07
    python做生信分析的流程 使用的数据集是GSE5583,来自于2006年的基因芯片结果,该芯片目的是提取野生型和HDAC1小鼠胚胎干细胞用于Affymetrix微阵列上的差异RNA。 #导入包 import matplotlib.pyplot as plt import...
  • Python实现DNA转录RNA with open("rosalind_rna.txt") as f: dna_fragment = f.read().rsplit() rna_fragment = ''.join("U" if x=="T" else x for x in dna_fragment[0]) rna_fragment
  • 以前上课的C/C++/Java/C#/汇编 。自学的perl/python/matlab/...现在的老板用python,我就开始学python了。其实觉得bioinformatics的本科都会教c或者java,会了c/java其中任何一个,再perl或者python或者matlab就...
  • 1, Biopython: Python tools for computational biology [10.1145/360262.360268]2, xBASE, a collection of online databases for bacterial comparative genomics [16381881]3, The Pfam protein families databas...
  • #2.2.2python会话示例 # insulin [Homo sapiensl GI:386828 # axtracted 51 amino acids of A+B chain insulin = 'GlVEQCCTSICSLYQLENYCNFVNQHLCGSHLVEALYLVCGERGFFYTPKT' for amino_acid in "ACDEF...
  • 环境 OS version : Win10 x64 python_version : Python 3.6.5 实例代码 aa_codes = { 'ALA':'A', 'CYS':'C', 'ASP':'D', 'GLU':'E', 'PHE':'F', 'GLY':'G', 'HIS':'H', 'LYS':'K', 'ILE':'I', '...
  • 环境 OS version : Win10 x64 python_version : Python 3.6.5 实例代码 codon_table = { 'GCU':'A', 'GCC':'A', 'GCA':'A', 'GCG':'A', 'CGU':'R', 'CGC':'R', 'CGA':'R', 'CGG':'R', 'AGA':'R', '...
  • 3.1 读取和写入文件 将文件读取并存为副本 file_r = open('ml.txt', 'r') file_w = open('ml副本.txt', 'w') txt = file_r.read() file_w.write(txt) file_r.close() file_w.close() ...3.2 计算文件中平均值和标准差...
  • 9月13日 Python生物信息学数据管理

    千次阅读 2017-09-13 20:18:48
    第一二章笔记: 1,编程大致概括为5点:组织数据、使用其他程序、计算、...3,python通常一行写一个指令,跨越几行时加上反斜杠‘/,带三引号的字符串可以跨越多行。 4,索引,‘protein'[0]提取第一个字符。 5,切
  • 9月14日 Python生物信息学数据管理

    千次阅读 2017-09-14 20:30:35
    第三章笔记  1,read()与readlines()的区别: new_file = open('DNA.txt') lines = new_file.read() data = [] for nucleotide in lines: data.append(nucleotide) print(data) new_file = open('DNA.txt') ...
  • 第六章笔记 1,列表中删除元素: pop()函数会返回删除的该元素的值,默认删除最后一个元素,想删除指定位置,则在括号内加入数字,例如:data.pop(5)。 内置函数del data[i] 也可以 想删除定值用remove方法,...
  • 第四章,基本没怎么看得懂..... 1.line.strip()表示去掉字符串前后的空格和换行符。 2,list:len()函数可以获得列表元素个数;索引是从0开始;负数表示倒过来索引。list.append()表从末尾添加元素。...
  • 9月28号Python生物信息学数据管理

    千次阅读 2017-09-28 15:23:58
    codon_aa = {'UAA' : 'stop','UAG' : 'stop','UGA' : 'STOP','AUG' : 'Start','GGG' : 'Glycin'} print(codon_aa['UAA'] 第五章笔记 1,range(start, stop[, step]),不包括stop。 2,字典的形式{键:值},键为不可...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 560
精华内容 224
关键字:

python生物信息学

python 订阅