精华内容
下载资源
问答
  • 用于组学数据和临床数据统计分析和可视化的交互式工具 USER MANUAL FOR IOAT  第1章软件概述该系统是基于机器学习的数据分析工具。 在使用生物信息学的多组学数据中,可以通过相关的机器学习方法将多组学数据的...
  • 临床试验的统计分析有其特殊性,统计分析计划应当由具有参与临床试验经验的统计学专业人员起草,并与主要研究者商定后完成,要求全面而详细地陈述临床试验数据的分析方法和表达方式,以及对统计分析结果的解释。统计...

    临床试验的统计分析有其特殊性,统计分析计划应当由具有参与临床试验经验的统计学专业人员起草,并与主要研究者商定后完成,要求全面而详细地陈述临床试验数据的分析方法和表达方式,以及对统计分析结果的解释。

    统计分析计划包括的基本内容:

    (1)试验概述;

    (2)统计分析;

    (3)统计分析图表模板。

    试验概述

    研究方案中与统计学相关的部分,常可直接摘录自方案。试验概况一般包括以下主要内容:

    (1)研究目的:临床试验的主要目的和次要目的。

    (2)设计类型:如平行组设计、交叉设计、析因设计、成组序贯设计等。

    (3)对照的类型:如安慰剂对照、阳性对照、剂量组对照等,若采用无对照试验设计,需说明理由。

    (4)随机化方法及其实施:明确随机化方法,如区组随机、分层随机及其分层因素、中央随机化及其所控制的基线因素等。

    (5)盲法及设盲措施:说明盲法是单盲还是双盲,设盲措施是双盲单模拟、双盲双模拟等,以及保持盲态下执行统计分析的措施。

    (6)主要评价指标和次要评价指标的定义:清晰描述主要指标和次要指标的定义,包括具体观察和测量的方法、观察时点、指标属性。如果主要指标需要计算得到,则需给出相应的计算公式。明确主要指标数据缺失的填补方法及理由。

    (7)比较类型及检验假设:明确临床试验的比较类型,如优效性检验、非劣效性/等效性检验及其界值等。明确写出主要指标进行统计学检验的原假设和备择假设、Ⅰ类错误率、Ⅱ类错误率等。

    (8)样本量:摘录方案中的计划入组的受试者数量及其计算依据。

    (9)分析数据集的定义:一般情况下,临床试验的分析数据集包括全分析集(full analysis set,FAS)、符合方案集(per protocol set,PPS)和安全性数据集(safety set,SS),或其他的数据集(如抗感染试验中细菌学检査的数据集)等。根据不同研究目的,在统计分析计划中需明确描述数据集的定义。

    在定义分析数据集时,需遵循两个原则:

    ①尽可能地减小偏倚;

    ②防止Ⅰ类错误的增加。明确不同数据集在有效性和安全性评价中的地位。对主要指标缺失值的填补方法需要明确说明。当涉及亚组分析时,需要对亚组给出明确定义。

    (10)协变量:主要指标分析模型中是否需要纳入协变量,纳人协变量的理由需要事先明确说明。

    (11)依从性分析:包括研究时间、药物暴露时间、药物使用量以及方案偏离发生率的组间比较。试验期间的未禁止使用的合并用药、合并治疗的分析方法应明确。

    (12)敏感性分析:对于非事先规定的缺失数据的填补、亚组分析、不同数据集分析、不同协变量的调整等,可进行敏感性分析,考察对试验结果的影响。将所分析的结果作为参考,与事先确定分析的结果进行比较,分析所得结论的一致性,考察结果的稳定性。敏感性分析可以作为主要分析的附加支持,但不能作为结论的主要依据。

    统计分析

    统计分析计划中,应当说明统计分析所用的方法、检验假设及检验水准,所用统计软件及其版本信息等内容。临床试验的统计分析应当采用国内外公认的、可靠的统计分析软件。

    (1)统计分析方法

    临床试验数据分析应采用国内外公认的统计分析方法,应根据研究目的、试验方案和不同指标明确所选择的统计分析方法。

    ①描述性统计分析

    一般多用于病例筛选情况、人口学资料、受试者分布、基线资料、依从性和安全性资料,包括对主要指标和次要指标的统计描述。

    ②参数估计和假设检验

    参数估计和假设检验是对主要指标及次要指标进行评价的必不可少的手段。统计分析计划中,应当说明要检验的假设和待估计的处理效应、以及相应的统计分析方法和/或统计模型。处理效应的估计应同时给出置信区间,并说明估计方法。假设检验应说明所采用的是单侧还是双侧检验

    ③协变量分析

    对主要指标进行分析时,若需考虑某些协变量的影响,如受试者的基线情况、分层因素、中心效应等,应在统计分析计划中明确哪些因素作为协变量,明确相应的统计模型。

    对于多中心临床试验,在分析主要指标时,通常要考虑中心效应,需描述各中心不同组别的疗效。此外,还需检验中心与处理组别的交互作用,用于分析中心间处理效应的异质性。如果不存在中心与组别的交互作用,可认为各中心的处理效应同质,估计处理效应的统计模型中不应包含中心与组别的交互作用项;反之,则说明各中心处理效应异质,应进行相应的敏感性分析,遵从保守的原则解释效应异质性对试验的统计学结论的影响。

    ④安全性分析

    安全性指标的分析方法需在统计分析计划中指明。

    安全性评价常用统计指标包括各种不良事件发生率、不良反应发生率、重要不良事件发生率、严重不良事件发生率,以及实验室检査指标由基线时的正常变为随访时的异常率。

    在大多数试验中,对安全性指标的分析常采用描述性统计分析方法,所有的不良事件均需列出。当样本量足够时,可用;检验、Fisher精确概率法、Poisson模型等方法进行组间比较,必要时辅以置信区间。

    ⑤缺失数据和离群值的处理

    缺失数据是临床试验中偏倚的潜在来源之一。在统计分析计划中需要事先说明对缺失数据的处理方法。目前对缺失数据的处理没有统一的标准,一般需要考虑所采用的缺失数据处理方法对统计分析结果的影响,并进行敏感性分析。如果在方案中没有事先说明对缺失数据的处理方法,则需要同时对未填补和填补后数据进行分析,并比较两者的结果。

    离群值问题的处理,应当从医学和统计学专业两方面去判断,尤其应当从医学专业知识判断。探索离群值对结果的影响,需要注意的问题与缺失数据的处理类似。

    ⑥其他问题

    如果试验有衍生变量,需要在统计分析计划中对衍生变量的计算方法,所涉及的变量进行详细描述。

    (2)检验水准

    统计分析采用单侧检验还是双侧检验以及检验水准应当具体说明。传统差异性检验通常为双侧检验,α常不大于0.05;非劣效性试验或优效性试验通常为单侧检验,α常取0.025;等效性试验为双单侧检验(twoone-sidedtests),两次检验的α通常都统一取单侧0.025(也即双侧的0.05)。生物等效性试验的α取单侧0.05(即双侧的0.10)。

    (3)期中分析

    如果要进行期中分析,则需要在统计分析计划中对期中分析的事件数、信息时间、次数、α调整方法、具体的假设检验或参数估计方法、提前终止临床试验的标准等做出详细说明。

    (4)亚组分析

    如果临床试验需要进行亚组分析,需要在统计分析计划中详细定义亚组,并说明分析的指标、分析方法等,说明亚组分析结果与结论的关系。如果亚组分析的结果是试验的主要结论,则样本量估计时需要考虑亚组的样本量,以保证有足够的检验把握度。或数据盲态审核时,试验者发现受试者严重违背入选标准、未接受试验药物治疗等原因而停止对该受试者进行临床试验或剔除在分析集以外。

    (5)多重性问题

    如果临床试验涉及多重性问题,需要在统计分析计划中详细说明分析方法、检验水准的调整等。

    统计分析图表模板

    统计分析结果通常以统计分析表或图的形式呈现。统计分析表格应该以简明的格式、精炼的文字描述所有相关信息。在统计分析计划中,应该对统计分析结果呈现的相关'表格的内容、格式和布局进行设计,利用统计分析图表模板对统计分析报告中结果的形式轮廓进行描述。

    统计分析计划中的所有分析考虑都应清楚地标出分析所用数据集、分析的指标(包括单位)、访视时间、处理组别、分析方法等。为了便于阅读、更新和管理,在统计分析计^上注明版本、产生日期、页码和参考文献等。

    统计表格的设计应明确主谓,分清层次,简明扼要,统一格式,方便阅读。统计表格应避免过长、过大、过于拥挤。内容较多时,可拆分成几个表格。

    表格应按照指标重要性依次排列,将最重要的表格放在最前面。

    展开全文
  • 简介 临床医生或者研究人员往往在分类资料分析时统计具有某种属性的个体数,调查或科研中清点分类变量资料所得到的数据称之为绝对数。...根据不同的资料类型,选用不用的统计分析方法,如Pearson卡方检验,W

    简介

    临床医生或者研究人员往往在分类资料分析时统计具有某种属性的个体数,调查或科研中清点分类变量资料所得到的数据称之为绝对数。绝对数可以反映研究事物或现象的基本信息,但是不便于相互比较和寻找事物间的内在联系,因此,常常使用相对数(relative number)如率,构成比,相对比等来描述和比较这类资料。 分类变量分为无序分类和有序分类,无序分类包括二项分类和多项分类,如计数资料;有序分类指变量之间有程度的差别,且排列有序,如等级资料。根据不同的资料类型,选用不用的统计分析方法,如Pearson卡方检验,Wilcoxon秩和检验以及Fisher’s 确切概率法检验等。

    统计分析方法选择

    单样本资料与总体比
    1、二分类资料:1) 小样本时:用二项分布进行确切概率法检验。2) 大样本时:用U检验。
    2.多分类资料:用Pearson卡方检验。
    四格表资料
    1. n>40并且所以理论数大于5,则用Pearson 卡方。
    2. n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正卡方或用Fisher’s 确切概率法检验。
    3. n<< span="">40或存在理论数<1,则用Fisher’s 检验。
    2×C表资料的统计分析
    1.列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验。
    2.列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势卡方检验。
    3.行变量和列变量均为无序分类变量: 1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson 卡方。2)n<40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验。
    R×C表资料的统计分析
    1. 列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH 卡方或Kruskal Wallis的秩和检验。
    2. 列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH 卡方。
    3. 列变量和行变量均为有序多分类变量,可以作Spearman相关分析。
    4. 列变量和行变量均为无序多分类变量:1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson卡方。 2)n<40或理论数小于< span="">5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验。

    应用举例-Pearson’s Chi-squared test results

    Pearson’s Chi-squared test results

    参考文献:

    1. Joana C, et al. CYR61 and TAZ Upregulation and Focal Epithelial to Mesenchymal Transition May Be Early Predictors of Barrett’s Esophagus Malignant Progression[J]. PLoS One. 2016; 11(9): e0161967.
    展开全文
  • 为了解决睡眠节律研究中数据的快速导入、准确分析和详细统计的问题,提出了一种睡眠节律数据统计分析系统。该系统基于.NET开发平台,以Oracle为后台数据库,采用B/S结构模式,分为数据导入分析和查询统计两个模块...
  • 糖尿病临床试验 数据分析

    千次阅读 2018-05-06 15:51:00
    糖尿病临床试验 数据分析 糖尿病临床试验 数据分析 项目背景 胰岛素工作原理 临床试验及其指标 医疗数据 常见问题及原因 数据评估 目测评估 编程评估 后记 注脚 项目背景 糖尿病(尤其是2型糖尿病...

    糖尿病临床试验 数据分析

    一、项目背景

    糖尿病(尤其是2型糖尿病)算得上是21世纪最大的流行病,在我国更是情况堪忧[^footnote]。20世纪20年代之前,人们闻“糖”色变,因为无法治疗,患病就相当于慢性死亡。这种病会让血糖升高,伴随的症状有异常口渴、尿频、容易疲劳,严重的并发症有中风、失明、截肢、肾衰竭、甚至心肌梗塞。好在1920s,一种能降低血糖的胰腺分泌物 胰岛素(insulin)被 Frederick Banting 发现,他也因此获得1923年的诺贝尔医学和生理学奖。
    这里写图片描述

    1.1 胰岛素工作原理

    我们吃下去的食物大部分转化为葡萄糖(glucose),为身体提供能量。位于胃(stomach)附近的胰腺(pancreas),会产生一种叫做胰岛素(insulin)的激素(hormone),这种激素能促进葡萄糖被人体细胞吸收。如果一个得了糖尿病,就意味着无法分泌足够的胰岛素(insulin),或者胰岛素不能发挥正常功能,血糖便由此增多。
    这里写图片描述
    虽然胰岛素不能治愈糖尿病,但仍然是医学史上最大的重大发现之一,挽救了很多人的生命。不过当时胰岛素默认是针管注射的,一天要注射多次,现在依然如此;但这不方便也不舒服,如果能口服胰岛素就好了,比如制成药片或胶囊,随身携带多方便。

    所以,口服胰岛素[^footnote](oral insulin)一直以来都是活跃的研究领域。然而,最大的拦路石在于胰岛素本质上是一种蛋白质,无法通过厚厚的胃黏膜。

    1.2 临床试验及其指标

    在这个背景下,我们将接触一份 II 期临床试验数据,涉及一种新型口服胰岛素叫做 Auralin[^footnote]。Auralin 的研究员认为他们研发的胶囊能解决胃黏膜问题。

    II 期试验会对药品的功效和剂量反应进行测试,还会找出药品常见的短期副作用(也即不良反应),通常涉及数百位患者。
    这里写图片描述

    在该试验中,我们有350名患者,分为两组,进行双盲试验[^footnote]。其中175人服用 Auralin 进行治疗,另外一半人则用市面上流行的注射型胰岛素 Novodra 进行治疗。通过比较两种药物的关键指标(key metrics),可以判断 Auralin 是否有效。最重要的指标就是 HbA1c 水平。HbA1c 是血液中的一种物质(糖化血红蛋白),能够衡量过去几个月来人体血糖水平的控制情况,正常值为4%-6%。如果 Auralin 能够让 HbA1c 水平降到跟注射型胰岛素 Novodra 相似的程度,就能表明 Auralin 是有效的,能够提高患者的生活质量。(比如:能引起0.4%的下降就可以认为是成功的)

    数据集的几点说明:
    - Auralin 和 Novodra 都不是真的胰岛素产品,是模拟数据;
    - 为了合理性,数据集是在咨询专业医生的情况下建立的;
    - 由官方授意,密切模拟了真正的 新型吸入胰岛素 Afrezza 的临床试验;
    - 模拟了 医疗保健数据中的真实常见数据质量问题
    - 患者信息是使用 虚假姓名生成器 生成。

    这里写图片描述

    1.3 医疗数据 常见问题及原因

    医疗数据中经常存在问题:数据冗余、数据缺失、数据不准确等。在我们的临床试验数据也存在以上问题。(下面是造成脏数据的原因截图,完整档案见此

    这里写图片描述

    二、数据评估(Assess)

    Unclean data 存在两类问题:数据质量低,数据不整洁。可以从这两方面分别进行评估。(详细见此笔记)

    2.1 质量评估(Quality)

    为了尽可能多得练习,这里先用目测的方法进行数据评估,再用编程方法进行数据评估。

    目测评估

    导入数据:

    import pandas as pd
    
    patients = pd.read_csv('patients.csv')
    treatments = pd.read_csv('treatments.csv')
    adverse_reactions = pd.read_csv('adverse_reactions.csv')

    查看数据:
    这里写图片描述

    这里写图片描述

    这里写图片描述

    问题记录:
    这里写图片描述

    编程评估

    编程评估要用到代码,而不是对整个数据进行浏览。就 pandas 而言,它的很多函数和方法都可以用来检查数据的质量和整洁度,比如 .sample().head().tail().info().describe().value_counts() 等。

    patients 进行数据评估:
    这里写图片描述
    这里写图片描述
    问题记录:
    这里写图片描述

    treatments 进行数据评估:
    这里写图片描述
    问题记录:
    这里写图片描述

    Q: 以上两个表中都存在数据类型错误的问题,为什么数据类型很重呢?
    A: 因为在 pandas 中,可以对分类变量,数值变量,时间变量等进行特殊的计算和总结。比如说 patients 中的 birthdate必须是日期时间类型,这样才使用时序或日期时间功能,方便得进行年龄计算。

    继续进行编程评估:
    这里写图片描述

    .value_counts()统计的是不同值的个数,不包括NaN。

    这里写图片描述

    以上姓氏中‘Doe’有6个,地址中‘123 main street’也有6个,很可能是重复,用 .duplicated() 方法筛选重复地址,发现关于‘Doe’的5条数据除 patient_id 外,其他信息都一样,现实中不可能存在这样的情况。这是一个有效性问题(validity issue)。类似的重复情况还有:
    这里写图片描述
    这里写图片描述

    问题记录:
    这里写图片描述

    继续进行编程评估:
    这里写图片描述
    一般人的体重不太可能是48.8磅(1 lb = 0.4536 kg),所以该数据不准确,甚至是无效的,即存在有效性问题;但是如果深入思考的话,会发现情况并非如此,其实是一致性问题。48.8的单位是公斤,而不是磅。下面按照48.8kg来计算其 bmi(身体质量指数),验证一下:
    这里写图片描述
    四舍五入后与记录中的 bmi 值一样,所以这条记录的体重单位有误,应该 kg。这属于一致性问题(consistency issue)

    进行最后的编程评估:
    这里写图片描述
    计算auralin和novodra的空值个数,结果均为0,但实际上存在空值;这是一种常见的问题,将空值存储为破折号、斜杠、‘none’等,而不存储为真正的空值。这是一个有效性问题(validity issue),因为空值应该为空值,而不是文本。

    问题记录:
    这里写图片描述

    2.2 整洁度评估(Tidness)

    何为整洁数据:
    1. Each variable forms a column
    2. Each observartion forms a row
    3. Each type of observational unit form a table
    by Hadley Wickham

    (数据整洁度问题 详见此笔记)

    按照以上定义对数据整洁度进行评估:

    patients 表中 contact 列的问题在于,一个列中存储了两个变量:电话号码,email地址。并记录问题。
    这里写图片描述

    treatments 表的问题在于,auralin 列和 novodra 列的名称其实是变量,不应用作列标签,同时初始剂量、结束剂量应该为两个变量。并记录问题。
    这里写图片描述

    该医学试验的观察单元应该为2个,而非3个。病人信息为一张表,药物用量及不良反应为一张表。所以,patients表保持不变,treatments表和adverse_reactions表合二为一。并记录问题。
    这里写图片描述

    这里可以看出编程评估的优势:不必在不同table或tab之间切换,也不用滚动浏览。

    因为要将三个观察单位变为两个,可以查看下三张表重复的列有哪些:
    这里写图片描述
    我们的目标结构应该如下:
    这里写图片描述

    三、数据清理

    清理过程中,最好优先处理缺失数据的问题,即完整性问题。通过拼接(concatenate)、合并(join)、填充(impute)等手段,将数据补充完整,然后再清理其他问题。

    该项目有三处缺失问题,patients表中有人口统计信息缺失的问题,暂时无法补充完整,先不管。treatments表中有两处缺失,一个是hba1c变化水平,该值可以计算获得;一个是缺少记录,可以在文件treatments_cut.csv中找到缺失数据。
    这里写图片描述
    这里写图片描述

    3.1 数据缺失问题(Missing Data)

    先处理这两处数据缺失问题。

    清理前先拷贝数据:

    patients_clean = patients.copy()
    treatments_clean = treatments.copy()
    adverse_reactions_clean = adverse_reactions.copy()

    这里写图片描述

    这里写图片描述

    3.2 数据整洁度问题

    缺失问题处理完之后,进行整洁度处理。整洁的数据可以使后续清理工作更容易进行。整洁的低质量数据 比 不整洁的低质量数据 要容易清理,所以,先解决 结构问题 再解决 质量问题

    3.3 数据质量问题

    四、后记

    我本人之前对于糖尿病也是懵懂无知的状态,因为做这个项目的缘故,我主动了解糖尿病,并查阅了一些患病数据;也因为有家人得2型糖尿病,更促使我关注2型糖尿病的诱因防控手段

    其来势汹汹(甚至是爆炸性的增长)主要跟不良的生活方式有关,在此郑重提醒 青年们 养成好的生活习惯:管住嘴,迈开腿。

    注脚

    [1] 果壳网 关于中国糖尿病患者的报告,另外还有中国疾病控制预防中心对糖尿病的一些实况报道
    [2] 全球糖尿病社区(the global diabetes community)关于口服胰岛素(oral insulin)的一篇文章
    [3]

    展开全文
  • 来源:国家药监局网站一、前言规范的数据管理计划有助于获得真实、准确、...在试验完成时,对试验中的数据管理和统计分析工作进行全面完整的总结至关重要,通过数据管理报告真实反映临床试验过程中的数据质量和试...

    来源:国家药监局网站

    一、前言

    规范的数据管理计划有助于获得真实、准确、完整和可靠的高质量数据;而详细的统计分析计划则有助于保证统计分析结论正确和令人信服。为保证临床试验数据的质量和科学评价药物的有效性与安全性,必须事先对数据管理工作和统计学分析原则制定详细的计划书。在试验完成时,对试验中的数据管理和统计分析工作进行全面完整的总结至关重要,通过数据管理报告真实反映临床试验过程中的数据质量和试验样本特征,通过统计分析报告为临床试验总结报告的内容和研究结论提供主要依据。因此,在药物上市注册时,监管部门将数据管理计划和报告与统计分析计划和报告视为评价临床试验结果的重要文件和依据。

    虽然我国《药物临床试验质量管理规范》(Good Clinical Practice,GCP)中对药物临床试验数据管理与统计分析进行了原则要求,且国家食品药品监督管理总局已发布的有关药物临床试验及其统计学的相应技术指南也涉及数据管理和统计分析工作的主要环节,但针对数据管理计划和报告、统计分析计划和报告却没有详细的技术规范和指导性建议。因此,本技术指导原则对此进行了较为详细的介绍和阐述,并提出具体要求,旨在为临床试验的数据管理和统计分析人员提供技术指导,帮助其更好地完成相关工作以达到监管要求。

    二、数据管理的计划和报告

    (一)一般考虑

    数据管理计划(Data Management Plan, DMP)是由数据管理人员依据临床试验方案书写的一份动态文件,它详细、全面地规定并记录某一特定临床试验的数据管理任务,包括人员角色、工作内容、操作规范等。数据管理计划应在试验方案确定之后、第一位受试者筛选之前定稿,经批准后方可执行。通常数据管理计划需要根据实际操作及时更新与修订。

    数据管理工作涉及多个单位或业务部门,包括数据管理、临床研究者、统计分析、医学事务、临床监查、临床稽查等单位或部门。数据管理的职责可分为负责、参与、审核、批准、告知等,各单位/部门在数据管理各步骤的职责不尽相同。数据管理计划需明确参与数据管理的相关组织及人员职责。数据管理各步骤需建立并遵循相应的标准操作规程(Standard Operation Procedure,SOP),数据管理计划应列出项目所遵循的SOP清单。

    数据管理报告是在临床研究结束后,数据管理人员撰写的研究项目数据管理全过程的工作总结,是数据管理执行过程、操作规范及管理质量的重要呈现手段。通常以定性和定量的参数来表达,如数据量、疑问数等,并与数据管理计划一起作为药物注册上市的申请材料提交给监管部门用于对临床试验结果的评价。

    (二)数据管理计划的基本内容

    数据管理计划应全面且详细地描述数据管理流程、数据采集与管理所使用的系统、数据管理各步骤及任务,以及数据管理的质量保障措施。

    1. 试验概述

    简要描述试验方案中与数据管理相关的内容,一般包括研究目的和总体设计,如随机化方法及其实施、盲法及设盲措施、受试者数量、评估指标、试验的关键时间节点、重要的数据分析安排及对应的数据要求等。

    2. 数据管理流程及数据流程

    列出数据管理的工作流程以及试验数据的流程,便于明确各环节的管理,可采用图示方式。

    数据管理的工作流程应包含数据采集/管理系统建立、病例报告表(Case Report Form,CRF)及数据库的设计、数据接收与录入、数据核查与质疑、医学编码、外部数据管理、盲态审核、数据库锁定、解锁及再锁定、数据导出及传输、数据及数据管理文档的归档等数据管理过程。

    数据流程应包含临床试验中所有类型数据的生成、采集、传输、导入、导出、存档等的位置、负责单位/人、期限等。详细列出每一种类型的试验数据流程,便于明确各种类型和介质的数据的管理,如CRF数据、中心实验室检测数据、药代动力学检测数据、电子的患者报告结果(Electronic Patient Reported Outcome, ePRO)数据、影像学数据等。

    3. 采集/管理系统

    列出采集试验数据的方法,如纸质或电子的CRF、采用的数据采集/管理系统的名称及版本。描述系统用户的权限控制计划,或者以附件形式提供相应信息,包含权限定义、分配、监控及防止未经授权操作的措施或方法、权限撤销等。

    数据采集/管理系统应具备稽查轨迹、安全管理、权限控制及数据备份的功能,并通过完整的系统验证。

    4. 数据管理步骤与任务

    (1)CRF及数据库的设计

    CRF的设计必须保证收集试验方案所规定并满足统计分析需求的所有数据。不论是何种数据记录方式,均需对相应CRF填写指南的建立和管理有所阐述。

    数据库的设计通常按既定的注释CRF和/或数据库设计说明执行,建立逻辑核查,经用户接受测试(User Acceptance Testing, UAT)合格后方可上线使用。数据管理计划中对此过程应进行简要描述和说明。

    (2)数据的接收与录入

    数据管理计划应明确阐述数据采集、接收和录入的方式和过程。

    临床试验研究者或临床研究协调员(Clinical Research Coordinator,CRC)应依照CRF填写指南,准确、及时、完整、规范地填写CRF。在数据录入前需制定数据录入说明,确定数据录入的要求及方式。纸质CRF常用双人双份录入,电子CRF由临床研究者或由其指定的CRC直接录入。纸质CRF表还需定义完成CRF的发送、转运、接收方式,如传真、邮寄、监查员收集等。同时定义收集频率及记录文件接收的格式等。

    (3)数据核查与质疑

    在进行数据核查之前,应制定详细的数据核查计划(Data Validation Plan, DVP),明确数据核查内容、方式与核查要求。数据核查通常需要数据管理人员、监查员、医学人员及统计师等共同完成。

    (4)医学编码

    医学编码是把从CRF上收集的不良事件、医学诊断、合并用药、既往用药、既往病史等的描述与标准字典中的术语进行匹配的过程。如采用医学编码,数据管理计划需详细描述编码流程、编码工具、编码字典及版本,以及执行编码的相关标准文件。

    (5)外部数据管理

    临床试验外部数据包括实验室数据、电子日志、ePRO、随机化数据等。针对外部数据的管理,数据管理计划中应列出数据传输协议,包括数据类别、数据提供者、数据格式、传输方式、传输频率等,以及对外部数据进行质控的措施,如传输测试、一致性核查等。对于盲态的外部数据,如血液样品中的药物浓度或某些关键数据等,需描述此类数据的管理流程。

    (6)盲态审核

    列出数据盲态审核的要求,并在计划中描述盲态审核操作的具体流程。一般地,数据盲态审核时应对所有数据质疑、脱落和方案偏离的病例、合并用药和不良事件的发生情况以及分析数据集的划分进行最终确认。

    (7)数据库锁定、解锁及再锁定

    数据管理计划应详细说明数据库锁定的流程、负责人及执行的SOP文件。数据库锁定后的解锁和再锁定,应事先规定并详细说明其条件和流程。

    (8)数据导出及传输

    描述数据的导出和传输的文件格式、导出内容(数据库、变量名及变量值编码)、提交程序及传输介质,传输介质应符合国家法规和监管部门要求。

    (9)数据及数据管理文档的归档要求

    试验数据及录入/导入数据库的时间、录入者、数据稽查轨迹及数据管理过程形成的文档都需要完整保存。数据管理过程形成的数据通常包括但不限于:临床试验数据、外部数据、数据库元数据信息、实验室检测参考值范围、逻辑检验及衍生数据变更控制列表、数据质疑表和程序代码等。数据管理过程形成的文件通常包括但不限于:数据管理计划、空白CRF、CRF填写指南、完成CRF的PDF格式文件、注释CRF、数据库设计说明、数据库录入说明、数据核查计划、数据质控核查报告等。

    数据管理计划中应明确需要存档的试验数据、管理文件、介质、归档方式及时限。

    5. 质量控制

    数据管理计划需确定数据及数据管理操作过程的质控项目、质控方式(如质控频率、样本选取方式及样本量等)、质量要求及达标标准、对未达到预期质量标准的补救措施等。

    (三)数据管理报告的基本内容

    数据管理报告应全面且详细陈述与数据管理执行过程、操作规范及管理质量相关的内容,包括参与单位/部门及职责、主要时间节点、CRF及数据库设计、数据核查和清理、医学编码、外部数据管理、数据质量保障、重要节点时的数据传输记录、关键文件的版本变更记录,并描述与数据管理计划的偏离。

    1. 参与单位/部门及职责

    数据管理报告应列出数据管理涉及的所有单位/部门及其在数据管理各步骤的职责。

    2. 数据管理的主要时间节点

    数据管理各步骤的时间节点可体现数据管理工作的时效性及数据质量,数据录入与数据清理不及时可能有损数据质量。可采用列表方式描述各主要时间节点的起止时间,包括数据录入、数据清理、外部数据管理、数据质控、数据锁库、数据传输、文档归档等主要步骤。

    3. CRF及数据库设计

    描述CRF及数据库设计各主要步骤的执行情况及具体工作内容/方法,包括CRF设计、编制CRF填写指南和注释CRF、形成数据库设计说明以及数据录入说明、数据库建库及数据标准、数据库测试情况等。

    4. 数据核查和清理

    数据管理报告应描述数据质疑的总体情况,并按照疑问类型进行归类汇总。为体现质疑的及时性,数据管理报告应描述质疑生成到答疑的时长(中位天数及其范围)。针对质疑管理中的主要异常问题,数据管理报告应描述出现问题的原因或说明,如质疑数量过高/过低的临床中心/研究者、答疑时间过长等。

    数据管理报告应描述是否有不同于临床数据库的严重不良事件数据库,如有则应描述一致性核查情况,包括试验严重不良事件(Serious Adverse Event, SAE)总数、被核查的SAE数量及SAE核查频率等,对未核查的SAE以及经核查不一致的SAE应当详细说明其不一致点和修正情况。

    5. 医学编码

    对所采用的医学编码,数据管理报告应描述各项内容编码采用的字典名称及其版本号,并列出各项内容的编码数量。

    6. 外部数据管理

    描述外部数据的种类,并描述各类外部数据的来源单位、数据传输协议、数据传输起止日期、传输频率及方式,以及是否执行外部数据的一致性核查和核查结果等。对盲态的外部数据需重点描述维持其盲态的措施。

    7. 数据管理的质量评估

    在数据库锁定前进行数据质量评估,评估并报告的内容应包含计划与实际发生的临床数据录入天数(针对纸质CFR)、质控过程发现并纠正的问题的数量等。

    描述数据管理过程中进行数据质控核查的次数,每一次质控核查需描述核查时受试者总例数、关键指标错误率、非关键指标的抽样例数、抽样比例及依据和错误率。

    数据管理应当严格按照数据管理计划执行,如实际操作中有任何不一致,报告中需详细描述其发生原因,并进一步阐述对数据质量的影响。如数据管理接受稽查或视察,应当描述稽查承担单位、稽查时间、稽查发现的主要问题、采取的纠正和预防措施等。

    8. 重要节点时的数据传输记录

    试验数据管理过程中可能需要多次数据传输,数据管理报告应描述重要节点的传输记录,包括期中分析的数据传输、数据锁定后向统计分析单位或申办者的传输、以及向药品监管部门的提交等。描述内容应当包含传输的数据集名称、传输日期、接收单位、传输格式、以及原数据集的储存/备份地点、责任单位/人。

    9. 关键文件的版本变更记录

    数据管理报告应详细列出与数据管理相关的重要文档的版本变更记录,包括试验方案、CRF、数据库(包括eCRF与逻辑检验程序)及数据管理计划的版本变更记录,并描述各版本执行日期、修正内容及修正原因等。

    10. 报告附件

    以下报告附件作为关键性文件,应视为数据管理报告不可缺少的内容。

    (1)空白CRF

    (2)注释CRF (可提交电子版)

    (3)数据库锁定清单及批准文件

    (4)数据核查计划DVP(可提交电子版)

    三、统计分析的计划和报告

    (一)一般考虑

    统计分析计划(Statistical Analysis Plan,SAP)是比试验方案中描述的分析要点更加技术性和有更多实际操作细节的一份独立文件,包括对主要和次要评价指标及其他数据进行统计分析的详细过程。临床试验的统计分析有其特殊性,统计分析计划应当由具有参与临床试验经验的统计学专业人员起草,要求全面而详细地陈述临床试验数据的分析方法和表达方式,以及对预期的统计分析结果的解释。统计分析计划初稿应形成于试验方案和CRF确定之后,在临床试验进行过程中以及数据盲态审核时,可以进行修改、补充和完善,不同时点的统计分析计划应标注版本及日期,正式文件在数据锁定和揭盲之前完成并予以签署。如果试验过程中试验方案有修订,则统计分析计划也应作相应的调整。如果涉及期中分析,则相应的统计分析计划应在期中分析前确定。

    统计分析报告(Statistical Analysis Report,SAR)是根据统计分析计划,对试验数据进行统计分析后形成的报告,是临床试验结果的重要呈现手段,是撰写临床研究报告(Clinical Study Report,CSR)的重要依据,并与统计分析计划一起作为药物注册上市的申请材料提交给监管部门用于对临床试验结果的评价。

    (二)统计分析计划的基本内容

    统计分析计划的基本内容涵盖了设计的类型、比较的类型、随机化与盲法、主要指标和次要指标的定义与测量、检验假设、数据集的定义、疗效及安全性评价和统计分析的详细计划。确证性试验要求提供主要指标的分析原则及预期分析方法。探索性试验通常描述概括性的原则和方法。

    1. 试验概述

    试验概述是试验方案中与统计学相关的部分,常可直接摘录。一般包括以下主要内容:

    (1)研究目的:临床试验的主要目的和次要目的。

    (2)设计类型:如平行设计、交叉设计、析因设计、成组序贯设计等。

    (3)对照的类型:如安慰剂对照、阳性对照、剂量组对照等,需说明试验选择的对照类型及理由。

    (4)随机化方法及其实施:明确随机化方法,如区组随机、分层随机及其分层因素等。

    (5)盲法及设盲措施:说明是单盲还是双盲,设盲措施是双盲单模拟、双盲双模拟等,以及保持盲态下执行统计分析的措施。若采用开放设计,需充分说明无法实施盲法的理由。

    (6)样本量:计划入组的受试者数量及其计算依据。若采用成组序贯设计应说明不同阶段的样本量。

    2. 评价指标

    统计分析计划中应清晰描述主要指标和次要指标的定义,包括具体观察和测量的方法、观察时点、指标属性。如果主要指标需要通过计算得到,则需给出相应的计算公式。

    3. 分析数据集

    根据不同研究目的,在统计分析计划中需明确描述数据集的定义。临床试验的分析数据集一般包括ITT/全分析集(Full Analysis Set,FAS)、符合方案集(Per Protocol Set,PPS)、安全性数据集(Safety Set, SS)。在定义分析数据集时,需遵循两个原则:①尽可能地减小偏倚;②控制I 类错误的增加。

    4. 缺失数据和离群值的处理

    缺失值和离群值是临床试验中潜在的偏倚来源之一,但在实际的临床试验中往往难以避免。因此,一方面在试验的计划、执行过程中应有必要的措施尽量避免其发生,另一方面在统计分析计划中应预先说明主要疗效指标缺失值的填补方法及理由,离群值的处理方法应当从医学和统计学两方面去考虑,并在统计分析计划中明确描述。

    5. 统计分析方法

    统计分析应建立在真实、准确、完整和可靠的数据基础上,应根据研究目的、试验方案和观察指标的类型选择国内外公认的统计分析方法。应给出不同类型资料的描述及统计推断方法,明确采用的单双侧检验及其水准,并说明所采用的统计软件及版本号。

    (1)比较类型和检验假设

    明确临床试验的比较类型,如优效性检验、非劣效性/等效性检验及其界值等。写出主要指标进行统计学检验的原假设和备择假设及其检验水准等。

    要注意多个主要指标、多个比较组、多个时间点的比较、期中分析、亚组分析等情况的多重性问题,说明控制Ⅰ类错误率的措施。

    (2)人口学资料和基线特征分析

    说明对于人口学等基线资料根据数据性质进行描述统计分析的具体方式。

    (3)依从性和合并用药分析

    对于依从性和合并用药的分析,说明所采用描述性统计分析的具体方式,并说明对依从性差、具有合并用药的受试者具体情况的描述方式。

    (4)主要指标的分析

    说明主要指标分析采用的统计分析方法和统计分析模型。分析模型的选择要注意考虑指标的性质及数据分布的特性。处理效应的估计应尽量给出效应大小、置信区间和假设检验结果。有些基线特征变量在统计分析中可作为协变量处理,但必须在统计分析计划中事先说明。

    在确证性试验中,只有统计分析计划中事先规定的统计分析内容才可以作为确证性试验的证据,其他的分析结果只能是探索性的。

    (5)次要指标的分析

    对于次要指标的统计分析,处理效应的估计也需要尽量给出效应大小、置信区间和假设检验方法。

    (6)安全性分析

    安全性分析的资料主要来源于受试者的主诉、症状、体征以及实验室检查结果等,所有的安全性指标在分析中都需要高度重视,应考虑对不良事件采用统一的编码词典进行编码。对于安全性数据的分析需说明所采用的统计学分析方法。

    对不良事件的分析,应按事件发生的频数、频次和发生率描述,必要时进行组间发生率的比较。分析计划中需说明各种不良事件/反应的分类和汇总方式,以及所采用的具体不良事件编码词典名称及其版本号。

    (7)其他分析

    除以上的分析之外,有时还考虑期中分析、亚组分析、敏感性分析等。

    期中分析的时点(包括日历时点或信息时点)、具体实施方式和所采用的α消耗函数等应当事先制订计划并在试验方案中阐明。对于确证性临床试验,原则上不得进行计划外期中分析,如由于特别情况进行了计划外的期中分析,则在研究报告中应解释其必要性以及破盲的程度和必要性,并提供可能导致偏倚的严重程度以及对结果解释的影响。

    当涉及亚组分析时,需要对亚组给出明确定义。对于非预先规定的缺失数据的填补、离群值、亚组分析、不同数据集的分析、不同协变量的调整等,可进行敏感性分析,考察对试验结果的影响。

    6. 图表模板

    统计分析结果通常以统计分析表或图的形式呈现,计划中应该以简明的格式、精炼的文字描述所有相关信息。

    (三)统计分析报告的基本内容

    统计分析报告是对临床试验的统计设计、分析、结果的总结,是临床试验报告的基础和依据,其基本内容包括:试验概述、统计分析方法、统计分析的结果与结论,一般采用统计表和统计图表示。统计分析报告中的所有结论应使用准确的统计学术语阐述。

    1. 试验概述

    统计分析报告中的试验概述应与统计分析计划一致。

    2. 统计分析方法

    统计分析报告中的统计分析方法应与统计分析计划一致。

    3. 统计分析结果

    (1)受试者的分布

    统计分析报告中应写明所有入组的受试者的分布情况,包括筛选例数、筛选失败例数及原因、参与随机化的例数、各组脱落或剔除受试者的例数、百分比等,以及方案偏离情况、各分析数据集的分布。除文字、表格描述外,应采用流程图的方式描述受试者的分布情况(流程图参见附录)。

    详细描述每一位因脱落/剔除等原因未进入各分析数据集的受试者的情况,如受试者编号、中心、入组时间、脱落或剔除原因及时间等。

    (2)人口学资料和基线特征分析

    对于人口学资料、既往病史、家族史、药物过敏史以及疗效指标的基线值等数据常采用统计描述的方式进行可比性分析。计量资料一般用均数、中位数、标准差、四分位数、最大值和最小值等进行描述;计数及等级资料一般用频数和百分比描述。

    (3)依从性和合并用药分析

    根据依从性定义,报告各受试者完成试验的情况,包括研究时间、药物暴露时间、药物使用量等情况,列表描述依从性差的受试者、依从性差的具体原因及进入分析数据集情况。

    对于合并用药分析,需列出合并药物的详细情况,如受试者编号、中心、组别、合并药物名称、使用原因、开始时间、结束时间等,进行组间合并用药的比较。

    (4)疗效分析

    对于主要和次要疗效指标,需根据事先确定的统计分析方法进行统计描述和统计推断,可能包括指标基线情况、治疗后各访视点的测量值及前后变化情况,以及变化值组间差异的描述统计量、置信区间和组间比较的检验统计量及P值等。

    对于主要指标,应报告效应大小、置信区间和假设检验结果,根据事先确定的标准,从统计学角度判断主要指标的优效性/非劣效性/等效性的假设是否成立。

    (5)安全性分析

    安全性分析应按统计分析计划给出统计分析结果。需要分类汇总各种不良事件/反应,包括一般的和严重不良事件/反应、重要不良事件、导致脱落的不良事件/反应的发生率、严重程度及可能进行的组间比较。并列表描述每位受试者每项不良事件/不良反应发生的详细情况,包括不良事件/反应的类型、严重程度、发生和持续时间、结局以及与试验药物及药物剂量的关系等。

    对实验室指标的比较和评价,主要关注治疗前正常而治疗后异常的发生情况,以及治疗前异常但在治疗后加重的受试者,需列表描述上述两种情况。生命体征、心电图、体格检查以及其他安全性相关指标的分析与实验室检查指标的分析类似。必要时,进行实验室指标前后变化及组间比较。

    4. 统计学结论

    根据主要指标的统计分析结果,结合研究的设计类型、样本量、试验实施情况、次要指标及敏感性分析结果等阐述证据的充分性和结果的稳健性,并给出统计学结论:明确针对主要指标的统计假设是否成立,并简要描述安全性的主要统计结果。

    5. 报告附件

    以下报告附件作为关键性文件,应视为统计分析报告不可缺少的内容。

    (1)原始数据库、分析数据库及相应的变量说明文件(数据库应为SAS XPORT 传输格式,xpt格式)

    (2)受试者分布流程图

    (3)随机化方案(含随机分配表)

    (4)盲态审核决议

    (5)补充正文的统计附图和附表

    (6)SAS分析代码(必要时)

    (7)统计方法的发表文献(必要时)

    四、名词解释

    稽查轨迹(Audit Trail):是计算机系统(如数据管理系统)的基本功能。是指系统采用安全的和计算机产生的带有时间烙印的电子记录,以便能够独立追溯系统用户输入、修改或删除每一条电子数据记录的日期、时间,以及修改原因,以便日后数据的重现。任何记录的改变都不会使过去的记录被掩盖或消失。只要受试者的电子记录保存不变,这类稽查轨迹文档记录就应当始终保留,并可供监管视察或稽查员审阅和复制。

    系统验证(System Validation):是指建立计算机化系统生命周期管理的文档化证据,以确保计算机化系统的开发、实施、操作以及维护等环节自始至终都能够高度满足其预设的各种系统技术标准、使用目的和质量属性,和处于监控的质量管理规程中,并能在其投入应用直至退役过程中都能高度再现和维护系统的标准和功能符合监管要求。

    权限控制(Access Control):是指按照临床试验电子系统的用户身份及其归属的某项定义组的身份来允许、限制或禁止其对系统的登录或使用,或对系统中某项信息资源项的访问、输入、修改、浏览能力的技术控制。

    注释CRF(Annotated CRF):是对空白的CRF的标注,记录CRF各数据项的位置及其在相对应的数据库中的变量名和编码。

    逻辑核查(Edit Check):是指临床试验数据输入计算机系统后对数据有效性的检查。这种核查可以通过系统的程序逻辑,子程序和数学方程式等方法实现,主要评价输入的数据域与其预期的数值逻辑、数值范围或数值属性等方面是否存在错误。

    用户接受测试(User Acceptance Testing,UAT):用户接受测试是由临床数据管理系统的用户进行的一种检测方式,检测记录可用以证明所设计系统经过了相关的验证过程。用户应全面检测所有正确和错误数据组合,记录检测结果。全面的检测文档应包括验证方案、测试细则记录、测试总结报告和验证总结报告等。

    数据核查计划(Data Validation Plan,DVP):也称逻辑核查计划,是由数据管理员为检查数据的逻辑性,依据临床试验方案以及系统功能而撰写的系统设置文件。

    盲态审核(Blind Review):是指在试验结束(最后一位受试者最后一次观察)到揭盲之前对数据进行的核对和评估,以便最终确定统计分析计划。

    方案偏离(Protocol Deviation):是指任何有意或无意偏离和不遵循未经IRB批准的试验方案规定的治疗规程,检查或数据收集程序的行为。一般来说,这种偏离只是逻辑的或管理性的偏离试验方案,不会对受试者的安全和获益产生实质性的作用,也不会影响所收集数据的价值。

    期中分析(Interim Analysis):是指在正式完成临床试验前,按事先制订的分析计划,对处理组间的有效性和安全性进行比较的分析。

    缺失数据(Missing Data):是指按照研究方案要求收集但未观测到的数据。

    离群值(Outliers) :是指严重偏离平均水平的观测数据。离群值可能由于变量的变异较大所致,也有可能由过失误差引起;若是后者,应说明原因后作为缺失数据处理。

    亚组分析(Subgroup Analysis):是指对整体中根据某种因素分层的部分数据进行分析。

    敏感性分析(Sensitivity Analysis):是指对非预先规定的试验中可能出现的各种情况进行分析,如缺失数据的填补、亚组分析、不同数据集分析、不同协变量的调整等,并将分析结果作为参考,与事先确定的分析结果进行比较,考察所得结果的一致性和稳定性。敏感性分析可以作为主要分析的附加支持,但不能作为结论的主要依据。

    重要不良事件(Significant Adverse Event):指的是除严重不良事件外,发生的任何导致采用针对性医疗措施(如停药、降低剂量和对症治疗)的不良事件和血液学或其他实验室检查明显异常。

    五、参考文献

    1. CFDA:药物临床试验质量管理规范(GCP)。2003

    2. CFDA:药物临床试验的生物统计学指导原则。2016

    3. CFDA:临床试验数据管理工作技术指南。2016

    4. CFDA:化学药物临床试验报告的结构与内容技术指导原则。2005

    5. ICH E3: Structure and Content Of Clinical Study Reports. 1995

    6. ICH E6: Guideline for Good Clinical Practice. 1996

    7. ICH E9: Statistical Principles for ClinicalTrials. 1998

    8. 中国临床试验数据管理学组(CDMC):数据管理计划的结构和内容。药学学报,2015,50(11):1388-1392

    9. 中国临床试验数据管理学组(CDMC):数据管理总结报告。药学学报,2015,50(11):附录

    1ec5bc8db6d5a127f1dd187e087583f3.png

    a8096dfde7ac5702453df05fbf19ab5d.png

    dcc2d8f6f92e032c17d33d34fc98305e.png

    a51f70f0b8387b8c6e848c01be5e1e9b.png

    b1d62c11d59b11f405ce834cb7f34a50.png

    3cb1cd7953885496ceee384af535b457.png

    c92fb6e9ef569dde78e089618c00a6a5.png

    063815045062887f933004b1a911b384.png

    5374d80386e9178188d205cbd3ed4099.png

    a95331dd1ed0a1a87cb597cafbe86a18.png

    8e2f08aa1fbfdac99858d393f4de8fa3.png

    d55b3b69710e118501c4d90e4027975d.png

    072e24df2c235edb8ef4158c57ec6e40.png

    562bcf5dc258e0f3dbf4fbd84c7eec84.png

    8c6f52642373ba975f0ec70057b6012c.png

    b51ebcdbde0a23de5df6898a8ebda89f.png

    e3508b518f853814be108e027bce5c91.png

    73e1b6c19aad1c25a3b8fe37023e4956.png

    9810d2addb0d5a9c37f10217349ea82c.png

    0e09fd57bde107ade2c6e65fd66aefdc.png

    展开全文
  • 主要想分享下,医学数据/临床数据分析,和数据挖掘方面的知识,以及相关语言,包括:python,SAS,R和SQL的内容吧。 大学主要是学应用数学和统计的,后来硕士又读了计量金融学。毕业后机缘巧合下,接触到了医学方面...
  • 临床医疗运营数据分析 *医疗数据分析数据分析,可视化展示,我们需要分析什么?展示什么? 提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录临床医疗运营数据分析前言一、pandas是...
  • 相关性分析的概念 相关性是一个统计学名词,相关的定义为随机变量之间相互联系的密切程度和方向。在医学研究中,探讨某疾病的发生与哪些因素有关、疾病与疾病之间的关系等,都需要用到相关性分析,它常用于判断两个...
  • 点击"上海生命基因" 关注阅读更多文献信息Whole transcriptome analysis of smoker palatal mucosa identifies multiple downregulated innate immunity genes吸烟者pa上黏膜的全转录组分析确定了多个下调的先天免疫...
  • 是一个Web应用程序,托管了一组集成的分析工具,供用户探索与分子和临床数据有关的假设,以便更好地了解癌症生物学和治疗方案。 Oncoscape就像是SPA(单页Web应用程序)一样,使用浏览器中JavaScript和后端服务器上...
  • 针对不同的数据类型采取不同的统计分析方法,如t检验,秩和检验等。 t检验,亦称student t检验(Student’s t test),主要用于样本含量较小,且分布符合正态分布的样本。t检验是用t分布理论来推论差异发生的概率,...
  • 数据分析方法论重点包括两块,一块是统计分析方法论:描述统计、假设检验、相关分析、方差分析、回归分析、聚类分析、判别分析、主成分与因子分析、时间序列分析、决策树等;一块是营销管理常用分析方法论:SWOT、4P...
  • 本文内容选自加拿大约克大学数学统计系终身教授王晓刚于近期在清华大数据“技术·前沿”系列讲座所做的题为《统计学概论和医疗临床数据分析》的演讲。关注数据分析 后台回复“1216”获取本文...
  • 本文内容选自加拿大约克大学数学统计系终身教授王晓刚于近期在清华大数据“技术·前沿”系列讲座所做的题为《统计学概论和医疗临床数据分析》的演讲。关注数据派THU(DatapiTHU)后台回...
  • 声明:本文摘自... <br />为规范临床试验数据管理 ,简化程序并减少数据统计分析过程中的错误来源 ,有必要研究 SAS中的宏问题,来很好地解决这个问题。 <br />以下参考文献是
  • 本期清华大数据“技术·前沿”系列讲座,我们邀请到加拿大约克大学数学统计系终身教授王晓刚老师来做分享。王晓刚老师讲从以下两个方向为大家做分享报告:1、统计学是应用数学的一个...
  • 临床医学数据生存分析是将临床医学中事件的现象与结果(终点事件)和出现临床现象与结果经历的时间结合起来分析的一种统计分析方法。 生存分析的目的 1.描述生存过程:预测不同时间的总体生存率、计算中位生存期、...
  • 目的:本文的目的是提供氯胺酮输注,重复经颅磁刺激(rTMS)和电抽搐治疗对顽固性抑郁症患者(TRD)的服务的临床数据分析结果。 方法:该研究是对2017年至2019年间接受氯胺酮输注的患者常规收集数据的回顾性调查。所...
  • 来源:THU数据派转载:经济结构与周期导读:本文站在统计学家的角度对数据科学常用的一些技术方法进行总结,帮助读者建立直观印象。内容对应的R代码可以在作者的GitHub上找到。无论你在数据科...
  • 自1920s以来,地质学的研究人员已经知道,使用标准的统计方法来分析成分数据可能会使结果无法解释。Aitchison认识到关于组成成分的每一个陈述都可以用成分的比率来表述,并开发出一套基本原理、各种方法、操作和工具...
  • 常用统计分析软件介绍

    万次阅读 2018-03-08 08:45:12
    一、 SAS统计软件  SAS 是英文Statistical Analysis System的缩写,翻译成汉语是统计分析系统,最初由美国北卡罗来纳州立大学两名研究生开始研制,1976 年... 在国际上, SAS被誉为数据统计分析的标准软件。SAS系...
  • 作者:鱼心DrFish链接:http://www.jianshu.com/p/8a0479f55b21本文用Python统计模拟的方法,介绍四种常用的统计分布,包括离散分布:二项分布和泊...
  • 区域卫生数据用于临床疗效分析的可用性研究叶琪1,赵亮1,阮彤1,冯东雷2,高炬3,刘珉31. 华东理工大学,上海 200237 2. 万达信息股份有限公司,上海 2000...
  • 在此演示中,我们使用来自临床研究的真实数据集来概述 MATLAB 产品系列中的统计分析和可视化功能。该演示使用医学领域临床研究中的数据作为样本数据,并介绍使用MATLAB进行统计分析和可视化的方法。
  • 统计建模与数据分析

    千次阅读 2012-04-19 19:24:23
    Statistical Modelling and Data-Analysis Bayesian Methodology Bayesian Object Matching Image segmentation by MCMC methods Steerability Properties of Gabor Filters ...Sequential Monte Carlo Methods
  • 其实本质可以理解跨领域导致的,因为大多从事人工智能的人没有足够的统计分析经验。这篇文章就给大家深度剖析一下。 剖析思路主线:从“真正意义上理解什么是假设检验”出发,懂得“做经典假设检验的真正目的是...
  • 在医学统计中,尤其是在临床实验中,每个观测对象记录的观测结果包含多个反应变量(Respone Variables)。例如,血记录有收缩压、舒张压、脉压等,这种有多个变量的数据称为多变量数据。主成分分析是多变量分析方法...
  • 自CFDA(2012) 颁布“临床试验数据管理工作技术指南”[以来,经过国家主导的大规模临床...EDC已超出其电子数据采集单一功能定义,已被认为是电子化临床数据管理模式。FDA认为电子化临床是创新关键路径的重要工具之一,...
  • 2015年英联邦国际卫生政策机构的调查发现,将近60%的美国初级保健提供商,无法以电子方式将患者临床数据的相关摘要与其他的临床医生交换。 换句话说,大多数临床医生及其患者仍然没有意识到临床数据共享的能够带来...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 5,531
精华内容 2,212
关键字:

临床数据统计分析