糖尿病是一组由于胰岛素分泌缺陷及其生物学作用障碍引起的以高血糖为特征的代谢性疾病。此种疾病受基因、环境以及两者之间的互作共同影响,研究人员需要研究大量的数据才能确定出糖尿病的易感基因。在对大批量分子和临床数据的处理过程中将计算机方法引入生物科研领域,将会大大减少工作量,同时也间接促进了 计算生物学的发展。 随着生活方式现代化以及社会老龄化,糖尿病发病率逐年增加,是继肿瘤、心脑血管疾病之后居第三位的慢性非传染性疾病。1997年美国糖尿病协会(American Diabetes Association,ADA)依据病因和发病机制将糖尿病分为1型糖尿病、2型糖尿病、妊娠期糖尿病和其他特殊类型糖尿病4大类型, 其中2型糖尿病占糖尿病总数的95%以上。 计算生物学是指开发和应用数据分析及理论的方法、数学建模、计算机仿真技术等,目前各种计算方法已开始广泛应用于药物研究,以及研发创新的、具有自主知识产权的疾病靶标和信息学分析系统等。同时,运用计算生物学,科学家有望直接破译在核酸序列中的遗传语言规律,模拟生命体内的信息流过程,从而认识代谢、发育、进化等一系列规律,最终为人类造福。美迪西生物医药提供计算生物学和分子模型构建服务,其结构生物实验室配备有分子克隆室及基于蛋白质晶体学的药物发现与筛选平台,支持基于结构基础的药物开发,从新靶点的确认到最终的结构确认。 计算生物学检测糖尿病易感基因的方法与步骤 (1) 易感位点的鉴定 过去20年的全基因组连锁研究产生了大量的与疾病连锁的数量性状位点, 首先从先前的连锁研究中鉴定出得到良好重复即至少在2个研究中存在显著性或提示性连锁的基因区域作为疾病易感位点。 (2) 信息输入 将所鉴定的易感位点作为GeneSeeker、DGP、Endeavor以及PROSPECTR and SUSPECTS 的输入信息(GeneSeeker还需要输入与疾病相关的组织), 同时把相关位点上染色体起始和终止部位的碱基对输入到Prioritizer中。 GeneSeeker是由荷兰Nijmegen大学分子与生物信息学中心的Marc A van Driel研究小组于2003年提出的, 是一种根据来自人和鼠的基因表达及表现型资料筛选疾病图位候选基因的网络工具。它从大量在线数据库中搜集并整合数据, 这些原始的数据库都是不断更新并及时传送给用户。 (3) 已知“疾病基因”的确定 根据过去的研究确定疾病的已知相关基因。如果某个“疾病基因”位于所选出的易感位点,在分析这个易感位点时,就把该基因从“疾病基因”中剔除,作为候选基因。 (4) 候选基因的鉴定 GeneSeeker指出在疾病相关组织中表达的基因,把通过这种方法得到的所有基因都列入考虑范围之内。其他的方法产生基因排序,把每一种方法产生的前20个基因挑选出来。若某一基因被3种或3种以上的方法识别出来它与疾病相关,那么该基因就被确定为疾病候选基因。由于Endeavor、DGP和PROSPECTRand SUSPECTS 部分采用同样的资料作为输入,并显示出类似的输出,因此只被这3种方法鉴定的候选基因就被排除。 将 计算生物学技术应用在糖尿病易感基因的检测上来,大大缩小了候选基因的范围,这些基因都是在多个研究中得到证实的相关疾病易感点上最具可能性的候选基因。虽然计算生物学方法鉴定的所有候选基因不一定都是真实的,但是首先通过计算生物学方法挑选候选基因,然后在大样本人群和/或家系中通过实验的方法测验这些候选基因的标签单核苷酸多态性与复杂疾病的关联,使用这种策略将大大加速复杂疾病基因的鉴定进程。 |