在整体上可以看出,生物信息处理的两个基本内容是生物数据库建立和计算机信息服务,也就是生物数据处理的计算机数据库化和程序化。当前这种数据库的内容主要是目录、期刊、遗传基因和细胞三维结构学。服务程序主要用于信息检索和基因序列分析。
所以,严格地说,当前生物信息处理远未形成独立的学科,它同计算机生物学应用并无重大区别。在1998年第九届世界医药信息学大会上,它才作为一个讨论题目被列出来。可以说,生物信息处理技术是一项年轻的研究领域。
1.2Microarray技术
1.2.1Microarray技术原理
微阵列技术是利用分子杂交的原理,用自动化仪器arrayer把不同的,数以百计、千计、万计已知部分序列的DNA探针“印”在玻璃片或者尼龙膜上面成阵列。为了比较两份标本中核酸表达的丰度,两份标本中核酸用同位素或者荧光素(红和绿两种)标记,再于微阵列杂交,然后检测杂交信号的强度,通过一定的数据处理系统,把它们转化成两份不同标本中特异基因的丰度,最后对这些数据进行分析。
根据微阵列技术原理,微阵列技术的处理流程如下:
1.实验设计
2.样品制备(指mRNA或总RNA样品,包括对照组和实验组)
3.芯片制备(包括PCR,纯化,点样等步骤)
4.芯片杂交(将mRNA或总RNA分别进行逆转录生成cDNA,在此步骤中
将对照组和实验组cDNA分别标记CY3和CY5荧光信号)
5.芯片扫描(采用激光扫描仪,分别用532nm和635nm波长激光扫描芯片,
对于每张芯片,得到CY3和CY5通道两幅图象)
6.图象处理(采用专门软件,对图象进行分析,提取每个点上的数字信号),
得到原始数据表。
7.数据校正和筛选(对cy5或cy3信号进行校正,消除实验或扫描等各环节
因素对数据的影响,同时利用筛选规则对数据中的“坏点”,“小点”,“低信号点”进行筛选,并作标记。)
8.差异表达基因的确定(采用ratio值对差异基因进行判断,或采用统计方
法如线性回归、主成分分析、调整P值算法等对差异基因进行统计推断)
9.生物信息学分析(如cluster算法、差异基因的同源性比对,差异基因的
1.2.2Microarray技术应用领域
Microarray技术是近几年兴起的新技术,但短短几年中,该技术已经被分子生物学的很多领域接受,并广泛应用于以下领域:
1、基因表达分析和检测
2、功能分析
检测到基因表达差异之后,下一步是寻找这些差异的生物学功能。
3、基因作图
微阵列技术的应用补充了基因表达研究的方法,加强了对疾病易感性和疾病本质的研究。这种方法无论是在速度上还是在准确性上都远胜于传统方法,它将会改变基因制图的方法。