细胞穿膜肽是一种小分子多肽,能够容易地穿过细胞膜。这类分子,尤其是具有靶向功能的CPPs为高效率投送药物到靶细胞带来希望。 因此,对其展开研究对于生物医学有着一定的意义。本工作主要从序列水平对具有不同穿膜活性的CPPs进行研究,试图找出影响CPPs穿膜活性的因素,以及不同活性CPPs与非穿膜肽(NonCPPs)序列上的差异,并引入一种分析生物序列的方法。
基于CPPsite数据库和不同的文献获取CPPs和NonCPPs序列,并进一步从CPPs序列中提取具有高、中、低穿膜活性的穿膜肽(HCPPs、MCPPs、LCPPs)用于构建数据集。基于这些数据集,开展了以下研究:
首先,利用方差分析的方法,对不同活性的CPPs以及NonCPPs的氨基酸及二级结构组成进行分析,发现氨基酸的静电与疏水相互作用对CPPs的穿膜活性起到了重要影响,同时螺旋结构和无规卷曲也会影响CPPs的穿膜活性;
其次,使用理化性质与长度将不同活性的CPPs展示在二维平面上,发现在某些特殊的性质下不同活性的CPPs与NonCPPs可以产生聚簇现象,HCPPs、MCPPs以及LCPPs和NonCPPs被分成了三簇,这种现象显示了它们之间的差异;
最后,本文引入了生物序列理化质心的概念,将组成序列的残基看作质点,进而把序列抽象成质点系进行研究,并将此方法应用到CPPs的分析中,通过PCA方法将不同活性的CPPs投射到三维平面上,结果发现绝大部分CPPs聚在一起,部分LCPPs与NonCPPs聚在一起。
此工作对于CPPs的设计,以及理解不同活性CPPs序列上的差异具有一定的意义。
另外,本文引入的生物序列理化质心的分析方法也可以用于其他生物问题的分析,同时它们可以作为某些生物分类问题的输入参数,在模式识别中起到一定的作用。