轨迹映射算法

  目前大多数分析模拟数据的方法都是基于单个样本点间的几何相似性得到系统的亚稳态,这类方法得到的结果一般对参数变化比较敏感,难以评估结果的误差。模拟轨迹不同于一般的离散型数据,两个时间相近的构象有很大的概率处于同一个亚稳态。轨迹映射算法(Trajectory MappingTM)充分利用模拟样本间的时间关联,可以基于轨迹片段准确的识别出系统的亚稳态,结果对参数选取不敏感,分析过程透明。针对系综模拟产生的多条独立的短轨迹,轨迹映射算法可以快速的构建系统的慢变量和亚稳态结构,为我们带来对系统最直观的认识。轨迹映射算法把轨迹或者轨迹片段投影到高维矢量空间中, 矢量的分量是构象函数的平均值,,其中qit指的是第i个轨迹片段。用主成分分析算法(PCA)获得这些轨迹片段在低维空间中的投影,亚稳态可以通过对轨迹片段在低维空间中的聚类获得。具体做法如下:
  首先选择一组序参量来描述系统的动力学过程,,这组序参量也可以称作基函数。原则上,任意构象函数,比如原子坐标、蛋白质主链的二面角、关键原子对间的距离、回转半径、均方根位移、系统能量等物理变量都可以当作基函数。选择对应于系统大尺度构象变化的集体变量,或者说对应于系统慢动力学过程的变量更有效。但对应于系统局域运动的变量,比如键、键角等快速变化的量对于区分系统的亚稳态作用有限。得到基函数后,把轨迹投影在这组基函数空间中,把每个基函数都做正规化处理,即样本在每个基函数中的涨落为1,平均值为0。然后把轨迹做滑动窗口平均,平均的时间尺度可以记为τ。也就是把轨迹分割成一组长为τ的轨迹片段,并把每个轨迹片段在基函数空间中平均成一个点。通过这些平均点可以计算出基函数的协方差矩阵,对角化协方差矩阵得到的大本征值对应的本征矢量就对应系统的慢变量,记做,其中m0远小于基函数的个数mτ是自由参数,对应于慢动力学过程的时间尺度,慢变量描述的是τ及以上时间尺度的动力学过程。时间尺度小于τ的快变过程已经在轨迹平均的步骤中过滤掉。通常来说,我们可以先把τ设置的足够大,比如可以是模拟轨迹的一半长度,这样就可以得到系统最慢的动力学过程,可以帮助我们快速的了解系统。然后可以使用更小的τ得到更小时间尺度上的动力学过程。这样一种自上而下的分析方式,使得整个分析过程更清晰。
  迹映射算法得到的慢变量可以用于识别亚稳态。得到系统的慢变量之后,可以进一步用时间关联矩阵法和密度峰聚类法等聚类算法在慢变量划分系统的亚稳态。
  
轨迹映射算法得到的慢变量还可以用于增强采样。原则上,增强抽样方法需要的集体变量应该对应系统的慢变量。不论是线性的PCA,还是非线性的Isomap等维数约化方法,都是基于构象样本的静态结构(构象间几何距离)构建反映构象静态差别的函数。在这些分析中,构象间动力学相关性完全没有考虑。由于构象间几何差别并不能完全对应它们在动力学上的不同,这样得到的集体变量实际上并不完全符合增强抽样算法的需求。TM算法给出的慢变量天然提供了增强抽样所需的集体变量,并且其识别亚稳态的能力也为评估增强抽样模拟效果提供了很好的工具。我们把TM算法和Metadynamics方法相结合(记做Tmetadynamics),给出了一个先分析模拟数据构建慢变量、再沿此慢变量增强抽样以扩展模拟的实例。我们通过模拟短发夹蛋白展示了这种结合在增强平衡抽样效率、扩展构象空间扫描范围,以及构建系统平衡自由能面等的能力。
  关于轨迹映射理论基础和应用实例的更多资料可以参阅。

  1. Gong Linchen, Zhou Xin. Kinetic transition network based on trajectory mapping. J. Phys. Chem. B 114, 10266–10276 (2010).
  2. Gong Linchen, Zhou Xin, Ouyang Zhongcan. Systematically constructing kinetic transition network in polypeptide from top to down: trajectory mapping. PLoS One 10, e0125932 (2015).
  3. Zhang Chuanbiao, Yu Jin, Zhou, Xin. Imaging Metastable States and Transitions in Proteins by Trajectory Map. J. Phys. Chem. B 121, 4678–4686 (2017).
  4. Zhang Chuanbiao, Xu Shun, Zhou Xin. Identifying metastable states of biomolecules by trajectory mapping and density peak clustering. Phys. Rev. E 100, 33301 (2019).
  5. Zhang Chuanbiao, Xin Zhou*, Find Slow Dynamic Modes via Analyzing Molecular Dynamics Simulation Trajectories, Chin Phys B, accepted (2020).

  关于轨迹映射用于增强采样的更多资料可以参阅。

  1. Zhang Chuanbiao, Ye Fangfu, Li Ming, Zhou Xin. Enhanced sampling based on slow variables of trajectory mapping. Sci. CHINA Physics, Mech. Astron. 62, 67012 (2019).