6t体育RNA 速度可以在不依赖于用户输入初始状态标注的情况下预测细胞命运,同时其所建立的动态模型具有良好的可解释性。
自从 2018 年 RNA 速度的概念被提出至今,它一直是国际前沿的研究热点之一。
RNA 速度,指的是 RNA 的表达量随时间的变化率,可以理解为是细胞在基因表达空间内的位移随时间的变化率。
据了解,此前的 RNA 模型大多基于单基因的剪切信号。而单基因剪切信号主要存在两个方面的问题:
单细胞转录组本身就存在噪声高、稀疏性高等缺点,因此仅仅依赖于单一基因的表达数据建模,效果会严重受到数据质量的制约。
对于剪切过程而言,其时间尺度可能仅仅只有几十秒,远小于整个单细胞转录组数据集中所刻画的分化过程。
因此,从剪切到剪切 RNA 的时间滞后关系,很有可能无法从相位图中观测到,自然也就无法建模。
RNA 速度最主要的特色在于:可以在相位图上,针对存在时间滞后关系的两个变量进行拟合。
通过提出数学方程,可以针对剪切过程进行刻画。从而在相位图上,假定未剪切 RNA 和剪切 RNA 的联合分布,将形成一个逆时针旋转的曲线。
但是,在实际数据中该团队发现剪切 RNA 和未剪切 RNA 表达量的分布,往往无法满足这些模型假设,因此无法实现准确的拟合。
此前,课题组已经注意到转录因子和靶基因之间会形成圆环状的联合分布6t体育6t体育,因此产生了使用基因间转录调控关系,取代剪切信号建模 RNA 速度的想法。
一开始,他们尝试建立单转录因子到靶基因的动态模型,但是效果不够理想,因为转录过程之中大概率存在多个转录因子的共同作用。
当时,领域内的学者普遍采用 bottom-up 的建模策略。即先提出一个微分方程,然后求出解析解,再基于解析解来优化模型。
这样一来,一旦把模型建得比较复杂,比如同时考虑多个转录因子,就会出现微分方程无解析解的情况,从而导致项目无法推进。
在港大课题组的方法中,研究人员提供了 top-down 的建模思路,即直接将基因表达建模为时间的函数,从而无需求解任何微分方程。
于是,他们想到 了广义最大期望值(EM,Expectation Maximization)算法。通过生成一 个仿真数据集,他们针对所开发的广义 EM 算法加以初步验证。
确认有效之后,针对真实单细胞转录组数据,该团队开始进行算法开发和实验。最终,他们在多个数据集上均取得不错的效果。
如前所述,以前的模型大多基于单基因的剪切信号,而 TFvelo 方法则基于多基因之间的转录调控关系,因此后者能够提升模型的准确度。
一方面,建模过程可以利用多个转录因子的信息,从而克服单基因建模时所面临的数据质量差、信号不足的问题。
另一方面,基因调控过程的时间尺度可以达到数个小时,因此转录因子和靶基因之间的滞后更容易被捕获。
所以,TFvelo 能够利用更好的数据基础,针对基因表达的动态变化进行建模。
另据悉,TFvelo 的输入是每个基因细胞中的表达量,TFvelo 的输出则是每个基因在细胞中表达量的变化率。同时,TFvelo 方法基于多基因间的转录调控关系。
所以,TFvelo 可以更好地拟合各个基因表达量的变化,针对细胞命运进行预测。
同时,基于 TFvelo 的结果,还能提供一些转录调控上的分析,以用于鉴定关键的转录因子。
此外,TFvelo 可被用于预测细胞命运、以及分析其中起到关键作用的转录因子。在肿瘤组织中,TFvelo 可以预测病理分析和发展,以及鉴定关键的致病基因。
一是和具体应用相结合,分析疾病的发生和发展过程中的细胞命运和关键转录调控关系。
01/ 科学家开发新型荧光聚合物,可写入亚微米级像素的隐形文字与图像,助力信息安全与商标防伪
02/ 西交大团队将AI用于电池建模和健康管理,成功打造物理信息神经网络,在三十万余个样本上验证的平均绝对百分比误差低于1%
03/ 连续工作11天吸附性能仍为100%,科学家成功研发带电吸附剂,已着手开发空气直接碳捕集系统
04/ 科学家制备仿钻石超结构,兼具光物理性能和光催化性能,可用于构建纳米尺度的电子器件
05/ 科学家发现氢气制备新机制,并重新评估水氧化催化剂设计原理,为研究铱基材料带来新见解
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
重磅:大批中国留学生申请澳洲庇护!数字惊人!许多中国家长赴澳陪读,放弃高薪工作...
26岁小伙徒步193天从海南到甘肃,出发前负债2万,直播一天赚2000
美洲杯-劳塔罗第112分钟绝杀梅西伤退 阿根廷1-0哥伦比亚连续3届大赛夺冠
与中坚力量共成长,2024建信信托艺术大奖评委会特别奖获奖艺术家凌海鹏