DeepSEED是由清华大学自动化系汪小我教授团队研发的人工智能辅助启动子设计工具,核心成员包括博士研究生张鹏程、王昊晨、许涵文等。 该团队创新性地将专家知识与深度学习结合,解决了合成生物学中启动子设计的高维度、小样本难题,研究成果发表于《Nature Communications》。
-
核心团队构成:项目由汪小我教授领衔,第一作者团队由张鹏程、王昊晨、许涵文三位青年研究者组成,清华大学魏磊、刘莉扬、胡志睿等学者也参与贡献。团队在生物信息学与AI交叉领域具有深厚积累,获得国家自然科学基金等多项支持。
-
技术突破点:团队提出“知识引导+数据驱动”双轨策略,开发了包含条件生成对抗网络(cGAN)和DenseNet-LSTM预测模型的混合架构。通过固定专家定义的“种子”序列(如转录因子结合位点),由AI优化旁侧序列,显著提升了大肠杆菌和哺乳动物细胞启动子的转录活性。
-
应用验证成果:在哺乳动物细胞Dox诱导型启动子优化中,83.3%的人工启动子实现诱导倍数提升,且序列多样性与天然基因组差异显著。该方法突破了传统依赖TFBS基序的局限,首次系统验证了旁侧序列对基因调控的关键作用。
当前,DeepSEED已为合成生物学提供了可定制化的启动子设计工具,未来或进一步拓展至其他遗传元件优化领域。研究者可通过指定生物调控序列作为“种子”,快速生成高性能合成启动子。