91麻豆五十路|果冻传媒一区|91制片厂收费吗|国产尤物av午夜精品一区二区|科普一下天美传媒|精品亚洲成a人在线|麻豆传媒映画男优一阿伟|国产精品熟女91九色|麻豆传媒映画映百科全书|自拍区偷拍亚洲最新,精东影业精一禾传媒,麻豆映画传媒安卓下载,糖心系列唐伯虎vlog已更新

北理工團隊合作基于遷移學(xué)習(xí)生成物種特異性啟動子方面取得重要進展


近日,,北京理工大學(xué)霍毅欣教授與郭淑元教授團隊在基于生成式機器學(xué)習(xí)生成物種特異性啟動子方面取得重要進展。相關(guān)研究成果以“Species-specific design of artificial promoters by transfer-learning based generative deep-learning model”為題發(fā)表在頂級期刊《Nucleic Acids Research》(影響因子:14.9),。該工作以北京理工大學(xué)為第一通訊單位,,博士生夏燕為第一作者,霍毅欣教授與郭淑元教授為共同通訊作者,。

啟動子是在轉(zhuǎn)錄水平上調(diào)節(jié)基因表達的關(guān)鍵元件,,能夠啟動基因轉(zhuǎn)錄、調(diào)節(jié)基因表達,,并影響代謝途徑中的代謝流分布,。盡管天然啟動子已被用于基因調(diào)控,,但其缺乏連續(xù)的調(diào)控強度和廣泛的調(diào)控范圍。目前,,深度學(xué)習(xí)在蛋白質(zhì)設(shè)計,、調(diào)控元件生成等領(lǐng)域已經(jīng)取得了一定的進展,但是在數(shù)據(jù)集缺乏的條件下還不能生成質(zhì)量較高的調(diào)控元件,。為了解決原核生物啟動子數(shù)據(jù)量不足的問題,,我們基于遷移學(xué)習(xí)的策略,開發(fā)了一系列核苷酸語言模型 PromoGen,,用于在數(shù)據(jù)缺乏的條件下從頭生成物種特異性的啟動子(圖1),。

8ba7d169a78f48c790b2c31921a657a9.png

圖1 基于核苷酸語言模型的啟動子設(shè)計架構(gòu)

通過位置權(quán)重矩陣、6聚體頻率相關(guān)性和 -10 區(qū)域分布分別對 B. subtilis 的PromoGen-bsu模型生成啟動子的能力進行分析,。并對PromoGen-bsu生成的啟動子進行濕實驗驗證,,結(jié)果表明72.7%的生成啟動子的活性高于天然啟動子PlepA的啟動活性的三倍,18%的啟動子與天然強啟動子活性水平相當(dāng)(圖2),。

066082c82921458f93baec2459598782.png

圖2 生成啟動子在枯草芽胞桿菌中的活性驗證

為了證明遷移學(xué)習(xí)策略的有效性,,分別使用27個物種的啟動子的數(shù)據(jù),在PromoGen-pre上對其進行微調(diào),,得到了27個物種的生成模型,。并對所有的模型進行預(yù)訓(xùn)練和微調(diào)性能評估,微調(diào)后的32%的模型相關(guān)性超過0.8,。此外,,我們開發(fā)了一個在線平臺(https://promogen1.cloudmol.org/),該平臺針對27種原核生物提供了微調(diào)后模型來從頭生成啟動子(圖3),。

8ea72d900edc49339d65bcfb444465e9.png

圖3 網(wǎng)絡(luò)服務(wù)器示意圖

此項工作得到了國家重點研發(fā)計劃(Grant No. 2021YFC2100500),,國家自然科學(xué)基金委(Grant No. 32370095, 32371489, 62325202)和唐山市科技計劃(Grant No. 23130228E)基金的支持。


分享到: