醫苑通
完美適配各類(lèi)中小醫院和診所的云HIS系統,診所管理軟件
行業(yè)資訊
醫療管理系統 網(wǎng)推薦
華為云與北大BIOPIC結合公布卵白質(zhì)多序列比對
醫療管理系統 網(wǎng)給您推薦一篇行業(yè)文章,主要內容是,近日,華為與北京大學(xué)生物醫學(xué)前沿創(chuàng )新中心(BIOPIC)、北京大學(xué)化學(xué)與分子工程學(xué)院、深圳灣實(shí)驗室高毅勤教授課題組聯(lián)合推出蛋白質(zhì)多序列比對(Protein 果您感興趣,請閱讀后面的詳細內容, 醫療管理系統 網(wǎng)提供國內最優(yōu)秀的醫療管理系統 ,由 北京昊合醫療科技有限公司研發(fā),醫療管理系統 經(jīng)過(guò)了十多年的完善和升級,現在功能強大,操作簡(jiǎn)單, 用戶(hù)遍及全國各地,如果您感興趣,可以隨時(shí)聯(lián)系我們。
克日,華為與北京大門(mén)生物醫學(xué)前沿立異中間(BIOPIC)、北京大學(xué)化學(xué)與份子工程學(xué)院、深圳灣嘗試室高毅勤傳授課題組結合推出卵白質(zhì)多序列比對(ProteinMSA)數據集,期望在尺度化的數據集根底上,支持研討職員開(kāi)辟先輩的AI模子,加深對卵白質(zhì)構造、功用和退化的認知,并停止卵白設想與革新。此數據集將公布于華為云AIGallery平臺,相干代碼及數據集闡明將依托于華為全場(chǎng)景AI計較框架MindSpore停止開(kāi)源開(kāi)放、按期擴大與保護,旨在為全球相干的產(chǎn)、學(xué)、研團隊供給優(yōu)良的數據同享處理計劃。本次開(kāi)源的ProteinMSA數據集完整籠蓋最新版本(2021年2月公布)的UniRef50數據庫中的卵白質(zhì)序列,接納學(xué)術(shù)界的“金尺度”搜刮辦法,對約0.5億條卵白序列停止了充實(shí)的MSA搜刮與比對(MSA均勻深度大于1000),是今朝天下范疇內范圍最大、參考數據集最新、籠蓋度最廣的開(kāi)源卵白質(zhì)MSA數據集(之前最大的開(kāi)源MSA數據集包羅10萬(wàn)個(gè)卵白MSA)【1】。人類(lèi)已知的卵白質(zhì)序列曾經(jīng)超越4.4億條,但僅憑這些卵白質(zhì)單序列數據庫,很難理解卵白之間的干系。ProteinMSA數據庫是一個(gè)對差別卵白質(zhì)序列之間的干系停止了標識表記標的大范圍“干系型”數據庫,被標識表記標為聯(lián)系關(guān)系的卵白質(zhì)序列之間的類(lèi)似度、退化干系、漸變地點(diǎn)位點(diǎn)的散布等信息對卵白質(zhì)構造和功用的猜測極其主要。為了更好地效勞于跨范疇的研討職員,ProteinMSA數據集將被構造成具有多重形狀的數據格局。原始數據集(近30T)將以UniRef系列數據庫【2】和UniClust數據庫【3】的尺度文本情勢存儲,并根據序列長(cháng)度停止朋分與緊縮。為了便于A(yíng)I范疇的研討職員間接利用,ProteinMSA數據集還會(huì )將文本格局的數據集轉化為浮點(diǎn)數張量范例緊縮存儲,并對已有的AI框架如MindSpore停止數據接口的撐持。高毅勤傳授暗示:“我們鼓舞并等待來(lái)自生物信息學(xué)、數據迷信和AI研討等范疇的專(zhuān)家和人材充實(shí)碰撞與協(xié)作,引入、改良或設想全新的AI模子,來(lái)充實(shí)地發(fā)掘ProteinMSA數據集合所躲藏的‘天然的機密’”。從迷信的角度看,MSA的數目和質(zhì)量很大水平上影響了今朝最先輩構造模子的猜測速率和精度,并且發(fā)生MSA的非參數化算法還是諸多卵白猜測辦法中決議速率的次要步調之一。因而,ProteinMSA數據庫自己能夠作為這些構造猜測模子的預鍛煉質(zhì)料,用來(lái)發(fā)掘序列信息以至疾速天生新的序列特性,這對處理研討、設想卵白質(zhì)中所面對的高變異序列和孤兒序列等成績(jì)具有宏大的潛伏代價(jià)。此次數據庫的公布,依托于華為云AI
Gallery平臺,可以充實(shí)保證國表里用戶(hù)關(guān)于數據集的會(huì )見(jiàn)和下載,并供給可連續更新與擴大的先輩數據保護計劃和下流AI使用與布置的相干撐持,交融了產(chǎn)、學(xué)、研相分離的研討形式的劣勢。別的,華為也與北京大學(xué)高毅勤課題組結合開(kāi)辟并開(kāi)源了首個(gè)國產(chǎn)份子動(dòng)力學(xué)軟件MindSponge。將來(lái),華為將牽手更多的學(xué)術(shù)科研界協(xié)作同伴,在質(zhì)料、生物、醫藥等更普遍的迷信計較范疇打造數據鞭策的研討新形式。數據集開(kāi)源闡明:https://gitee.com/mindspore/mindscience/tree/master/MindSPONGE/protein_msa數據集下載地點(diǎn):【1】AlQuraishi,ProteinNet: a standardized data set for machine learning of protein structure.bioinformatics【2】Suzek,Consortium.comprehensivealternativeBioinformatics,【3】Mirditaalignments,
近日,華為與北京大學(xué)生物醫學(xué)前沿創(chuàng )新中心(BIOPIC)、北京大學(xué)化學(xué)與分子工程學(xué)院、深圳灣實(shí)驗室高毅勤教授課題組聯(lián)合推出蛋白質(zhì)多序列比對(Protein,我公司是一家專(zhuān)業(yè)從事醫療管理系統 十余年高科技公司,公司的醫療管理系統 ,目前用戶(hù)遍及全國各地,它價(jià)格低廉,部署簡(jiǎn)單,極易上手,是醫院管理者管理決策的好幫手。如有需要請聯(lián)系我們:
北京昊合醫療科技有限公司
地址:北京市朝陽(yáng)區八里莊西里98號3號樓2301室
電話(huà):010-86209858
郵箱:gaohua.li@haohegroup.com
手機:13366677825
QQ:365143782
聯(lián)系人:黎經(jīng)理
手機:13366677825
電話(huà):010-86209858
Q Q:365143782
郵箱:gaohua.li@haohegroup.com