行业资讯
临床知识库系统网深度好文
华为云与北大BIOPIC结合公布卵白质多序列比对
临床知识库系统网提醒您关注好文,主要内容是,近日,华为与北京大学生物医学前沿创新中心(BIOPIC)、北京大学化学与分子工程学院、深圳湾实验室高毅勤教授课题组联合推出蛋白质多序列比对(Protein 果您感兴趣,请阅读后面的详细内容, 临床知识库系统网提供国内最优秀的临床知识库系统,由 北京昊合医疗科技有限公司研发,如果您刚兴趣,可以随时联系我们。
克日,华为与北京大门生物医学前沿立异中间(BIOPIC)、北京大学化学与份子工程学院、深圳湾尝试室高毅勤传授课题组结合推出卵白质多序列比对(ProteinMSA)数据集,期望在尺度化的数据集根底上,支持研讨职员开辟先辈的AI模子,加深对卵白质构造、功用和退化的认知,并停止卵白设想与革新。此数据集将公布于华为云AIGallery平台,相干代码及数据集阐明将依托于华为全场景AI计较框架MindSpore停止开源开放、按期扩大与保护,旨在为全球相干的产、学、研团队供给优良的数据同享处理计划。本次开源的ProteinMSA数据集完整笼盖最新版本(2021年2月公布)的UniRef50数据库中的卵白质序列,接纳学术界的“金尺度”搜刮办法,对约0.5亿条卵白序列停止了充实的MSA搜刮与比对(MSA均匀深度大于1000),是今朝天下范畴内范围最大、参考数据集最新、笼盖度最广的开源卵白质MSA数据集(之前最大的开源MSA数据集包罗10万个卵白MSA)【1】。人类已知的卵白质序列曾经超越4.4亿条,但仅凭这些卵白质单序列数据库,很难理解卵白之间的干系。ProteinMSA数据库是一个对差别卵白质序列之间的干系停止了标识表记标的大范围“干系型”数据库,被标识表记标为联系关系的卵白质序列之间的类似度、退化干系、渐变地点位点的散布等信息对卵白质构造和功用的猜测极其主要。为了更好地效劳于跨范畴的研讨职员,ProteinMSA数据集将被构造成具有多重形状的数据格局。原始数据集(近30T)将以UniRef系列数据库【2】和UniClust数据库【3】的尺度文本情势存储,并根据序列长度停止朋分与紧缩。为了便于AI范畴的研讨职员间接利用,ProteinMSA数据集还会将文本格局的数据集转化为浮点数张量范例紧缩存储,并对已有的AI框架如MindSpore停止数据接口的撑持。高毅勤传授暗示:“我们鼓舞并等待来自生物信息学、数据迷信和AI研讨等范畴的专家和人材充实碰撞与协作,引入、改良或设想全新的AI模子,来充实地发掘ProteinMSA数据集合所躲藏的‘天然的机密’”。从迷信的角度看,MSA的数目和质量很大水平上影响了今朝最先辈构造模子的猜测速率和精度,并且发生MSA的非参数化算法还是诸多卵白猜测办法中决议速率的次要步调之一。因而,ProteinMSA数据库自己能够作为这些构造猜测模子的预锻炼质料,用来发掘序列信息以至疾速天生新的序列特性,这对处理研讨、设想卵白质中所面对的高变异序列和孤儿序列等成绩具有宏大的潜伏代价。此次数据库的公布,依托于华为云AI
Gallery平台,可以充实保证国表里用户关于数据集的会见和下载,并供给可连续更新与扩大的先辈数据保护计划和下流AI使用与布置的相干撑持,交融了产、学、研相分离的研讨形式的劣势。别的,华为也与北京大学高毅勤课题组结合开辟并开源了首个国产份子动力学软件MindSponge。将来,华为将牵手更多的学术科研界协作同伴,在质料、生物、医药等更普遍的迷信计较范畴打造数据鞭策的研讨新形式。数据集开源阐明:https://gitee.com/mindspore/mindscience/tree/master/MindSPONGE/protein_msa数据集下载地点:【1】AlQuraishi,ProteinNet: a standardized data set for machine learning of protein structure.bioinformatics【2】Suzek,Consortium.comprehensivealternativeBioinformatics,【3】Mirditaalignments,
本文主要内容是,近日,华为与北京大学生物医学前沿创新中心(BIOPIC)、北京大学化学与分子工程学院、深圳湾实验室高毅勤教授课题组联合推出蛋白质多序列比对(Protein,北京昊合医疗科技有限公司是一家专业从事临床知识库系统十余年高科技公司,公司的临床知识库系统,目前用户遍及全国各地,它价格低廉,部署简单,极易上手,只需要花很小的投入,即可拥有一套先进的临床知识库系统,它能清晰的告诉医院管理者“过去发生什么,正在发生什么, 以及未来怎么发展”的关键管理要素,是医院管理者管理决策的好帮手。如有需要请联系我们:
北京昊合医疗科技有限公司
地址:北京市朝阳区八里庄西里98号3号楼2008室
电话:010-86209858
邮箱:gaohua.li@haohedata.com
手机:13366677825
QQ:365143782