学科分类
/ 1
7 个结果
  • 简介:ChengandChurchalgorithmisanimportantapproachinbiclusteringalgorithms.Inthispaper,theprocessoftheextendedspaceinthesecondstageofChengandChurchalgorithmisimprovedandtheselectionsoftwoimportantparametersarediscussed.Theresultsoftheimprovedalgorithmusedinthegeneexpressionspectrumanalysisshowthat,comparedwithChengandChurchalgorithm,thequalityofclusteringresultsisenhancedobviously,theminingexpressionmodelsarebetter,andthedatapossessastrongconsistencywithfluctuationontheconditionwhilethecomputationaltimedoesnotincreasesignificantly.

  • 标签: 基因表达 光谱分析 计算方法 生物信息
  • 简介:DNAsequencescanbetreatedasfinite-lengthsymbolstringsoverafour-letteralphabet(A,C,T,G).Asauniversalandcomputablecomplexitymeasure,LZcomplexityisvalidtodescribethecomplexityofDNAsequences.Inthisstudy,aconceptofconditionalLZcomplexitybetweentwosequencesisproposedaccordingtotheprincipleofLZcomplexitymeasure.AnLZcomplexitydistancemetricbetweentwononnullsequencesisdefinedbyutilizingconditionalLZcomplexity.BasedonLZcomplexitydistance,aphylogenetictreeof26speciesofplacentalmammals(Eutheria)withthreeoutgroupspecieswasreconstructedfromtheircompletemitochondrialgenomes.Onthedebatethatwhichtwoofthethreemaingroupsofplacentalmammals,namelyPrimates,Ferungulates,andRodents,aremorecloselyrelated,thephylogenetictreereconstructedbasedonLZcomplexitydistancesupportsthesuggestionthatPrimatesandFerungulatesaremorecloselyrelated.

  • 标签: DNA序列 种类 动物 植物
  • 简介:Phytocystatins组成调整内长或外长的半胱氨酸朊酶的活动的一个multigene家庭。象小麦一样的谷物庄稼被大量的病原体连续地威胁,因此在决定植物反应起一个枢轴的作用的cystatins提议。以便学习有各种各样的cystatins的多样的特性和活动的需要,我们与12米饭,七棵大麦,一蜀黍和采用不同生物信息学工具的十个玉米cystatin序列进行了六小麦cystatins(WC)的比较分析。高度识别的获得的结果在考虑的所有cystatins保存了签名序列。几个另外的主题也被识别,基于哪个序列能与种系发生的聚类在一致被分成组。WC当模特儿的相同揭示了结构的拓扑学那么好由另外的cystatins分享了的3D。有papain的WC的Proteinprotein相互作用支持了功能的差异高度是在氨基酸残余在的存在差别的后果的观点保存以及少些相对保存了主题。因此在顺序、结构的层次有重要保存;然而,伴随物变化在这个蛋白质家庭维持功能的差异,它常常调制自己互给差异当抵抗半胱氨酸朊酶时。

  • 标签: 植物多样性 序列分析 结构拓扑 小麦 半胱氨酸蛋白酶 蛋白质相互作用
  • 简介:单个核苷酸多型性(SNP)是决定任何二个无关的个人之间的差别的基因变化。各种各样的人口组能用SNP与对方被区分开来。例如,HapMap数据集与大约1000万SNP有四个人口组。为人的进化,种族变化,和人口赋值上的更多的卓见,我们建议发现哪个SNP在决定人口组是重要的然后作为输入特征用这些相关SNP分类不同人口。在这研究,我们开发了评价措施的修改t测试并且把它用于HapMap遗传型数据。第一,我们为赋值包括F统计和增进知识的海角与另外的特征重要性措施比较评价所有SNP。第二,我们作为输入选择最高度评价的SNP的不同数字到一个分类器,例如支持向量机器,以便发现最好的特征相应于最好的分类精确性的子集。试验性的结果证明建议方法在发现在决定人口组是重要的SNP是很有效的,与减少的计算负担和更好的分类精确性。

  • 标签: SNP SVM 基因型数据 统计方法
  • 简介:Thethree-dimensional(3D)structurepredictionofproteinsisanimportanttaskinbioinformatics.Findingenergyfunctionsthatcanbetterrepresentresidue-residueandresidue-solventinteractionsisacrucialwaytoimprovethepredictionaccuracy.Thewidelyusedcontactenergyfunctionsmostlyonlyconsiderthecontactfrequencybetweendifferenttypesofresidues;however,wefindthatthecontactfrequencyalsorelatestotheresiduehydrophobicenvironment.Accordingly,wepresentanimprovedcontactenergyfunctiontointegratethetwofactors,whichcanreflecttheinfluenceofhydrophobicinteractiononthestabilizationofprotein3Dstructuremoreeffectively.Furthermore,afoldrecognition(threading)approachbasedonthisenergyfunctionisdeveloped.Thetestingresultsobtainedwith20randomlyselectedproteinsdemonstratethat,comparedwithcommoncontactenergyfunctions,theproposedenergyfunctioncanimprovetheaccuracyofthefoldtemplatepredictionfrom20%to50%,andcanalsoimprovetheaccuracyofthesequence-templatealignmentfrom35%to65%.

  • 标签: 狂犬病 功能 蛋白识别 疾病预防
  • 简介:WedescribetheGALT-Protdatabaseanditsrelatedweb-basedapplicationthathavebeendevelopedtocollectinformationaboutthestructuralandfunctionaleffectsofmutationsonthehumanenzymegalactose-1-phosphateuridyltransferase(GALT)involvedinthegeneticdiseasenamedgalactosemiatypeI.Besidesalistofmissensemutationsatgeneandproteinsequencelevels,GALT-ProtreportstheanalysisresultsofmutantGALTstructures.Inadditiontothestructuralinformationaboutthewild-typeenzyme,thedatabasealsoincludesstructuresofover100singlepointmutantssimulatedbymeansofacomputationalprocedure,andtheanalysistoeachmutantwasmadewithseveralbioinformaticsprogramsinordertoinvestigatetheeffectofthemutations.Theweb-basedinterfaceallowsqueryingofthedatabase,andseverallinksarealsoprovidedinordertoguaranteeahighintegrationwithotherresourcesalreadypresentontheweb.Moreover,thearchitectureofthedatabaseandthewebapplicationisflexibleandcanbeeasilyadaptedtostoredatarelatedtootherproteinswithpointmutations.GALT-Protisfreelyavailableathttp://bioinformatica.isa.cnr.it/GALT/.

  • 标签: 蛋白质数据库 生物信息资源 突变体 半乳糖 结构 WEB应用程序
  • 简介:人的造血作用用控制干细胞区别的技术被评估,二维的胶化基于电气泳动的proteomics,和功能的基因组学。我们提供神经胶质成熟因素鲸鱼群妈(GMFG)是cytokine应答的蛋白质在的第一份报告导致erythropoietin并且刺激导致因素的造血的系开发的granulocyte殖民地。从全球功能的基因组学分析的结果显示GMFG拥有几个另外的特征:造血的织物特定的基因表示,与高分数的造血作用特定的抄写因素集中的一个倡导者,和有一个原始血/免疫者系统的可能的分子的coevolution。根据我们的调查结果,我们假设那GMFG是可以调停的造血特定的蛋白质人的造血的干细胞的pluripotentiality和系承诺。

  • 标签: 神经胶质 细胞因子 造血系统 染色体