pdf

Study on the classification of protein thermostability using Bayesian method

  • 2013-09-17
  • 238.66KB
  • Points it Requires : 2

Amino acid content is the main factor affecting protein heat resistance. This paper uses amino acid content as a feature vector to study the accuracy of Bayesian method in predicting protein heat resistance. The results show that the local prediction rate and global prediction rate based on Bayesian method are 73.1% and 76.1% respectively. This not only shows that Bayesian method is suitable for the classification of protein heat resistance, but also proves that amino acid content does play an important role in protein heat resistance. Organisms on Earth have amazing adaptability to the surrounding environment. Their traces can be found in erupting volcanoes, in the highly salty Dead Sea, and in the icy polar regions. Andrey Karshikoff et al. [1] divided microorganisms into four categories according to their optimal growth temperature: psychrophiles (0℃ < optimal growth temperature < 20℃), mesophiles (20℃ = < optimal growth temperature < 50℃), thermotolerant bacteria (50℃ = < optimal growth temperature < 80℃), and hyperthermophiles (80℃ = < optimal growth temperature < 120℃). Although the proteins of mesophilic bacteria and thermophilic bacteria are composed of the same 20 amino acids, their heat resistance is very different. There are many factors that affect the heat resistance of proteins, mainly including: amino acid content, hydrogen bonds, salt bridges, solvent contact surface area, etc. [2]. For a long time, people believe that amino acid content is the main factor affecting protein heat resistance [3]. Predicting proteins based on heat resistance is the process of protein classification. There are many classification methods, mainly support vector machines [4], neural networks [5], KNN [6], etc. Bayesian is a classifier based on Bayesian statistical learning methods. This paper studies the accuracy of Bayesian method in predicting protein heat resistance using amino acid content as the feature vector. This can not only determine whether the Bayesian method is suitable for protein heat resistance classification, but also determine whether amino acid content is the main factor affecting protein heat resistance.

unfold

You Might Like

Uploader
csdn_can
 

Recommended ContentMore

Popular Components

Just Take a LookMore

EEWorld
subscription
account

EEWorld
service
account

Automotive
development
circle

About Us Customer Service Contact Information Datasheet Sitemap LatestNews


Room 1530, 15th Floor, Building B, No.18 Zhongguancun Street, Haidian District, Beijing, Postal Code: 100190 China Telephone: 008610 8235 0740

Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号
×