Comment convertir un fichier txt à FastA

Des études cliniques sont réalisées pour analyser les données de séquences de protéines et de trouver des traitements pour les maladies. les données de séquence de la protéine est mis dans le FASTA (fast-tout) format afin que les programmes de logiciels à comprendre comment traiter la séquence de données. Le format FASTA a jusqu'à 80 caractères par ligne de données de séquence et utilise le IUB / IUPAC (International Union of Biochemistry / Union internationale de chimie pure et appliquée) norme de code. Conversion d'un TXT (texte brut) fichier au format FASTA implique éditer ou ajouter des données de séquence FASTA formaté dans un fichier texte existant avec des lignes de données de séquences de protéines. les programmes d'édition de texte comme Notepad font de cette simple à faire.




Instructions

  1. Ouvrez le fichier texte de séquence de la protéine que vous souhaitez modifier dans un programme d'édition de texte tel que Notepad.

  2. Modifier ou ajouter la ligne de description de suivre le format FASTA. Par exemple, gt; gi | 129295 | sp | P01013 | OVAX_CHICK GENE protéine X (ovalbumine CONNEXES) est une ligne de description FASTA valide. Cette ligne fournit une description unique pour les lignes de données de séquences qui suivent. Le format FASTA nécessite l'utilisation du symbole supérieur (gt;) de sorte que le logiciel peut identifier les informations descriptives unique et d'éviter le traitement de la description de ligne de séquence de données de protéines.

  3. Appuyez sur la "Entrer" touche pour insérer un saut de ligne, une fois la ligne de description est édité.

  4. Modifier ou ajouter le format de ligne de données de séquences de protéines à se conformer aux codes standard IUB / IUPAC. La norme IUB / IUPAC utilise les lettres de l'alphabet pour représenter les codes acceptables ou des séquences de requêtes pour des acides aminés ou des acides nucléiques dans le format FASTA. Par exemple, QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAE
    représente une ligne de données de séquence valides, car il commence par la lettre "Q," qui représente la glutamine, et se termine par la lettre "E," représentant glutamate.

  5. Ajouter plus de lignes de données de séquence, modifier les lignes existantes de données de séquence ou ajouter des sauts de ligne après 80 caractères au besoin. En respectant les normes de lignes de données de séquence FASTA et des sauts de ligne assure que le programme suit les instructions relatives à la glutamine, le glutamate et d'autres codes de lettres. Les lettres de la norme IUB / IUPAC sont tout simplement des instructions au logiciel qui traite les données FASTA formaté.

  6. Cliquez "Fichier," sélectionner "Sauvegarder" puis cliquez sur le "Sauvegarder" bouton. Votre fichier TXT est maintenant en format FASTA.

» » » » Comment convertir un fichier txt à FastA