FASTA er en tekst - basert format som brukes i bioinformatikk for å representere sekvenser , spesielt de av nukleotider og peptider , med basepar representert av en enkelt bokstav . En FASTA -sekvens består av en enkelt - linje beskrivelse , kjennetegnet av en " større enn "-symbolet for den første linje , fulgt av en flerlinjet nukleotid- eller peptidsekvens . Du kan trekke flere sekvenser fra en FASTA fil ved hjelp av spesielle moduler, eller add- ons , til Perl programmeringsspråk , kjent som BioPerl , som er spesielt utviklet for å håndtere FASTA format. Du kan også manuelt kode et Perl-skript for å matche mønstre i en fil eller bruke andre tilgjengelige verktøy for å trekke ut FASTA sekvenser . Du trenger
FASTA fil
Perl editor
BioPerl
ActiveState Perl
Biopieces
Vis flere instruksjoner
en
Start din Perl redigering. Du kan bruke en enkel tekst editor , for eksempel Notisblokk . Du må lagre filen med en " . Pl " forlengelse for å indikere at det er et Perl program .
2
Pakk en sekvens fra en multippel - FASTA fil ved å utføre mønstergjenkjenning i Perl , ved å skrive inn følgende kode inn i editoren : en
# /usr /bin /perlmy $ fasta_seq = shift ; min $ sekvens = shift ; min $ workfile = ` cat $ fasta_seq ` ; min ( $ fasta_seq ) = ! $ workfile = ~ /( > $ sekvens [ ^ > ] + ) /s ; print $ fasta_seq ;
3
Pakk ut sekvenser fra FASTA fil ved hjelp BioPerl . Du kan trekke flere sekvenser ved å skrive inn følgende kode inn i editoren : en
# /bin /perl -w
bruk Bio :: SeqIO ;
$ sequenceobject = Bio ! :: SeqIO - > ny ( - file = > " fasta_file_path " , - format = > " fasta ");
Bio :: SeqIO modulen gir sømløs sekvens behandling. Du kan hente en enkelt sekvens med følgende utsagn : en
$ retrievedsequence = $ sequenceobject - > next_seq ;
Du kan sløyfe gjennom objektet og hente flere sekvenser , som følger:
while ( $ retrievedsequence = $ sequenceobject - > next_seq ) { print $ retrievedsequence - > seq , "\\ n "; }
4
Pakk ut sekvenser fra FASTA filen ved hjelp av " Biopieces " program , som er rammeverket som inneholder et sett av modulære verktøy for å manipulere bioinformatikk data . Du kjører din Biopieces kommandoen på kommandolinjen
read_fasta -i fasta_file