The FASTA filformat som brukes til å lagre sekvens data fra nukleinsyrer eller peptider . Flere sekvenser kan lagres i en enkelt fil , kalt en multi- FASTA fil . Sekvenser data er formatert som en kort overskriftslinje identifisere sekvensen og sekvensdataene etter en ny linje . Ved å lokalisere topp- sekvens i en multi- FASTA fil med Perl- kommandoer , er det mulig å trekke ut de enkelte sekvenser fra en multi- FASTA fil . Instruksjoner
en
Åpne en teksteditor med en tom tekstfil for å begynne et nytt Perl program .
2
Begynn program ved å angi plasseringen av Perl på systemet ditt . Dette er normalt " /usr /bin /perl " eller " /usr /local /bin /perl . "
#! /Usr /bin /perl
3
Import den "strenge " og " fil :: basename " biblioteker . "Fil :: Basisnavn " bibliotek støtter analyseringen av filbaner og utvidelser. Den " strenge " bibliotek begrenser usikre konstruerer, kaster en feil under kompilering snarere enn under kjøring.
Bruk strictuse File :: Basisnavn
4
Les argumentet variabel fra kommandolinjen . Programmet, bør du velge å gi den navnet " fasta_extract.pl , " vil forvente å bli gitt plasseringen av en FASTA fil og parametere å velge sekvenser for å trekke ut . Den første parameteren vil være en FASTA filnavnet og andre vil være en streng for mønstergjenkjenning . Argument variable hentes fra " $ ARGV " array
min $ fasta_file = $ ARGV [ 0 ]; . Min $ mønster = $ ARGV [ 1 ];
5
Åpen den FASTA filen ved hjelp av "open ( ) "-funksjonen . Du vil spesifisere at programmet avsluttes hvis det ikke kan åpne filen ved hjelp av "die "-kommandoen
åpen ( KILDE, $ fasta_file )