Care este diferența dintre FASTA și FASTQ

Cuprins:

Care este diferența dintre FASTA și FASTQ
Care este diferența dintre FASTA și FASTQ

Video: Care este diferența dintre FASTA și FASTQ

Video: Care este diferența dintre FASTA și FASTQ
Video: Difference between FASTA and FASTQ file formats. How to make a fasta formatted file. 2024, Iulie
Anonim

Diferența cheie dintre FASTA și FASTQ este că FASTA este un format bazat pe text care stochează doar secvențe de nucleotide sau proteine, în timp ce FASTQ este un format bazat pe text care stochează atât secvența, cât și valorile de calitate ale secvenței asociate.

Bioinformatica este un domeniu care utilizează software diferit pentru a analiza și înțelege datele biologice, mai ales atunci când setul de date este complex și mare. Acest domeniu combină biologia, chimia, fizica, informatica, ingineria informației, matematica și statistica pentru a analiza și interpreta datele biologice. FASTA și FASTQ sunt două formate de reprezentare a secvenței în domeniul bioinformaticii pentru a alinia și analiza secvențe. De fapt, FASTQ este un format de fișier de secvență care extinde formatul FASTA cu capacitatea de a stoca calitatea secvenței.

Ce este FASTA?

FASTA este un software de aliniere pentru secvența de ADN și proteine. Software-ul FASTA utilizează formatul FASTA. Este un format bazat pe text care reprezintă fie secvențe de nucleotide, fie secvențe de aminoacizi (proteine). Aici, codurile cu o singură literă reprezintă ambele secvențe. FASTA este un instrument important în domeniile bioinformaticii și biochimiei. Acest format permite ca numele și comentariile secvențelor să precedă secvențele.

FASTA vs FASTQ în formă tabelară
FASTA vs FASTQ în formă tabelară

Figura 01: Secvența FASTA

Acest format provine din software-ul FASTA și a fost introdus de David J. Lipmann și William R. Pearson în 1985. Instrumentul FASTA a avut multe modificări de-a lungul timpului, iar cea mai recentă versiune constă din programe pentru proteină:proteină, ADN:ADN, proteină:ADN tradus (cu deplasări de cadre) și căutări de peptide ordonate sau neordonate. FASTA citește o anumită secvență de nucleotide sau aminoacizi și caută baza de date de secvențe corespunzătoare utilizând alinierea secvenței locale pentru a găsi potriviri ale secvențelor de bază de date similare.

Ce este FASTQ?

FASTQ este un software de aliniere utilizat în domeniul bioinformaticii, care stochează atât o secvență biologică (de obicei secvență de nucleotide), cât și scorurile de calitate corespunzătoare. FASTQ a fost dezvoltat inițial pentru a combina o secvență formatată FASTA și datele de calitate aferente de Wellcome Trust Sanger Institute. Odată cu dezvoltarea în domeniul bioinformaticii, FASTQ a devenit standardul de facto pentru stocarea rezultatelor multor instrumente de secvențiere cu randament ridicat.

Formatul FASTQ folosește patru linii diferite pe secvență. Linia 1 începe cu caracterul @ și este urmată de un identificator de secvență (similar cu o linie de titlu FASTA). Linia 2 constă din litere de secvență brută. În rândul 3, secvența începe cu un caracter „+” și este urmată opțional de același identificator de secvență. Linia 4 codifică valorile de calitate pentru secvența din rândul 2 și ar trebui să conțină același număr de simboluri ca și literele din secvență.

Care sunt asemănările dintre FASTA și FASTQ?

  • FASTA și FASTQ sunt instrumente de aliniere.
  • Sunt două formate de reprezentare a secvenței.
  • Ambele sunt legate de domeniul bioinformaticii.
  • Atât FAST, cât și FASTQ sunt instrumente importante pentru stocare și succesiune.
  • FASTQ este o extensie a formatului FASTA cu capacitatea de a stoca calitatea secvenței.

Care este diferența dintre FASTA și FASTQ?

FASTA este un format bazat pe text care stochează numai secvențe de nucleotide sau proteine, în timp ce FASTQ este un format bazat pe text care stochează atât valorile de calitate ale secvenței, cât și ale secvenței asociate. Astfel, aceasta este diferența cheie dintre FASTA și FASTQ. Mai mult, FASTA stochează fragmente de secvență după ce au fost mapate, în timp ce FASTQ stochează fragmente de secvență înainte de mapare. În plus, o altă diferență între FASTA și FASTQ este că FASTA constă dintr-o linie de descriere, iar FASTAQ constă din patru rânduri.

Infograficul de mai jos prezintă diferențele dintre FASTA și FASTQ sub formă tabelară pentru comparație una lângă alta.

Rezumat – FASTA vs FASTQ

Bioinformatica folosește diferite formate de secvențe, cum ar fi FASTA și FASTQ, etc. FASTA stochează fragmente de secvență după ce au fost mapate, în timp ce FASTQ stochează fragmentele de secvență înainte de mapare. FASTA este un software de aliniere pentru secvențele de ADN și proteine. Constă din programe pentru proteină:proteină, ADN:ADN, proteină:ADN tradus (cu deplasări de cadre) și căutări ordonate sau neordonate de peptide. FASTQ este un software de aliniere utilizat în domeniul bioinformaticii și stochează atât o secvență biologică (de obicei secvență de nucleotide), cât și scorurile de calitate corespunzătoare. FASTA este alcătuit dintr-o linie de descriere, iar FASTQ este format din patru rânduri. Deci, aceasta rezumă diferența dintre FASTA și FASTQ.

Recomandat: