Sekuentzien lerrokatze: berrikuspenen arteko aldeak

Ezabatutako edukia Gehitutako edukia
Savh (eztabaida | ekarpenak)
t Savh wikilariaren aldaketak ezabatuz, AritzD wikilariaren azken bertsiora itzularazi da.
Etiketa: lehengoratzea
No edit summary
1. lerroa:
'''Sekuentzien lerrokatzea''' [[Bioinformatika|bioinformatikako]] arloan bi edo gehiago diren [[Azido desoxirribonukleiko|ADNDNA]], [[Azido erribonukleiko|ARNRNA]] edo egitura [[Proteina|proteiko]] primarioen sekuentziak elkarren artean konparatzeko edo irudikatzeko era bat da. Helburua da sekuentzia hauetan komunak diren zatiak nabarmentzea, erlazio funtzional edo [[Eboluzio|ebolutiboak]] adieraz dezaketenak. Sekuentzia hauek [[matrize]] baten lerroetan irudikatzen dira hizkien bitartez ([[aminoazido]]ak edo [[nukleotido]]ak irudikatuz). Beharrezkoa bada, txuriguneak gehitzen dira estruktura berdina duten sekuentziak lerroka daitezen.
 
[[Fitxategi:Zinc-finger-seq-alignment2.png|erdian|thumb|719x719px]]Nahiz eta ADNDNA eta ARNkoRNAko oinarri nukleotidikoak elkarrekiko berdintsuagoak izan aminoazidoekin baino, oinarrien parekatzeen mantentzeak rol funtzional edo estruktura berdintsuak adierazi lezake. Sekuentzien lerrokatzeak biologikoak ez diren sekuentziekin erabili daitezke, hala nola, hizki serie eta gizakien hitzen identifikazioan edo datu finatzarioen analisian. Proteinen estruktura primarioak konparatzeko hainbat algoritmo aurki ditzazkegu, baina nabarmangarrienak Needleman-Wunch algoritmoa, Smith-Waterman algoritmoa, BLAST eta FASTA dira.
 
Oso motzak edo oso berdintsuak diren sekuentziak eskuz lerrokatu daitezke. Bestalde, problema interesgarrienak eskuz lerrokatu ezin daitezken sekuentzia oso luze, aldagarriak eta oso ugariak erabiltzera behartzen dute. Gizakien adimena kalitatezko lerrokatzeak sortuko dituzten algoritmoak sortzeko erabiltzen da, eta batzuetan azkeneko emaitza estutzeko, algoritmoetan sartzeko oso zailak diren patroiak errepresentatzeko. Hurbilpen konputazioanlak bi kategorietan banatzen dira: ''lerrokatze globala'' eta ''lerrokatze lokala.'' Lerrokatze globala kalkulatzea, optimizazio global mota bat da, lerrokatzeari sartutako sekuentzien luzeera osoa okupatzera behartzen diona. Konparatiboki, lerrokatze lokalak sekuentzia luzeeetako sekzio berdintsuak identifikatzen dituzte, sekuentzia hauek askotan dibergenteak dira haien artean. Askotan lerrokatze lokalak gehiago aukeratzen dira, baina zailagoak izan daitezke berdintasun regio hauen identifikazioa gehitu behar zaielako. Sekuentzien lerrokatzeari hainbat algoritmo konputazional aplikatzen dira, hala nola, metodo motelak, baina [[Optimizazio (matematika)|optimizatzeko]] erabiliak, [[Programazio dinamiko|programazio dinamikoa]] eta metodo [[Heuristika|heuristiko]] edo [[Probabilitate|probabilistiko]] eraginkorrak, datu-base handietan bilatzeko pentsatuak daudenak.
 
== Irudikapenak ==
Lerrokatzeak testuzko eta grafikozko formatuaetan irudikatzen dira. Irudikapen gehienetan, sekuentziak lerro batean idazten dira, non lerrokatutaklo hondakinak ondoz ondoko zutabetan agertzen diren. Textu formatuetan, lerrokatutako zutabeak karaktere berdintsuak dauzkate, mantentze simbolo sistema baten bidez irudikatuak. Hasierako irudian, izartxoak erabiltzen dira bi zutabeen identitatea adierazteko. Sekuentziak irudikatzeko programa askok koloreztatutako eskemak erabiltzen dituzte, sekuentzia bakoitzaren propietateen informazioa adierazteko(ADNDNA eta ARNRNA sekuentzietan, oinarri bakoitzari kolore bat esleitzean datza). Proteinene lerroekatzean, goiko adibidean bezala, koloreak aminoazidoen propietateak adierazteko erabiltzen dira, aminoazidoen ordezkapenean edo kontserbazioaren karazterizazioan laguntzen. Irudikatzean, gutxi erabiltzen diren sinboloak komak(ordezkapen kontserbatioboentzat) edo puntuak(ordezkapen semikontserbatioboentzat) dira. Hainbat sekuentzia sartzen direnean zutabe bakoitzeko azken lerroa, lerrokatzeak definituriko adostasuna errepresentatzen dui normalki. Adostasun sekuentzia formatu grafikoan ere irudikatu ohi da sekuentzia logotipo baten azpian, nukleotido edo aminoazido bakoitzaren hizkiaren neurria kontserbazio mailarekin proportzionala izanik.<ref>{{Erreferentzia|izena=T D|abizena=Schneider|izenburua=Sequence logos: a new way to display consensus sequences.|orrialdeak=6097–6100|abizena2=Stephens|izena2=R M|data=1990-10-25|url=https://www.ncbi.nlm.nih.gov/pmc/articles/PMC332411/|aldizkaria=Nucleic Acids Research|alea=20|zenbakia=18|issn=0305-1048|pmid=2172928|sartze-data=2021-03-01}}</ref>
 
Sekuentzien lerrokatze hauek hainbat textu formatuetan biltegiratu daitezke. Formatu hauek askotan programa bat edo lerrokatze baten implementazio batekin batera garatuak izan dira. Web herraminta gehienak hainabt sarrera eta irteera formatu onartzen dituzte FASTA edo GenBank. Herraminta espezifikoen erabilera laborategi baloitzean konplikatu daiteke konpatibilitate baxuaren ondorioz. Konbertsio generikoko programak existitzen dira SEQRETen edo DNA Baseren
41. lerroa:
 
== Analisi filogenetikoa ==
[[Filogenia]] eta sekuentzien lerrokatzea lotura estua duten eremuak dira, sekuentzien arteko ahaidetasuna ebaluatzeko behar partekatua dutelako. Filogeniak zuhaitz filogenetikoen eraikuntzan eta interpretazioan sekuentzien lerrokatzeen erabilera estentsiboa egiten du, espezie dibergenteen [[Genoma|genoman]] irudikatutako [[gene]] homologoen arteko erlazio ebolutiboak sailkatzeko erabiltzen direnak. Arazo multzo baten sekuentziak zein mailatan diren desberdinak, horien arteko distantzia ebolutiboarekin lotuta dago kualitatiboki. Modu sinplifikatuan, sekuentzien identitate altu batek, konparatiboki, arbaso komun berriago bat dutela iradokitzen du, identitate baxu batek, dibergentzia, urrunagokoa dela iradokitzen duen bitartean. Hurbilketa honek, "[[Erloju molekular|Erloju molekularraren]]" hipotesia islatzen du (eboluzio aldaketaren erritmo gutxi gorabehera konstantea hartzen duen hipotesia, bi geneen lehen dibergentziatik igarotako denbora estrapolatzeko erabil daitekeena, edo "koaleszentzia" denbora), mutazioaren eta [[Hautespen natural|hautespen naturalaren]] eraginak sekuentzia leinuen luzeran konstanteak direla onartzen duena. Beraz, ez ditu kontuan hartzen [[DNAren konpontze|DNA konpontzeko]] erritmoetan organismo edo espezieen artean egon daitezkeen desberdintasunak, edo sekuentzia batean eskualde espezifikoen kontserbazio funtzionala. (Nukleotidoen sekuentzien kasuan, erloju molekularraren hipotesi oinarrizkoenak alde batera uzten du mutazio isilen (kodoi jakin baten esanahia aldatzen ez dutenak) eta proteinan aminoazido desberdin bat sartzean sortzen diren beste mutazio batzuen arteko onarpen-tasen diferentzia). Zehaztasun estatistiko handiagoko metodoek zuhaitz filogenetikoaren adar bakoitzean eboluzio-erritmoa aldatzea ahalbidetzen dute, horrela geneen koaleszentzia-denboren estimazio hobeak eginez.
 
Lerrokatze anizkoitz progresiboko teknikek zuhaitz filogenetiko bat sortzen dute nahitaez, lerrokatze gero eta handiagoari sekuentziak gehitzen baitizkiote ahaidetasun-ordenaren arabera. Sekuentzia eta zuhaitz filogenetikoen lerrokadura anitzak biltzen dituzten beste teknika batzuk, zuhaitzak puntuatzen eta ordenatzen dituzte lehenik, eta, ondoren, sekuentzien lerrokatze anizkoitza kalkulatzen dute puntuazio handiagoko zuhaitzetik abiatuta. Zuhaitz filogenetikoak eraikitzeko metodo komunak heuristikoak dira nagusiki. Zuhaitz optimoa aukeratzeko arazoa, sekuentzia optimoen lerrokatze anizkoitza aukeratzeko arazoa bezala, NP-konplexuak dira.
68. lerroa:
 
* [[Bioinformatika]]
* [[Azido desoxirribonukleiko|ADNDNA]]
* [[Azido erribonukleiko|ARNRNA]]
* [[Hizkuntzaren prozesamendu|Hizkuntzaren prozesamendua]]