Strona główna > biologia, nauka > Drobne różnice edycyjne

Drobne różnice edycyjne

Cząsteczki RNA powstają na matrycy DNA. U eukariotów następny etap to tzw. obróbka posttranskrypcyjna (np. dodawanie czapeczki, ogona poliA i wycinanie intronów). Ale sekwencje egzonów DNA są identyczne z sekwencjami dojrzałego mRNA, prawda? Nie całkiem, bo we wszystkich królestwach organizmów żywych zdarza się, że RNA poddawane jest jeszcze jednemu rodzajowi obróbki – edycji RNA – czyli zmianie sekwencji transkryptu tak, że różni się ona od wyjściowej sekwencji DNA (no i oczywiście zdarzają się błędy w transkrypcji, ale są one bardzo rzadkie). U ssaków zaobserwowano tylko dwa rodzaje edycji RNA. Jeden to przekształcenie cytydyny w urydynę (C-U), a drugi – przekształcenie adenozyny w inozynę (A-I), która zachowuje się jak G. U ludzi A-w-G można znaleźć nieco częściej, a C-w-U bardzo rzadko.

ResearchBlogging.orgW zeszłym tygodniu Science opublikowało nowy artykuł, z ktorego wynika, że takich różnic jest dużo więcej, niż się do tej pory wydawało, a do tego nie są ograniczone do edycji typu A-w-G i C-w-U.  Porównując transkrypty RNA i sekwencje DNA pochodzące od 27 osób (próbki uzyskano w ramach 1000 Genomes Project i HapMap Project) naukowcy znaleźli ponad 10 000 miejsc w ponad 4 000 genów, gdzie występowały różnice między sekwencją RNA a DNA. Nazwali je  barwnie, „RNA–DNA differences”, czyli RDD. Do tego mniej więcej połowa nie wyglądała jak te przypadki edycji, które jak dotąd zaobserwowano u ssaków, czyli nie było to ani A-w-G ani C-w-U. Wyglądało to tak, jakby właściwie każda zasada mogła być przetranskrybowana na inną. Zaskakujące. A że te zmiany znaleźli w sekwencjach kodujących, to oczywiście część z nich wpływa na sekwencję białka – przynajmniej w jednym przypadku wiązało się to z utratą kodonu STOP. Dodatkowo takie same RDD pojawiały się u różnych ludzi. Autorzy oceniają, że u każdego człowieka jest ponad 1000 takich miejsc.

Naukowcy przejrzeli też 327 peptydów kodowanych przez DNA zawierające takie miejsce. Z tego 28 peptydów odpowiadało sekwencji RNA (dla 17 z nich obecne były oba warianty). Nie jest tego dużo, ale autorzy artykułu zastrzegają, że ich metody na pewno nie wyłapuja wszystkich białek, zwłaszcza wtedy, kiedy występują oba warianty, ale jednego z nich jest znacząco więcej.

Oczywiście zaraz zaczęła się dyskusja. W końcu to nie byle jaki wynik. Pierwsze uwagi dotyczą oczywiście samego procesu sekwencjonowania, ktory nie jest wolny od błędów. Sekwencjonowanie high-throughput daje krótsze kawałki, niż metoda Sangera, no i przynajmniej niektórzy twierdzą, że jest mniej dokładne.  W oryginalnym artykule większość pracy wykonano stosując sekwencjonowanie high-throughput. Opisane jest też jednak sekwencjonowanie metodą Sangera kilku wybranych miejsc w wybranych próbkach, które potwierdziło istnienie RDD w większości – choć nie we wszystkich -spośród analizowanych przypadków (aha, na obrazku, który pokazuje ponowne sekwencjonowanie metodą Sangera, pięć z sześciu przykładów to A-w-G, tylko jeden może należeć do tych ‚nowych’ typów edycji). Jednak niektórzy specjaliści od technik HT nie są przekonani i twierdzą, że znaczna część RDD znajduje się w miejscach, gdzie często występują błędy typowe dla tych metod sekwencjonowania.

Drugi istotny komentarz pojawił się – jakże by inaczej – na blogu. Joe Pickrell zwraca uwagę na kilka istotnych rzeczy. Po pierwsze, żeby móc powiedzieć, że mamy do czynienia z edycją RNA, trzeba mieć pewność, że porównuje się odpowiadające sobie sekwencje. A w błąd mogą wprowadzić np. duplikacje genów czy dodatkowe kopie fragmentów chromosomu (CNV, zmienność liczby kopii fragmentów DNA, wcale nie takie rzadkie zjawisko). Problem tkwi w ustaleniu, któremu kawałkowi genomu odpowiada analizowana sekwencja RNA. A autorzy mieli do dyspozycji dość krótkie sekwencje (w przypadku sekwencjonowania mRNA – zaledwie około 50 nukleotydów), co sprawy nie ułatwia. Często istnieje wiele kawałków genomu, do których można taki mały kawałek RNA dobrze przypasować. Bywa to problemem przy analizie polimorfizmów pojedynczego nukleotydu (SNP). Jednak w pracy w Science nie opisano, czy użyte zostały jakieś metody filtrowania fałszywych pozytywów tego typu.

Drugi przykład jest równie ciekawy. Otóż autorzy pracy zaobserwowali, że miejsca RDD wypadają także w pobliżu miejsc splicingu i zastanawiają się, czy proces wycinania intronów może być jakoś związany z ich edycją.

Co jest bardziej podobne, przerwa czy różnica?

Joe przyjrzał sie jednemu ze zidentyfikowanych przez nich miejsc RDD koło splicingu i odkrył, że choć w oryginalnej pracy sekwencję porównano do jednego z wariantów splicingowych i stwierdzono dwie różnice między RNA a DNA, które przypisano edycji, to istnieje też drugi wariant splicingowy, który jest identyczny z analizowaną sekwencją RNA.

Joe przypuszcza, że wzięło się to stąd, że użyty algorytm porównywania sekwencji ocenia pojedyncze różnice w nukleotydach jako bardziej podobne niż idealne dopasowanie biorące pod uwagę przerwę w analizowanej sekwencji (np. intron czy delecję).

Pożyjemy, zobaczymy. RNA jest fascynujące, nawet jeśli większość nowoopisanych RDD da się wytłumaczyć  jako błędy w sekwencjonowaniu lub analizie sekwencji. A jeśli nie, to będzie to naprawdę ważne odkrycie.

I jeszcze słodki komentarz do tej pracy z Twittera, znaleziony u Eda Yonga:

perhaps the RNA editing is caused by inclusion of arsenic in DNA backbone? It’s a paper in Science after all…


Li, M., Wang, I., Li, Y., Bruzel, A., Richards, A., Toung, J., & Cheung, V. (2011). Widespread RNA and DNA Sequence Differences in the Human Transcriptome Science DOI: 10.1126/science.1207018

Kategorie:biologia, nauka Tagi:
  1. Brak komentarzy.
  1. No trackbacks yet.

Dodaj komentarz