Grupa naukowców EMBL w Grenoble, pod kierunkiem dr Wojciecha Galeja, odsłoniła kolejną zagadkę mechanizmu, który sprawia, że nasze komórki rozróżniają kodujący i niekodujący materiał DNA. Na łamach czasopisma "Molecular Cell" przedstawili nowe informacje na temat kompleksu RNA-białkowego sterującego procesem tzw. splicingu, który ma kluczowe znaczenie, by komórki mogły na bazie naszych genów produkować poprawne białka. W rozmowie z RMF FM dr Galej tłumaczy, co to jest tzw. nietypowy spliceosom i jakie znaczenie dla naszego organizmu ma jego poprawne działanie.

REKLAMA

Dr Wojciech Galej prowadzi w Europejskim Laboratorium Biologii Molekularnej (EMBL) grupę naukową, badającą strukturę i funkcje kompleksów RNA z białkami. W najnowszej publikacji grupa ta opisała strukturę jednej z podjednostek takiego kompleksu, tzw. nietypowego spliceosomu, która inicjuje proces selekcji intronów, niekodujących fragmentów materiału genetycznego. Ten wyspecjalizowany kompleks molekularny usuwa niektóre rzadkie, ale istotne introny, a jego nieprawidłowe działanie może prowadzić do kilku zaburzeń genetycznych.

Twoja przeglądarka nie obsługuje standardu HTML5 dla audio

Posłuchaj rozmowy z dr Wojciechem Galejem

Czemu służą kodujące i niekodujące części DNA?

Grzegorz Jasiński: Na początek chciałbym pana zapytać o coś, co było dla nauki dużym zaskoczeniem. To znaczy fakt, że genom zawiera części, które kodują białka i części, które ich nie kodują i ten niekodujący DNA genom tak naprawdę to znacznie większa część, niż tamten i właściwie nie wiadomo było, czemu służy. Czemu więc służą te kodujące i niekodujące części DNA?

Dr Wojciech Galej: Może zacznijmy od tego, że domyślam się, że pan redaktor, jak i nasi słuchacze są świadomi tego, że DNA jest tak zwanym nośnikiem informacji genetycznych. Wszystko to, co jest potrzebne, żeby zbudować organizmy żywe, jest zapisane w naszym DNA. Możemy sobie to wyobrazić jako taką trochę analogię, jakby była to książka, w której jest instrukcja, jak zbudować ludzki organizm. Teraz wyobraźmy sobie sytuację, w której ktoś weźmie taką książkę i pousuwa wszystkie przerwy między słowami. Wszystkie spacje zostaną usunięte i zostaniemy z jednym ogromnym słowem, które ciągnie się - powiedzmy - przez 200 stron. Taka książka zaczyna być bardzo trudna do odczytania. Natomiast jeśli ktoś się naprawdę postara, to myślę, że będzie w stanie jakoś tam wyłowić słowa, poskładać w całość i odczytać znaczenie takiej książki. Natomiast wyobraźmy sobie jeszcze inną sytuację. Kiedy ktoś w różnych losowych miejscach w takiej książce powstawał ciągi liter, które nie mają żadnego znaczenia. I tych liter powstawało bardzo dużo. I ta książka urosła nam z 200 stron do 20 tysięcy. I to się może wydawać dosyć hipotetyczną sytuacją, bardzo niespotykaną. Natomiast tak rzeczywiście jest zapisana nasza informacja genetyczna w genomie. I tutaj mamy do czynienia z dwoma rodzajami informacji: z informacją kodującą i niekodującą. Informacja kodująca to jest taka informacja, która jest używana przez komórki później do produkcji białek. I w naszym przykładzie, odnosząc się do tej analogii, to będą te słowa. Natomiast niekodująca informacja, jest to wszystko to, co jest pomiędzy słowami, co nie ma żadnego znaczenia, chociaż to też nie jest do końca prawda, bo czasami te niekodujące fragmenty też mogą mieć pewne funkcje w komórkach.

A czy wiemy, dlaczego tak to się zbudowało? Dlaczego tak to powstało?

W zasadzie mamy pewne domysły, dlaczego to wszystko tak powstało i to trochę wiąże się z ewolucją organizmów żywych i z ewolucją organizmów eukariotycznych. Jeśli cofniemy się w ewolucji, mniej więcej półtora miliarda lat temu miało miejsce pewne zdarzenie, w którym prekursor naszej komórki eukariotycznej, my jesteśmy eukariotami jako ludzie i to odróżnia nas od komórek bakteryjnych. Te komórki weszły w tak zwaną endosymbiozę z bakteriami, które przyniosły do naszego genomu całą masę mobilnych elementów genetycznych, które rozprzestrzeniły się i spropagowały ten genom w taki sposób, że poszatkowały nasze geny i one nie mogły być odczytane bezpośrednio. I to jest jedna z tych rzeczy, która nas bardzo mocno odróżnia od bakterii, w których nie ma tych niekodujących elementów. Tam w zasadzie wszystko jest kodujące i bakterie mogą odczytywać bezpośrednio swoje genomy bardzo łatwo. W komórkach eukariotycznych, praktycznie wszystkich, od drożdży do ludzi, genom i cała informacja genetyczna, o której mówimy, jest poszatkowana tymi niekodującymi odcinkami, które ewolucyjnie pochodzą tak naprawdę od pewnych mobilnych elementów genetycznych bakterii.

I to - jak się okazało - przydało się w ewolucji, skoro doprowadziło w końcu do tak rozwiniętego etapu, za jaki się uważamy.

Pod pewnymi względami ciężko jest powiedzieć, jak posiadanie tych niekodujących elementów genetycznych, jest ważne w ewolucji. Natomiast nie zawsze jest tak, że ewolucja działa w taki sposób, żeby optymalizować działania organizmów. Natomiast w tym przypadku rzeczywiście jesteśmy w stanie powiedzieć, że niektóre części tych niekodujących elementów genetycznych, one są bardzo przydatne w różnych aspektach funkcjonowania komórek i ewolucyjnie też jesteśmy w stanie w pewnym sensie w stanie wyjaśnić, jakie były korzyści z ich posiadania. Natomiast z punktu widzenia, jeśli tylko się popatrzy na to, jak ten genom jest zbudowany, wydaje się to bardzo nieefektywne. Tak że musimy całą masę tych niekodujących elementów powyrzucać po to, żeby złączyć te słowa w całość, i żeby one mogły być odczytane.

Splicing

I tu dochodzimy do państwa pracy, do państwa odkrycia, bo dotyczy ono mechanizmów odczytywania tego, to znaczy wyławiania z całego ciągu tego, co istotne i tego, co nieistotne. Porozmawiajmy więc o tych cząsteczkach. Co to są za cząsteczki? I przede wszystkim, jak one to robią? Skąd wiedzą, co wyciąć, a co zostawić?

Moja grupa zajmuje się badaniem tych tak bardzo złożonych cząsteczek biologicznych, które są odpowiedzialne dokładnie za to, co pan redaktor powiedział, za odnajdywanie kodujących elementów genetycznych w RNA i sklejanie ich razem i za wycinanie tych niekodujących elementów. Nazywamy je intronami. Cały proces z angielskiego nazywa się splicingiem lub składaniem intronów i kodujących eksonów. Maszyneria, która jest odpowiedzialna za przeprowadzanie tego procesu, to jest tzw. spliceosom, też z angielskiego. Jest to maszyneria komórkowa, której głównym zadaniem jest znalezienie tych miejsc, gdzie słowa zaczynają się kończyć i zaczyna się szum, czy te niekodujące fragmenty. Można sobie wyobrazić to trochę tak, jakby to były takie nożyczki molekularne, które potrzebujemy przeciąć. Natomiast ich funkcja jest dużo bardziej skomplikowana, niż tylko funkcja nożyczek, ponieważ muszą one znaleźć bardzo precyzyjnie, gdzie przeciąć te cząsteczki RNA. Jakiekolwiek błędy na tym etapie mogą mieć bardzo poważne konsekwencje. Więc to, czym my się zajmujemy i to, co badaliśmy ostatnio, to jak te kompleksy komórkowe, te cząsteczki biologiczne dokładnie znajdują miejsca, gdzie kończy się informacja, a zaczyna się niekodująca część genomu.

I jak one to robią?

Robią to w różnoraki sposób. Natomiast jakby całą podstawą wszystkiego jest to, że są pewne bardzo zdefiniowane elementy całej sekwencji, czyli ciągu klocków budulcowych, które budują te cząsteczki RNA. One są bardzo zdefiniowane w tych miejscach, gdzie zaczyna i kończy się informacja kodująca. I te cząsteczki, które my badamy, one rozpoznają na poziomie molekularnym pewnego rodzaju sygnały, które są tam obecne. Robią to bardzo precyzyjnie i w momencie, kiedy je rozpoznają, przekazują te cząsteczki dalej, do kolejnych etapów procesu.

Te tak zwane spliceosomy są jakby dwojakiego rodzaju. Państwo zajmujecie się jednym z tych rodzajów.

Tak na dobrą sprawę zajmujemy się oboma, natomiast nasza ostatnia praca dotyczy tak zwanego niekanonicznego spliceosomu. Jest to kompleks, który zajmuje się wycinaniem bardzo małej, specyficznej klasy tych elementów niekodujących, które nazywamy intronami. I tutaj okazuje się znowu, że ten kompleks jest bardzo odmienny od typowego spliceosomu, który w każdych komórkach istnieje. One zostały ewolucyjnie rozdzielone, bardzo, bardzo wcześnie, na wczesnych etapach ewolucji. I ten kompleks zajmuje się tymi bardzo precyzyjnymi intronami, które są obecne w bardzo małej proporcji ludzkiego genomu. Natomiast obecne są one w genach, które mają kluczowe funkcje dla komórek. Dlatego wycinanie tych elementów niekodujących jest też niezwykle kluczowe i bardzo często, jeśli są problemy w wycinaniu tych ściśle określonych intronów, one manifestują się tym, że komórki przestają funkcjonować poprawnie i bardzo często prowadzi to do różnego rodzaju chorób.

To odkrycie, które państwo opisali w niedawnej pracy, dotyczy struktury tej cząsteczki. Jak państwo ją badali i w jaki sposób doszliście państwo do tych wyników?

Do badania struktur cząsteczek, takich jak spliceosom używamy metod tak zwanej biologii strukturalnej. W sednie sprawy polega to na tym, że próbujemy obserwować te cząsteczki, zobaczyć, jak one wyglądają i na podstawie tego próbujemy na dobrą sprawę odgadnąć, jakie są mechanizmy ich działania. W tym konkretnym przypadku użyliśmy metod tak zwanej mikroskopii krioelektronowej do odczytania struktury tych cząsteczek. Jest to pewien rodzaj mikroskopii, które pozwala na przybliżenie tych cząsteczek do stopnia, w którym naprawdę możemy obserwować prawie pojedyncze atomy. I to pozwala nam na bardzo precyzyjne określenie ich struktury, używając różnego rodzaju metod eksperymentalnych i obliczeniowych. Tak że mikroskopia elektronowa, jest jakby głównym źródłem informacji w tym momencie. Natomiast do interpretacji tych struktur, które otrzymaliśmy, używaliśmy też różnych innych metod, jak na przykład metod sztucznej inteligencji, Alphafold. Jest to taki algorytm, który pozwala na przewidywanie różnego rodzaju struktur białek i ich kształtów. I to jak najbardziej wspierało nas w określaniu struktury tych kompleksów.

Metoda krio, badania w niskiej temperaturze

Na ile w tej metodzie istotny jest ten element krio, czyli - jak rozumiem - badania w niskiej temperaturze?

Jest to bardzo istotne z wielu różnych powodów technicznych. Może wróćmy trochę wcześniej, mikroskopia elektronowa istniała od lat 30. poprzedniego wieku, natomiast ona nie była nigdy w stanie osiągać rozdzielczości, które by pozwalały na patrzenie z przybliżeniem, które pozwala nam na oglądanie pojedynczych atomów. Czyli rozdzielczości bardzo wysokie, w których bardzo precyzyjnie widzimy te cząsteczki. Wprowadzenie tych metod krio pozwoliło na minimalizację różnego rodzaju uszkodzeń, które elektrony powodują w naszych preparatach, które są bardzo wrażliwe i na dobrą sprawę to pozwoliło, razem z różnymi metodami obliczeniowymi i z innymi technicznymi postępami w tej dziedzinie, na stworzenie metody, która pozwala rzeczywiście przybliżać te cząsteczki biologiczne do poziomu, na którym możemy rzeczywiście patrzeć, jak one wyglądają w wysokiej rozdzielczości i jak działają. Wprowadzenie tej niskiej temperatury było jak najbardziej kluczowe. Zresztą w 2017 roku, jedna trzecia Nagrody Nobla została przyznana właśnie za wprowadzenie tego pomysłu wykonywania mikroskopii w temperaturach kriogenicznych.

Zanim jeszcze przejdziemy do tego, jakie znaczenie dla medycyny, bo to tak dla nas, naszych odbiorców, oczywiście te medyczne zastosowania zawsze są najbardziej bliskie i kluczowe. Jeszcze powiedzmy trochę o tym niekodującym fragmencie DNA, a właściwie dominującym fragmencie DNA, bo to jest nawet 98 proc. genomu. Był taki moment, że pojawił się taki termin "śmieciowe DNA", ale on został szybko wyrzucony na śmietnik historii nauki, bo zaczęto jednak widzieć, że ta część genomu nie jest tak całkowicie nieaktywna, nieczynna i zaczęto potwierdzać, że ona ma swoje znaczenie, trochę inne niż ten kodujący fragment. Na czym to znaczenie polega?

To, o czym klasycznie mówimy jako kodujące DNA, to są wszystkie te elementy genomu, które prędzej czy później stają się matrycą do produkcji białek. I tak jak pan wspominał, to jest to bardzo mała proporcja całego genomu. Niekodujące fragmenty rzeczywiście kolokwialnie były nazywane śmieciowym DNA na pewnym etapie. Natomiast to trochę też wynikało z tego, że nie rozumieliśmy do końca, co one robią. Na pewnym etapie rozwoju nauki okazało się, że na dobrą sprawę cała masa tych elementów DNA, które wydawały się niekodujące, że one rzeczywiście zostają przepisywane na cząsteczki RNA i te cząsteczki RNA w pewnej mierze mają jakieś funkcje komórkowe. Możemy tutaj mówić o całej masie funkcji niekodujących RNA w komórkach. O jednej z takich funkcji, chociażby, możemy mówić przy tym procesie splicingu. Maszyneria, która zajmuje się tym, spliceosom, który wykonuje splicing w komórkach, także zawiera elementy niekodujące RNA, które nie produkują białek. Są to kompleksy zbudowane z białek i z RNA. Te elementy RNA są z natury niekodujące, natomiast pełnią kluczową rolę w funkcjonowaniu tych kompleksów. Tak, że jest całkiem sporo różnych przykładów tych niekodujących elementów, które są używane w pewnych procesach komórkowych. Zdecydowanie nie jest tak, że są zupełnie śmieciowe. Ten termin prawdopodobnie trochę wynika też z tego, że dla wielu z nich nie znamy nadal funkcji, nie jesteśmy w stanie określić ich funkcji, stąd wydaje się, wydawało się, że nie będą miały żadnego znaczenia.

A jednak bardzo istotne znaczenie ma ten proces splicingu, czyli tego konkretnego, dokładnego podzielenia tych fragmentów kodującego i niekodującego DNA to ma tak naprawdę, jak rozumiem, wpływ na zdrowie organizmu, na to jak na ile prawidłowo się rozwija, na ile prawidłowo się rozmnaża. Stąd państwa odkrycie dotyczące cząsteczek, które się tym osobiście zajmują, może mieć przełożenie także na zapobieganie lub korygowanie ewentualnych zaburzeń genetycznych.

Jak najbardziej może. Wracając do naszej analogii z książką. Możemy sobie wyobrazić, że w momencie, kiedy próbujemy przeczytać, co jest nie zapisane, czyli odczytać informację genetyczną. Jeśli jakieś litery nam wypadają, albo poskładamy je w nieodpowiednim porządku oczywiście ta informacja, która tam jest zapisana, przestanie mieć taki sam sens, zmieni się jej sens. I rzeczywiście takie rzeczy zdarzają się na poziomie molekularnym bardzo często. Komórki mają swoje mechanizmy, żeby zapobiegać problemom i różnego rodzaju błędom w czasie splicingu. Natomiast czasami jest to nieuniknione i pojawiają się błędy. I to, co może być bardzo zaskakujące, szacuje się, że nawet jedna trzecia chorób genetycznych, które są znane, w mniejszym lub większym stopniu ma powiązanie z jakimiś problemami związanymi z wycinaniem intronów. Jest to ogromna liczba chorób. I tutaj możemy przytoczyć kilka przykładów, jak na przykład zaburzenia rozwojowe, choroby neurodegeneracyjne. Z innej klasy także są bardzo silne powiązania pomiędzy problemami ze splicingiem i różnego rodzaju nowotworami. Tak że jest cała masa chorób, które są powiązane z problemami z wycinaniem intronów. I oczywiście badania podstawowe są tutaj bardzo ważne. Z tego punktu widzenia, żeby być w stanie w jakiś sposób przeciwdziałać tego rodzaju chorobom, musimy mieć bardzo dobre zrozumienie tego, jak te procesy działają na poziomie molekularnym. Więc ważne, by zaznaczyć dwie rzeczy. Po pierwsze te badania są zupełnie podstawowe, one są z założenia kierowane naszą ciekawością naukowca, gdzie próbujemy rzeczywiście zbadać, jak molekularne mechanizmy działają. Natomiast to jak najbardziej jest aspekt, który jest przydatny w późniejszych etapach aplikacyjnych, na przykład w racjonalnym projektowaniu leków, które mogą celować w jakieś bardzo specyficzne aspekty tego procesu. Tak że na pewno jest tutaj duży potencjał wdrożeniowy tego typu badań.

"Zdecydowanie często się tak zdarza w naszych badaniach, że odkrywamy rzeczy, które są zupełnie niespotykane"

A pan jako jeden z autorów tej pracy i w takim razie osoba, która odkryła, z jakich cząstek i układów te spliceosomy się składają, wyobraża sobie, że można je jakoś modyfikować, korygować, że one mogą w jakiś taki intuicyjnie czytelny sposób ulegać zaburzeniu? Któregoś z elementów może brakować, albo może być jakieś powtórzenie? I jak możemy sobie wyobrażać te nieprawidłowości, ich struktury i w związku z tym ewentualnie działania?

Zaburzeń jest cała masa. Możemy sobie wyobrazić zaburzenia, w których na przykład część tych niekodujących sekwencji nie została zupełnie wycięta, więc dalej tam istnieją. I próbujemy przeczytać naszą informację. I ona w którymś momencie zaczyna być czytana jako zupełny nonsens. Może być też tak, że pogubimy parę liter w czasie wycinania, czyli będzie niezbyt precyzyjne wycięcie tych intronów i połączymy je w złym układzie. I wtedy także cała informacja, która zostanie przeczytana, jest nieprawidłowa, co w konsekwencji bardzo często wiąże się z tym, że białka, które muszą zostać wyprodukowane na matrycy RNA, o której mówimy, będą niefunkcjonalne. Tak że jakby ten cały proces, o którym rozmawiamy teraz, odbywa się na poziomie RNA. RNA to jest taka cząsteczka, kopia robocza DNA, która jest produkowana z genomu. I na tym etapie ona dalej posiada niekodujące odcinki. One muszą być wycięte i dopiero wtedy maszyneria komórkowa może wyprodukować białka na podstawie tych cząsteczek RNA. Natomiast białka same w sobie, jak wiadomo, to są elementy budulcowe wszystkich organizmów, czyli wszystkie nasze komórki, skóra, włosy, paznokcie zbudowane są z białek strukturalnych. Inne przykłady to białka enzymatyczne, na przykład enzymy trawienne, które wprowadzają różne reakcje chemiczne w naszym organizmie. Tak że zaburzenia w składaniu intronów będą miały pewne konsekwencje w tym, jakie białka zostaną na koniec wyprodukowane. I to jest dosyć dobrze poznane i jesteśmy w stanie bardzo łatwo przewidzieć, jakie są konsekwencje tych zaburzeń.

A czy tego typu badania w jakiś sposób mogą też posunąć naprzód naszą wiedzę na temat znaczenia tych niekodujących fragmentów DNA? Czy w jakiś sposób dają szansę na zauważenie pewnych mechanizmów, procesów, które może są szersze i nie widzimy ich tak wyraźnie, ale faktycznie jakby uzasadniają to, że te fragmenty tam są?

Nie mam żadnego dobrego przykładu. Natomiast zdecydowanie często się tak zdarza w naszych badaniach, że odkrywamy rzeczy, które są zupełnie niespotykane. I tutaj mogę przytoczyć, nawet z naszych badań parę lat temu, gdzie określiliśmy strukturę w bardzo wysokiej rozdzielczości jednego z kompleksów, który buduje typowy spliceosom. Okazało się, że co do pewnych elementów, o których wcześniej nie było wiadomo, co one do końca robią, okazało się, że byliśmy w stanie bardzo precyzyjnie przypisać im funkcje. Tak że tego typu odkrycia bardzo często się zdarzają. Ciężko jest przewidzieć, jak ukierunkować badania, żeby dokonać tego typu odkrycia. Natomiast zdecydowanie tak, zdobywając większą wiedzę na temat, jak funkcjonują te procesy, jesteśmy w stanie jak najbardziej lepiej zrozumieć inne aspekty tych procesów.

Mówimy tutaj o badaniach struktur, które są olbrzymie, mają tych liter miliardy i w tego typu zadaniach już od dobrych paru lat słyszymy, że świetnie sprawdza się sztuczna inteligencja, że można jej zaproponować sortowanie tych danych, znajdywanie jakichś tam prawidłowości. Wspomniał pan doktor o AlphaFold, że to już jest wykorzystywane, zostało nagrodzone Nagrodą Nobla, bo to potwierdza, że to się wykorzystuje. Czy w badaniach tych olbrzymich, wielkich struktur jeszcze inne programy związane ze sztuczną inteligencją mogą się przydać, właśnie do sortowania danych?

Jak najbardziej. Już teraz używamy bardzo często programów typu AlphaFold, ale nie tylko, do tego. One nam po prostu ułatwiają interpretowanie danych eksperymentalnych. Natomiast obecnie one nadal nie zastępują tych danych eksperymentalnych, szczególnie dla tak bardzo dużych i skomplikowanych kompleksów, o których rozmawiamy. Jedna komplikacja w naszym przypadku jest też taka, że te kompleksy, które są odpowiedzialne za wycinanie intronów, są zbudowane nie tylko z białek, ale także z cząsteczek RNA, które mają swoją własną strukturę. I to jest dosyć rzadkie w komórkach, chociaż są różne inne przykłady. Natomiast nie ma na tyle danych eksperymentalnych, które by pozwalały na wytrenowanie modelu takiego jak AlphaFold, który by działał bardzo dobrze też na cząsteczkach RNA. Więc to jest jedno z głównych ograniczeń. W tej chwili nadal to nie działa tak dobrze, jak dla białek. To jest jeden aspekt. Inny aspekt jest taki, że to są też duże i bardzo dynamiczne kompleksy. I w tej chwili AlphaFold jest bardzo dobry w przewidywaniu statycznych struktur, natomiast dalej jest dosyć daleko do tego etapu, kiedy będzie możliwe przewidywanie trajektorii i różnego rodzaju dynamiki tych kompleksów. I to jest coś, czego na pewno brakuje w tym momencie. Tak że my jesteśmy bardzo, bardzo szczęśliwymi użytkownikami AlphaFolda, natomiast nie przewidujemy, żeby zastąpił zupełnie metody eksperymentalne w najbliższej przyszłości.

Plany na przyszłość

Na koniec chciałbym zapytać pana o najbliższe plany. Czego będzie dotyczyła kolejna publikacja i czego państwo się spodziewacie i na co liczycie w badaniach, które prowadzicie w tej chwili?

Ostatnia publikacja, którą napisaliśmy, dotyczyła bardzo wczesnego etapu rozpoznawania tych niekodujących części RNA, natomiast bardzo wiele etapów poza tym jest dalej bardzo słabo poznanych, jeśli chodzi o ten niekanoniczny spliceosom. Nasze następne publikacje na pewno będą związane z pogłębianiem wiedzy na ten temat i próbą zrozumienia, co tak naprawdę dzieje się pomiędzy tymi wczesnymi etapami a końcowym etapem reakcji, gdzie mamy wycięte wszystkie introny i złożoną całą informację. Tak że jest tam bardzo, bardzo dużo do zrobienia i na pewno będziemy się na tym skupiać.