Vilket är ditt favoritgennamn?

Mitt favoritgennamn är TIME FOR COFFEE. Denna gen är inblandad i att ställa backtravens inre klocka så att växtens dygnsrytm följer det verkliga dygnet. TIME FOR COFFEE påverkar dygnsrytmen under den senare delen av natten. Namnet syftar på att detta är en tid på dygnet då människor vanligen behöver kaffe för att kunna göra någonting överhuvudtaget. När man studerar dygnsrytmer är man ofta tvungen att vara på labbet dygnet runt för att ta prover, så jag misstänker att citatet nedan var baserat på personlig erfarenhet.

”We located TIC function to the mid to late subjective night, a phase at which any human activity often requires coffee”*

Det finns en lång tradition bland växtgenetiker att döpa mutanta växter till något som anspelar på mutantens avvikande utseende. Namnet får gärna vara komiskt eller anspela på något som alla antas känna till. En backtravsmutant vars blommor har extra många ståndare på bekostnad av pistillen (eller snarare karpellerna i pistillen) kallas till exempel superman. Superman är ju det engelska namnet på Stålmannen.

När den molekylära genetiken slog igenom inom växtbiologin för ca 20-25 år sedan kunde forskarna för första gången identifiera de muterade gener som orsakade avvikelserna hos växtmutanterna. Plötsligt hade gener gått från att vara ett abstrakt, statistiskt begrepp till att vara något fysiskt som fanns på riktigt. Något som finns på riktigt behöver ett namn, så dessa gener fick ärva namnet från mutanterna. Mutanten superman har alltså en mutation i genen SUPERMAN.

Det finns vissa komplikationer, men i princip fungerar detta namngivningssystem ganska bra. I alla fall efter att man införde skrivregler för att undvika den förvirring som kan uppstå när olika saker har samma namn. I de flesta (men inte alla) växtarter skrivs numera gennamn med kursiverade stora bokstäver, proteinnamn med icke-kursiverade stora bokstäver och mutantnamn med kursiverade små bokstäver.

*Citatet kommer från Anthony Hall m.fl. (2003) The TIME FOR COFFEE Gene Maintains the Amplitude and Timing of Arabidopsis Circadian Clocks. The Plant Cell 15(11): 2719-2729. TIC är den officiella förkortningen av TIME FOR COFFEE. Forskare har ofta ett starkt behov av att hitta på förkortningar för allting, oavsett om det behövs eller inte.

Att fotografera riktigt små detaljer

Makroobjektiv ger bra närbilder, men vill man ha riktigt ordentlig förstoring behöver man koppla kameran till ett mikroskop istället för ett objektiv. Här är ett par exempel på mikroskopfoton av genaktivitet i en ung grankotte som jag tog när jag var doktorand. Dessa foton är tagna med en Hamamatsukamera monterad på ett Leica Leitz DMRXE-mikroskop.

Kotten är uppskuren i 7 mikrometer tjocka snitt och märkt med en radioaktiv sond som anger var just denna gen är aktiv (det är det som lyser gyllengult på den undre bilden). Radioaktiviteten från sonden fångas på fotografisk emulsion, som sedan framkallas på sedvanligt sätt, så jag tillbringade rätt mycket tid i mörkrum som doktorand…

ErikaGrothGrankotteÄldreLjusfältErikaGrothGrankotteÄldreMörkfält

Som doktorand använde jag ibland även elektronmikroskop för att avbilda riktigt små detaljer av växters yta. Jag har letat igenom mina gamla filer för att försöka hitta några bilder av kottar tagna med elektronmikroskopet, men jag verkar tyvärr inte ha kvar några sådana bilder.

I fjällen för att prata om barrträd. Del 1: Konferensen

Ibland har man helt enkelt otur. Det har varit fantastiskt väder i Björkliden ett bra tag nu och väderleksrapporterna lovar fortsatt fantastiskt väder. Enda undantaget var helgen som var, d.v.s. när jag var där. Vi var drygt 50 forskare av flera olika nationaliteter som hade rest till Björkliden för att diskutera sekvenseringen av barrträdens arvsmassor och hur dessa data kan användas för forskning och för praktiskt skogsbruk. Huvuddelen av deltagarna var på ett eller annat sätt inblandade i antingen det svenska eller det kanadensiska grangenomprojektet. Tanken var att det amerikanska tallgenomprojektet också skulle delta, men med något enstaka undantag så backade de ur i sista stund.

Förutom folk från de två stora grangenomprojekten var också ganska många potentiella användare av informationen där, inklusive jag. Där fanns också representanter från mindre projekt som, med betydligt mindre budgetar, arbetar med att sekvensera och analysera andra barrträds arvsmassor. Några specialister på förädling var också där, men inga representanter från skogsindustrin.

Den främsta slutsatsen från konferensen var ungefär vad vad jag hade förväntat mig, nämligen att kvaliteten på de grangenomversioner som nu släppts är, rent ut sagt, usel. Dessa genomsekvenser kommer att bli viktiga resurser i framtiden, när de hunnit bli mer genomarbetade och kvaliteten har kontrollerats, men detta ligger ännu flera år in i framtiden. Det räcker nämligen inte med att bara läsa av granens DNA. Det kan göras snabbt och enkelt med dagens teknik, även för stora och komplicerade arvsmassor som barrträdens.

Problemet är att när man avläser DNA består resultatet i praktiken av små ”textsnuttar”, där ”texten” ifråga är skriven med ett alfabet som bara innehåller fyra bokstäver: A, T, C och G. Bokstäverna, som kallas för nukleotider eller baser, är förkortningar för molekylerna adenin, tymidin, guanin och cytosin. Man kan likna DNA vid en instruktionsbok som cellerna i en kropp använder för att de ska veta vad de ska göra och hur de ska göra det.

Verkligt exempel på två sekvenser från senaste versionen av poppelgenomet. Kan du hitta skillnaderna? Dessa sekvenser kan vara olika varianter av samma gen eller två olika men närbesläktade gener. Eller så är en (eller båda) helt enkelt fel. Vad tror du?

Med den teknik som genomprojekten använder är dessa ”textsnuttar” för det mesta några hundra nukleotider långa. Arvsmassan hos gran består av ungefär 20 miljarder sådana nukleotider. Småsnuttarna måste alltså pusslas ihop till en sammanhängande sekvens, vilket kallas för en genome assembly (ett sammansatt genom). Detta är ett enormt arbete som kräver en ofantlig datakraft, och för grangenomen har uppgiften hittills visat sig vara omöjlig.

Bioinformatikerna, d.v.s. dataprogrammerarna, som jobbar med detta har hittills lyckats pussla ihop större enheter på några tusen nukleotider, i vissa fall mer än tiotusen. Har man tur lyckas de ibland få med sekvensen för en hel gen i en enda sammanhängande enhet, men det är långt kvar till de miljarder av sammanhängande nukleotider som behövs för att man ska kunna prata om en ”riktig genomsekvens”.

Att pussla ihop genomet är inte ens den svåraste uppgiften. Det är först när man har en sammanhängande sekvens som det verkliga jobbet börjar. Då kan forskarna på allvar börja leta igenom sekvensen, försöka hitta t.ex. gener och markera vad som är vad. Detta, som kallas annotering, är i praktiken ett evighetsarbete, eftersom det alltid går att förbättra annoteringen av en genomsekvens.

Jämförande analyser av barrträdens arvsmassor baserat på dessa tidiga data bör alltså tas med en rejäl nypa salt, vilket inte verkar hindra folk från att kasta sig in i att göra just denna typ av analyser. Det är bättre att vänta på genomsekvenser av bättre kvalitet. Vi blev på konferensen lovade att nästa version av grangenomet kommer redan i höst, och den kommer att vara bättre. Lite oklart hur mycket bättre, men åtminstone bättre än den nuvarande. Så det är värt att leta lite i den nuvarande sekvensen, men man ska akta sig för att dra några slutsatser av vad man hittar där. Som så ofta annars gäller regeln skräp in, skräp ut även i detta fall.

Trots problemen med de nuvarande genomsekvenserna var det riktigt trevligt att tillbringa några dagar med att diskutera barrträd med andra som också är intresserade av dem. Sverige är visserligen ett land där skogsindustrin är väldigt viktig för ekonomin, men det innebär inte att jag brukar träffa särskilt många människor som är intresserade av träd.

Högsta prioritet: mat, frukt, vin och choklad

När det bestäms vilka växter som ska få sina arvsmassor sekvenserade så befinner sig den vetenskapliga nyttan av resultaten rätt långt ner på prioriteringslistan. Det blir uppenbart om man studerar listan på sekvenserade arter i Phytozome. Visserligen finns några vetenskapliga modellorganismer med, men de flesta är industrins favoritarter snarare än forskarnas.

Här hittar vi bland annat några av världens viktigaste grödor som ris, majs, potatis, sojaböna, cassava, durra, vanlig böna, tomat och gurka. Här finns också frukter som persika, äpple, papaya, apelsin och clementin. Sekvenserade växtarter som används inom andra industrier än matindustrin är lin, bomull och eukalyptus. Och så finns så klart vinranka och nu senast kakao med. De får väl anses representera njutningsindustrin.

Publikationen av kakaogenomet släpptes den 3 juni i Genome Biology. Jag är inte säker på att det verkligen räknas som ett stort framsteg för mänskligheten att vi numera har detaljerad information om vinets och chokladens arvsmassor, men å andra sidan är ju båda onekligen väldigt populära.

P.S. Grangenomet finns inte med i Phytozome. Den forskargruppen envisas istället med att köra en gammaldags stil med en egenhändigt tillverkad databas på en egen hemsida som inte är synkroniserad med något annat. Mycket irriterande!

Granens arvsmassa – version (nästan) 1.0

Barrträdens gigantiska arvsmassor har länge ansetts vara för stora för att kunna avläsas och analyseras i sin helhet, men på senare år har flera parallella forskningsprojekt tagit sig an utmaningen. De största är det svenska granprojektet som främst fokuserar på svensk gran (Picea abies), ett kanadensiskt projekt som fokuserar på vitgran (Picea glauca) och ett amerikanskt projekt som främst satsar på loblollytall (Pinus taeda). Stora delar av vitgranens arvsmassa har faktiskt varit offentligt tillgängliga ett bra tag nu, men tyvärr bara i ett hopplöst opraktiskt format som man måste vara dataprogrammerare (med rejält med tillgängliga datorresurser) för att kunna utnyttja. Produktionen av den genomsekvensen publicerades officiellt den 22 maj i Bioinformatics.

Betydligt mer uppmärksamhet har publikationen av den svenska granens arvsmassa fått. Den publicerades samma dag i Nature. Svenskarnas artikel är bättre i den bemärkelsen att den innehåller en del jämförande analyser av arvsmassan. Förutom granens arvmassa har de även sekvenserat svensk tall (Pinus sylvestris), sibirisk ädelgran (Abies sibirica), en (Juniper communis), idegran (Taxus baccata) och en gnetumart (Gnetum gnemon), fast dessa sekvenser är av sämre kvalitet än gransekvenserna.

För att sammanfatta vad de kommit fram till så verkar gran ha ungefär lika många gener som andra växter. Anledningen till att barrträdsgenomen är så gigantiska verkar vara att de är fulla av så kallade transposoner. Transposoner är bitar av DNA som hoppar runt i arvsmassan, och ofta dessutom kopierar sig själva på köpet. Barrträden verkar vara sämre än många andra arter på att rensa bort dessa, med resultatet att deras arvsmassa har svällt till enorma proportioner. Transposoner kan också ställa till det för växterna när de hoppar runt. Om de hoppar in i en aktiv gen kan de i värsta fall slå sönder genen och göra den icke-funktionell. Transposoner kan vara anledningen till att många av de gener som forskarnas dataprogram identifierar i granens arvsmassa verkar ha mycket stora introner.

Gran har ungefär samma antal gener som andra växter (a). Däremot verkar intronerna vara ovanligt långa (b). Källa: Nystedt m.fl. Nature (2013)
Gran har ungefär samma antal gener som andra växter (a). Däremot verkar intronerna vara ovanligt långa (b). Källa: Nystedt m.fl., Nature, 2013

 

Tyvärr har forskarna bara lyckats sekvensera delar av granens arvsmassa, och de har faktiskt inte lyckats pussla ihop sina sekvenser till en sammanhängande DNA-sekvens. Det som finns är olika bitar av arvsmassan, avlästa var för sig. Det är alltså fortfarande i praktiken ett ”fläckvis” grangenom som nu offentliggörs. Jag testade att söka på sekvenserna från ett par opublicerade grangener jag arbetade med som doktorand. De hade lyckats identifiera snuttar av båda sekvenserna, men inte hela generna. Så det finns massor av jobb kvar att göra innan vi har ett verkligt användbart grangenom. Vill du hjälpa till? Det är bara att gå till ConGenIE-sidan och sätta igång.

Birol m.fl. (2013). Assembling the 20 Gb white spruce (Picea glauca) genome from whole-genome shotgun sequencing data. Bioinformatics. doi: 10.1093/bioinformatics/btt17 (open access)

Nystedt m.fl. (2013) The Norway spruce genome sequence and conifer genome evolution. Nature. doi:10.1038/nature12211 (open access med ”Creative Commons licence”)

Där ingen trodde något kunde leva

Mitt examensarbete vid universitetet handlade om arkéer, närmare bestämt om en arkéart som lever i 80-gradig syra i heta källor. Det är en så extrem miljö att det enligt all logik inte borde vara möjligt att överleva där. Jag har fascinerats av dessa bisarra och oerhört tuffa småttingar ända sedan jag som universitetsstudent först hörde talas om dem. Varför hade ingen berättat om dem tidigare?

I många hundra år delade vetenskapsmännen (och de ytterst få vetenskapskvinnorna) in livet i fem riken; djur, växter, svampar, protister (= alla andra eukaryoter) och bakterier. Bakterierna kallades också för prokaryoter eftersom de, till skillnad från eukaryoterna, inte har någon cellkärna. Detta system användes fortfarande när jag var barn, trots att forskarna vid det laget hunnit bli ordentligt skeptiska till denna gamla ”sanning”.

Det var i den moderna molekylärbiologins begynnelse på 1970-talet som Carl Woese upptäckte att vissa celler som ser ut som bakterier i mikroskopet egentligen är något helt annat. I början kallades dessa för ärkebakterier och man tänkte sig att de måste vara någon sorts unik typ av bakterier, men med tiden blev det allt mer uppenbart att de så kallade ärkebakterierna inte alls är några bakterier. De är något helt annat. Och sedan 1990 har forskarna dumpat de fem rikena och övergått till att dela in allt liv på jorden i tre domäner istället: eukaryoter, bakterier och arkéer. Tyvärr tar det ett tag för vetenskapliga revolutioner att nå de svenska skolorna (har den gjort det än?), så där regerade fortfarande de fem rikena under hela 90-talet.

Arkéer finns, precis som bakterier, överallt. Bland annat lever de i de kalla och syrefattiga sedimentlagren på havsbotten. Arkéer är svårstuderade eftersom de ofta trilskas och vägrar växa i laboratoriemiljö. De få arkéer som går att odla brukar ha en metan- eller svavelbaserad ämnesomsättning, men nu har forskare upptäckt att vissa sedimentlevande arkéer istället lever på en proteindiet.

De utsöndrar enzymer som bryter ner proteiner i sedimentet till mindre bitar. Dessa mindre bitar tas sedan upp av arkécellerna genom speciella kanaler i cellmembranet för fortsatt nedbrytning och återanvändning av beståndsdelarna. Proteinerna kommer huvudsakligen från döda organismer och ansamlas i sedimenten där de ingår i en av jordens största reservoarer av organiskt kol. De sedimentlevande arkéernas nedbrytning av proteiner påverkar därför den globala kolcykeln. David Valentine uppskattar att det kan finnas 1000 000 000 000 000 000 000 000 000 arkéer som lever i havssedimenten, så det är knappast någon liten effekt vi pratar om.

Dessutom finns de inte bara i sedimenten ovanpå havsbotten. En annan grupp forskare har letat liv på helt nya ställen och funnit att det lever mikroorganismer, inklusive arkéer, även inne i själva jordskorpan. De har borrat flera hundra meter ner i 3,5 miljoner år gammal jordskorpa av basalt som ligger under sedimentet på havsbotten utanför västra USA. Där, inne i själva jordskorpan, hittade de levande mikroorganismer som verkar ha metan- och svavelbaserad ämnesomsättning. De oceaniska plattorna är den största potentiella livsmiljön på hela jorden, så detta fynd har potentiellt stor betydelse.

Än vet vi inte hur mycket liv som egentligen finns där nere, men det skulle kunna vara det första stora ekosystem på jorden som drivs av kemosyntes snarare än fotosyntes. Vilket är egentligen det vanligaste systemet? På jordytan är livet fotosyntetiskt och använder solenergi för att omvandla koldioxid till organiska molekyler. Kemosyntetiskt liv är helt oberoende av solen och använder istället energi från andra källor. I den varma havsskorpan (temperaturen ligger konstant på ungefär 64°C) frigörs energi när havsvatten tränger in i basalten och reagerar med den, och det är denna energi som verkar utgöra basen för livet där inne.

För att kontrollera att de spår av liv de hittat inne i basalten inte bara var nedbrytningsprodukter från döda organismer försökte de odla proverna på laboratoriet. De växte visserligen mycket långsamt, men de producerade mätbara mängder metan vilket visade att de innehöll levande metanogener. Livet har ännu en gång visat sig klara mer än vi trott. Finns det egentligen någon gräns för var det är möjligt att leva?

Källor:

Mark A. Lever m.fl. (2013) Evidence for Microbial Carbon and Sulfur Cycling in Deeply Buried Ridge Flank Basalt. Science 339, s. 1305. Se också kommentar av Ed Yong (Life found deep under the sea) på Nature News & Comments den 14 mars.

Karen G. Lloyd m.fl. (2013) Predominant archaea in marine sediments degrade detrital proteins. Nature 496, s. 215. Se också kommentar av David L. Valentine (Microbiology: Intraterrestrial lifestyles). Nature 496, s. 176

Carl R. Woese, Otto Kandler och Mark L. Wheelis (1990) Towards a natural system of organisms: Proposal for the domains Archaea, Bacteria, and Eucarya. PNAS 87, s. 4576

Kanske är det klipp och klistrandet som utgör skillnaden

När man säger att en gen ”uttrycks” eller att den ”är aktiv” betyder det att informationen överförs från DNA:t till ett budbärar-RNA (mRNA = messenger RNA) för att sedan översättas till ett protein.

DNA -> mRNA -> Protein

Francis Crick kallade detta för den centrala dogmen inom molekylärbiologin, och detta enkla 1:1:1 förhållande har utgjort grunden för i princip all molekylärbiologi ända sedan dess. Tyvärr är biologi sällan så enkelt i verkligheten, och det gäller även denna process. En gen ger nämligen oftast inte upphov till ett protein, utan till många. Och då menar jag inte bara att det bildas många likadana proteinmolekyler, utan även att en gen faktiskt kan ge upphov till flera olika sorters proteiner.

I eukaryoter och arkéer består gener av exoner och introner. Exonerna är de delar av DNA:t som innehåller själva instruktionerna för hur proteinet ska byggas. Intronerna däremot används inte för att göra proteiner utan klipps bort från mRNA-molekylerna innan dessa är färdigtillverkade. Vad intronerna har där att göra, när de ju ändå bara klipps bort, är inte helt klarlagt. Ibland kan de innehålla information som avgör när och var genen är aktiv, men oftast verkar de inte göra någonting alls.

Saken är den att när intronerna vSplicing_overviewäl har klippts bort kan exonerna klistras ihop igen på flera olika sätt. Detta kallas alternativ splitsning, vilket är en försvenskning av alternative splicing, och illustreras av figuren till vänster (från Wikipedia) där boxarna i pre-mRNA:t är exoner och de tjocka strecken mellan dem är introner. Genom att sätta ihop olika kombinationer av exoner får man två olika mRNA:n och därmed två olika proteiner. Dessutom händer det ibland att inte alla introner verkligen klipps bort, vilket ger ännu fler pusselbitar att leka med. Den mer korrekta varianten av dogmen ska alltså snarare vara:

DNA -> flera olika mRNA:n -> flera olika proteiner

Hittills har forskarna generellt ganska dålig koll på vad detta alternativa splitsande egentligen har för betydelse. De flesta har istället satsat hårt de senaste åren på att mäta och jämföra hur mycket mRNA som bildas från olika gener i alla upptänkliga vävnader av alla möjliga utvecklingsstadier hos mer eller mindre alla organismer man fått tag i. Normalt skiljer forskarna då inte på olika varianter av mRNA från samma gen, utan mäter allihopa tillsammans och kallar det för ”nivån på genaktiviteten”.

Vi har vetat ett bra tag nu att alla ryggradsdjur har ganska lika arvsmassor med ungefär samma gener. Inte heller verkar det finnas några markanta skillnader i nivån på genaktiviteten mellan motsvarande organ i olika sorters ryggradsdjur. I alla fall inte tillräckligt stora skillnader för att kunna förklara varför olika ryggradsdjur faktiskt ser ganska olika ut. Men kanske har man mätt fel saker?

I en artikel som publicerades förra året i Science presenterade 17 st forskare att de upptäckt att det finns tydliga skillnader i alternativ splitsning mellan samma organ i olika ryggradsdjur. De mätte både den alternativa splitsningen och nivån på genaktiviteten i flera olika organ i människa, schimpans, orangutang, makak, mus, pungråtta, näbbdjur, kyckling, ödla och groda. Det visade sig dels att alternativ splitsning var vanligare i primater än i de övriga ryggradsdjuren och dels att den alternativa splitsningen var artberoende snarare än organberoende. Tvärtom mot nivån på genaktiviteten som var organberoende snarare än artberoende. Dessa resultat antyder att vi kanske borde ägna mer tid åt att studera alternativ splitsning och mindre tid åt att mäta mängden av olika geners mRNA om vi vill förstå vad som egentligen skiljer de olika ryggradsdjuren åt. Möjligen gäller också samma sak för växter?

Referens: Barbosa-Morais m.fl. (2012) The Evolutionary Landscape of Alternative Splicing in Vertebrate Species. Science 338, s.1587