Suvi Karhu AUTO3070 Geneettiset algoritmit

Slides:



Advertisements
Samankaltaiset esitykset
Active directory.
Advertisements

Tietokannan suunnittelu
Preppaus ENA 4.
Ravintoaineet ja niiden merkitys ihmiselle
Proteiinit.
TVT ja SoMe Jonna ja Johanna.
Laskuharjoitus 9 AS Automaation signaalinkäsittelymenetelmät Sumea säätö Geneettiset algoritmit.
AS Automaation signaalinkäsittelymenetelmät
Transkriptiossa syntyy m-rna (lähetti-rna).
Solusimulaattorit S Laskennallinen systeemibiologia Sebastian Köhler.
RNA-rakenteen ennustaminen - Circles Vesa Riihimäki S Solubiosysteemien perusteet.
1 Geneettiset algoritmit S Laskennallinen systeemibiologia Olli Haavisto
RSA – Julkisen avaimen salakirjoitusmenetelmä Perusteet, algoritmit, hyökkäykset Matti K. Sinisalo, FL.
Riippuvuus tupakoinnista
Syksy 2001Johdatus bioinformatiikkaan / T. Pasanen 1 7. Monirinnastus Geeni perhe: ryhmä läheisiä toisilleen sukua olevia geenejä, jotka koodaavat samankaltaisia.
Ohjelmistotekniikka - Tenttiin valmistautumisesta Kevät 2003 Hanna-Kaisa Lammi LTY/Tite.
2. Vuokaaviot.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Antti Levo Systeemitieteiden kandidaattiseminaari – Kevät 2010 Monitavoitteiseen optimointiin soveltuvan.
Hakemistorakenteet biologisille aineistoille
1. lukion kemian kurssin toteutus Tavoite Opiskelijat *saavat käsityksen kemian mahdollisuuksista * innostuvat opiskelemaan kemiaa *oppivat havainnoimaan.
Francis Crick ja James D. Watson
Introduction to bioinformatics T.K. Attwood & D.J. Parry-Smith Addison Wesley Longman Limited 1999.
Proteiinien laskostuminen
Bioinformatiikan verkkokurssit
Graafialgoritmit laskennal- lisessa systeemibiologiassa Graph Algorithms in Computational Systems Biology Työn valvoja ja ohjaaja: Prof. Patric Östergård,
Fraktaalit Johannes Weckman
Hiilihydraatit Monosakkarideillä on sekä suoraketjuinen että rengasrakenteinen muoto Renkaat voivat liittyä toisiinsa polykondensaatioreaktiolla, jossa.
Heuristinen arviointi Käyttöliittymäseminaari Jere Salonen.
Johdatus bioinformatiikkaan
Jari Kyngäs, Cimmo Nurmi Oppivat ja älykkäät heuristiset järjestelmät NP-vaikean aikataulutusongelman ratkaisemisessa (Learning and Intelligent Heuristic.
Geenit.
Muovien kierrätys.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 25 - Mark Mehtonen Optimointiopin seminaari - Syksy 2005 / 1 The Chain Rule for Influence.
S ysteemianalyysin Laboratorio Aalto-yliopiston teknillinen korkeakoulu Ohjaamaton oppiminen– Heikki Vesterinen Optimointiopin seminaari - Syksy 2010 Ohjaamaton.
Proteiinien matka suusta soluille
Proteiinien tehtävät elimistössä
Fotosynteesi.
KIVIHIILEN KORVAAMINEN ENERGIAN TUOTANNOSSA
Mikä on geenien rooli mikro- ja makroevoluutiossa?
Bakteerien rakenne ja patogeeniset bakteerit
1 Sensor Tasking and Control Jari Hassinen Riikka Asikainen
Molekylaarinen laskenta Biolaskenta (Bioinformatiikka) Jussi Parkkinen Joensuun yliopisto.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 12 – Alexander Franck Optimointiopin seminaari - Kevät 2010 Rationalisoituvuus ja yleinen.
Kuinka kuvata materiaalin puristuvuutta tabletin kehityksen optimoimiseksi ? Laura Yrjänäinen Perustuu konferenssitiivistelmään: C.M.D. Gabaude,
Oppimisryhmien kuulumisia. Oppimisryhmät Ryhmä 5 Tehotytöt Team Trinity Rämmät JASS Team 75% Integrointi-pantterit.
Solukalvon tarkka rakenne ja toiminta
9. Dna.
TERVETULOA SOLUN JA PERINNÖLLISYYDEN MAAILMAAN
DNA:n & RNA:n rakenne ja toiminta
Solujen jakautuminen Solusyklissä vaihtelevat välivaihe ja jakautumisvaihe Solusyklissä vaihtelevat välivaihe ja jakautumisvaihe - yleensä välivaihe kestää.
14. Aminohapot ja valkuaisaineet  Aminohapon rakenteessa on sekä aminoryhmä -NH 2 ja karboksyyliryhmä –COOH  Aminoryhmä on yleensä liittynyt karboksyyliryhmän.
BIOS BIOS 2 jakso 1 Geenit ohjaavat proteiinien rakentumista 4 aminohappo DNA emäskolmikko geeni Golgin laite koodaava juoste lähetti-RNA mallijuoste Avainsanat.
Solujen kemiallinen rakenne.  Solujen yleisimmät alkuaineet: o Hiili (C) o Vety (H) o Happi (O) o Typpi (N)  Solujen yhdisteet voivat olla: o Orgaanisia.
2. Solun hienorakenne.
Ruuansulatus Ihminen koostuu: vedestä, noin 63% painosta
1. Energia liikeilmiöissä
Jaksollinen järjestelmä
HORMONIT Elimistön kemiallisia lähettejä (vrt. hermosto)
Avoketjuisen rakenteen lisäksi monosakkaridit esiintyvät heterosyklisinä rengasrakenteina, joissa karbonyyliryhmän happi on osa rengasrakennetta.
Kpl 1-3 SOLU.
11. Perinnöllisyys ja ympäristö
Geeni vaikuttaa ominaisuuksiin eri tavoin
Ravintoaineet Hiilihydraatit pilkkoutuvat ruuansulatuksessa glukoosimolekyyleiksi. Verenkierron kautta glukoosi imeytyy soluihin. Soluhengityksessä glukoosi.
Tilastollinen koneoppiminen -lyhyt oppimäärä-
5 Solun toimintaohjeet ovat geeneissä.
Perinnöllisyystieteen perusteita
HIV-1 Nef Rakenne ja toiminta
12. Luonnonvalinta.
Lukion biologia Eliömaailma BI 1.
Esityksen transkriptio:

Suvi Karhu AUTO3070 Geneettiset algoritmit GA ja proteiinit Suvi Karhu AUTO3070 Geneettiset algoritmit

Proteiinit Aminohapoista koostuvia orgaanisia yhdisteitä, jotka toimivat mm. Kudosten rakennusaineina, esim. kollageeni Entsyymeinä, esim. laktaasi Aineiden kuljettajina: esim. hemoglobiini Vasta-aineina, esim. immunoglobuliinit Reseptoreina Myrkkyinä, esim. botuliini Hormoneina, esim. insuliini Geenien säätelijöinä

Proteiinisynteesi Proteiinisynteesissä solu valmistaa proteiineja DNA:ssa olevan informaation perusteella Vaiheet: Transkriptiossa DNA:n nukleotidijärjestys kopioidaan lähetti-RNA:han Lähetti-RNA siirtyy ribosomiin, missä nukleotidien järjestys käännetään polypeptidiketjun aminohappojärjestykseksi. (=Translaatio) Proteiini laskostuu 3-ulotteiseen muotoonsa

GA ja proteiinit Seuraavaksi muutama esimerkki proteiineihin liittyvistä GA:n sovelluksista…

Aminohappoaakkoston yksinkertaistaminen

Aminohappoaakkoston yksinkertaistaminen Proteiinit muodostuvat 20 eri aminohaposta -> proteiinin aminohapposekvenssi voidaan kuvata käyttämällä 20 kirjainta…

Alaniini (Ala / A) Arginiini (Arg / R) Asparagiini (Asn / N) Asparagiinihappo (Asp / D) Kysteiini (Cys / C) Glutamiinihappo (Glu / E) Glutamiini (Gln / Q) Glysiini (Gly / G) Histidiini (His / H) Isoleusiini (Ile / I) Leusiini (Leu / L) Lysiini (Lys / K) Metioniini (Met / M) Fenyylialaniini (Phe / F) Proliini (Pro / P) Seriini (Ser / S) Treoniini (Thr / T) Tryptofaani (Trp / W) Tyrosiini (Tyr / Y) Valiini (Val / V)

…mutta Erilaisia aminohapposekvenssejä on enemmän kuin erilaisia proteiinirakenteita Kaksi eri sekvenssiä saattaa tuottaa samanlaisen proteiinin Esim. …SKA… (seriini, lysiini, alaniini) …TKA… (treoniini, lysiini, alaniini) Seriinillä ja treoniinilla on samantapaiset kemialliset ominaisuudet -> ei välttämättä ole väliä kumpi niistä esiintyy sekvenssissä Aminohappojen ominaisuuksia: http://fi.wikipedia.org/wiki/Aminohappo#Aminohappojen_ryhmittely

…joten Proteiinin rakenne voidaan kuvata vähemmällä kuin 20 kirjaimella Miksi tarvitaan? Proteiinin rakenteen kuvaamisen yksinkertaistamiseksi ->Helpompi vertailla, miten eri aminohapot vaikuttavat proteiinin toimintaan

Ratkaisu? Samankaltaisten aminohappojen ryhmittely (klusterointi, clustering) Esim. yhdistetään seriini ja treoniini: merkitään X:llä {S tai T} Ongelma: Mikä on optimaalinen ryhmittely? ~ Lukujen ositusongelma. NP-täydellinen eli laskennallisesti erittäin vaativa ongelma. GA:ta on kokeiltu ongelman ratkaisemiseen…

GA Aloituspopulaatio: Luodaan satunnainen joukko ryhmittelyjä Cross-over: Valitaan satunnainen aminohappo, esim. a Etsitään vanhemmilta ne klusterit, joissa äsken valittu aminohappo esiintyy esim. {almrq}, {aps} Yhdistetään nämä klusterit uudeksi klusteriksi ->{almpqs}

GA Ei mutaatiota, koska satunnaisuus haitallista Tulokset: Lähde Suunnilleen yhtä hyviä kuin muilla menetelmillä saadut GA nopeampi Lähde Palensky, M.; Ali, H.; , "A genetic algorithm for simplifying the amino acid alphabet," Bioinformatics Conference, 2003. CSB 2003. Proceedings of the 2003 IEEE , vol., no., pp. 598- 599, 11-14 Aug. 2003 doi: 10.1109/CSB.2003.1227418 URL: http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=1227418&isnumber=27543

Motiivien etsintä

Motiivien etsintä Motiivit ovat lyhyehköjä nukleotidijaksoja tai aminohappojaksoja, jotka toistuvat usein DNA-sekvenssissä tai aminohapposekvenssissä Motiiveilla on jokin tärkeä biologinen merkitys, esim. DNA-motiivit määrittelevät proteiinisynteesin aloittamisessa tarvittavien transkriptiofaktoreiden kiinnittymiskohdan DNA-kierteessä

Esimerkki (koskee DNA:ta) sekvenssi1 CTAGCGGACTAGG Motiivien ei ole pakko toistua aina täysin samanlaisina, vaan ne voivat erota muutaman nukleotidin/aminohapon osalta Esimerkki (koskee DNA:ta) sekvenssi1 CTAGCGGACTAGG sekvenssi2 TAGCTGGACTACT sekvenssi3 CATCAGGAATAAG ->motiivi on GGAMTA, missä M tarkoittaa ”C tai A” IUPAC ambiguity codes

Motiivien löytämiseksi on kehitetty erilaisia algoritmeja Myös GA:ta voidaan käyttää

GA ja motiivien etsintä Generoidaan satunnaisia motiiveja, lasketaan mitkä niistä parhaiten kuvaavat sekvenssissä toistuvia jaksoja, ja risteytetään parhaita yritteitä Mutaatiossa vältetään muuttamasta motiivin ”parhaita kohtia” Lähde: Liu, F.F.M.; Tsai, J.J.P.; Chen, R.M.; Chen, S.N.; Shih, S.H.; , "FMGA: finding motifs by genetic algorithm," Bioinformatics and Bioengineering, 2004. BIBE 2004. Proceedings. Fourth IEEE Symposium on , vol., no., pp. 459- 466, 19-21 May 2004 doi: 10.1109/BIBE.2004.1317378 URL: http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=1317378&isnumber=29175

Proteiinin rakenteen ennustaminen

Proteiinin rakenteen ennustaminen Proteiinin rakenteet: Primäärirakenne = aminohappojärjestys Sekundäärirakenne muodostuu, kun aminohappoketjuun tulee paikallisia rakenteita, kuten α-heliksi ja β-laskos.

Proteiinin rakenteen ennustaminen Tertiäärirakenne on proteiinin lopullinen 3-ulotteinen muoto, joka muodostuu mm. α-heliksien ja β-laskosten välisestä vuorovaikutuksesta. Proteiinin 3-ulotteinen rakenne määrää proteiinin toiminnan.

Proteiinin rakenteen ennustaminen Laskostumisesta ollaan kiinnostuneita mm. siksi, että monet sairaudet johtuvat virheistä proteiinin laskostumisessa, esim. Alzheimer, Parkinson, hullun lehmän tauti, allergioita

Proteiinin rakenteen ennustaminen Lääkkeiden teho perustuu yleensä jonkin proteiinin aktiivisuuden muuttamiseen elimistössä Tietoa proteiinin 3-ulotteisesta rakenteesta voidaan hyödyntää lääkkeiden suunnittelussa

Proteiinin rakenteen ennustaminen 3-ulotteinen rakenne voidaan selvittää kokeellisin menetelmin, mutta se on työlästä. Röntgensädekristallografia Ydinmagneettinen resonanssi (NMR) Olisi helpompaa jos tertiäärirakenne voitaisiin ennustaa suoraan primäärirakenteesta.

Proteiinin rakenteen ennustaminen Tertiäärirakenteen ennustaminen aminohapposekvenssistä on vaikeaa. N aminohappoa -> 10N eri konformaatiota

Proteiinin rakenteen ennustaminen Ennustamisessa voidaan käyttää tietoa, että tertiäärirakenteessa proteiinin potentiaalienergia on minimissään GA:ta voidaan käyttää minimoimaan energiaa Yritteet ovat geometrisia esityksiä mahdollisista proteiinin rakenteista Hyvyysfunktio on rakenteen potentiaalienergia Yritteitä, joilla on pienin energia, risteytetään ja mutatoidaan, kunnes saadaan mahdollisimman pienienergiainen yrite