2013年1月24日 星期四

期末作業大作戰

1. 利用自己實驗的基因,或虛擬一個。
我要找的gene 是CC2D1A
它的DNA sequence是:
ATGCACAAGAGGAAAGGACCCCCGGGACCCCCGGGCAGAGGCGCCGCGGCCGCCCGCCAGCTGGGCCTGCTGGTTGACCTCTCCCCAGATGGCCTGATGATCCCTGAGGACGGGGCTAACGATGAAGAACTGGAGGCTGAGTTCTTGGCTTTGGTCGGGGGCCAGCCCCCAGCCCTGGAGAAGCTCAAAGGCAAAGGTCCCTTGCCGATGGAGGCCATTGAGAAGATGGCCAGCCTGTGCATGAGAGACCCGGATGAGGATGAGGAGGAGGGGACGGATGAGGACGACTTGGAGGCTGATGATGACCTGCTGGCGGAGCTAAATGAGGTCCTTGGAGAGGAGCAGAAGGCTTCAGAGACCCCACCTCCTGTGGCCCAGCCGAAGCCTGAGGCCCCTCATCCGGGGCTGGAGACCACCTTGCAGGAGAGGCTGGCGCTCTATCAGACAGCAATTGAAAGCGCCAGACAAGCTGGAGACAGCGCCAAGATGCGGCGCTACGATCGGGGGCTTAAAACACTGGAAAACCTGCTCGCCTCCATCCGTAAGGGCAATGCCATTGACGAAGCGGACATCCCGCCGCCAGTGGCCATAGGAAAAGGCCCGGCGTCCACGCCTACCTACAGCCCTGCACCCACCCAGCCGGCCCCTAGAATCGCGTCAGCCCCAGAGCCCAGGGTCACCCTGGAGGGACCTTCTGCCACCGCCCCAGCCTCATCTCCAGGCTTGGCTAAGCCCCAGATGCCCCCAGGTCCCTGCAGCCCTGGCCCTCTGGCCCAGTTGCAGAGCCGCCAGCGCGACTACAAGCTGGCTGCCCTCCACGCCAAGCAGCAGGGAGATACCACTGCTGCCGCTAGACACTTCCGCGTGGCTAAGAGCTTTGATGCTGTCTTGGAGGCCCTGAGCCGGGGTGAGCCCGTGGACCTCTCCTGCCTGCCCCCTCCACCCGACCAGCTGCCCCCAGACCCACCGTCACCACCGTCGCAGCCTCCGACCCCCGCTACGGCGCCCTCCACAACAGAGGTGCCCCCACCCCCGAGGACCCTGCTGGAGGCGCTGGAGCAGCGGATGGAGCGGTACCAGGTGGCCGCAGCCCAGGCCAAGAGCAAGGGGGACCAGCGGAAAGCTCGAATGCACGAGCGCATCGTCAAGCAATACCAAGATGCCATCCGAGCCCACAAGGCTGGCCGAGCCGTGGATGTCGCTGAATTGCCCGTGCCCCCAGGCTTCCCCCCAATCCAGGGCCTGGAGGCCACCAAGCCCACCCAGCAGAGTCTGGTGGGTGTCCTGGAGACTGCCATGAAGCTGGCCAACCAGGATGAAGGCCCAGAGGATGAAGAGGATGAGGTGCCTAAGAAGCAGAACAGCCCTGTGGCCCCCACAGCCCAGCCCAAAGCCCCACCCTCAAGAACTCCCCAGTCGGGATCAGCCCCAACAGCCAAAGCGCCCCCCAAAGCCACATCCACCAGAGCCCAGCAGCAGCTGGCCTTCCTAGAGGGCCGCAAGAAGCAGCTCCTGCAGGCCGCACTGCGAGCCAAGCAGAAAAACGACGTGGAGGGTGCCAAGATGCACCTGCGCCAAGCCAAGGGACTGGAGCCTATGCTGGAGGCCTCGCGCAATGGGCTGCCTGTGGACATCACCAAGGTGCCGCCTGCCCCTGTCAACAAGGACGACTTTGCCCTGGTCCAGCGGCCTGGCCCGGGTCTGTCTCAGGAGGCCGCCCGGCGCTATGGTGAACTCACCAAGCTCATACGGCAGCAGCACGAGATGTGCCTGAACCACTCAAACCAATTCACCCAGCTGGGCAACATCACTGAAACCACCAAGTTTGAAAAGTTGGCGGAGGACTGTAAGCGGAGCATGGACATTCTGAAGCAAGCCTTCGTCCGGGGTCTCCCCACGCCCACCGCCCGCTTTGAGCAAAGGACCTTCAGCGTCATCAAGATCTTCCCTGACCTCAGCAGCAACGACATGCTCCTCTTCATCGTGAAGGGCATCAACTTGCCCACACCCCCAGGACTGTCCCCTGGCGATCTGGATGTCTTTGTTCGGTTTGACTTCCCCTATCCCAACGTGGAAGAAGCTCAGAAAGACAAGACCAGTGTGATCAAGAACACAGACTCCCCTGAGTTCAAGGAGCAGTTCAAACTCTGCATCAACCGCAGCCACCGTGGCTTCCGAAGGGCCATCCAGACCAAGGGCATCAAGTTCGAAGTGGTTCACAAGGGGGGGCTGTTCAAGACTGACCGGGTGCTGGGGACAGCCCAGCTGAAGCTGGATGCACTGGAGATAGCATGTGAGGTCCGGGAGATCCTTGAGGTCCTGGATGGTCGCCGGCCCACAGGGGGGCGACTGGAGGTAATGGTCCGGATTCGGGAGCCACTGACAGCCCAGCAGTTGGAGACGACGACAGAGAGGTGGCTGGTCATTGACCCTGTGCCGGCAGCTGTGCCCACACAGGTTGCTGGGCCCAAAGGGAAGGCCCCTCCTGTGCCTGCCCCTGCAAGGGAGTCAGGGAACAGATCAGCCCGGCCCCTGCATAGCCTCAGTGTGCTGGCGTTTGACCAAGAGCGTCTGGAGCGGAAGATCCTGGCCCTCAGGCAGGCGCGGCGGCCGGTGCCCCCAGAAGTGGCCCAGCAGTACCAGGACATCATGCAACGCAGCCAGTGGCAGAGGGCACAGCTGGAGCAGGGGGGTGTGGGCATCCGACGGGAATACGCAGCCCAGCTGGAGCGGCAGCTGCAGTTCTACACGGAGGCTGCCCGGCGCCTGGGCAACGATGGCAGCAGGGATGCTGCAAAGGAGGCGCTCTATAGGCGGAATCTGGTAGAGAGTGAGCTGCAGCGGCTCCGCAGGTGA

protein  sequence:
MHKRKGPPGPPGRGAAAARQLGLLVDLSPDGLMIPEDGANDEELEAEFLALVGGQPPALEKLKGKGPLPMEAIEKMASLCMRDPDEDEEEGTDEDDLEADDDLLAELNEVLGEEQKASETPPPVAQPKPEAPHPGLETTLQERLALYQTAIESARQAGDSAKMRRYDRGLKTLENLLASIRKGNAIDEADIPPPVAIGKGPASTPTYSPAPTQPAPRIASAPEPRVTLEGPSATAPASSPGLAKPQMPPGPCSPGPLAQLQSRQRDYKLAALHAKQQGDTTAAARHFRVAKSFDAVLEALSRGEPVDLSCLPPPPDQLPPDPPSPPSQPPTPATAPSTTEVPPPPRTLLEALEQRMERYQVAAAQAKSKGDQRKARMHERIVKQYQDAIRAHKAGRAVDVAELPVPPGFPPIQGLEATKPTQQSLVGVLETAMKLANQDEGPEDEEDEVPKKQNSPVAPTAQPKAPPSRTPQSGSAPTAKAPPKATSTRAQQQLAFLEGRKKQLLQAALRAKQKNDVEGAKMHLRQAKGLEPMLEASRNGLPVDITKVPPAPVNKDDFALVQRPGPGLSQEAARRYGELTKLIRQQHEMCLNHSNQFTQLGNITETTKFEKLAEDCKRSMDILKQAFVRGLPTPTARFEQRTFSVIKIFPDLSSNDMLLFIVKGINLPTPPGLSPGDLDVFVRFDFPYPNVEEAQKDKTSVIKNTDSPEFKEQFKLCINRSHRGFRRAIQTKGIKFEVVHKGGLFKTDRVLGTAQLKLDALEIACEVREILEVLDGRRPTGGRLEVMVRIREPLTAQQLETTTERWLVIDPVPAAVPTQVAGPKGKAPPVPAPARESGNRSARPLHSLSVLAFDQERLERKILALRQARRPVPPEVAQQYQDIMQRSQWQRAQLEQGGVGIRREYAAQLERQLQFYTEAARRLGNDGSRDAAKEALYRRNLVESELQRLRR 


2. 找出相關疾病,相關基因,文獻。
與CC2D1A相關疾病,相關基因詳見: http://iwantfuture.blogspot.tw/2012/10/gene-disgenet.html
文獻的部分, 我們lab有發了一篇CC2D1A參與innate immunity 中RIG-I like signaling pathway的paper

3. 利用 NCBI gene 找出所有相關資訊
點進去就有囉! :)) http://iwantfuture.blogspot.tw/2012/10/ncbi.html

4. 利用 blast 進行至少 10 個物種的序列,進行親緣分析。
先把human的CC2D1A 中 DM14#1 doamin protein sequence丟到NCBI blast中去釣看看有哪些物種會與CC2D1A的DM14#1 seq有高度相似, 結果發現有高度相似的是 獼猴或是猩猩的CC2D1A的DM14 doamin


比對不同物種(這邊不選human, 因為我丟進去的就是huamn的CC2D1A的DM14#1 doamin了, 再勾選human的database話出來的就是human了)
設定完成後貼上序列,把網頁拉到下面點選BLAST,
接著只用CLC sequencing軟體來製作phylogenic tree進行親源分析







AAl13969為huamn的DM14#1 doamin,
由tree可以看到人類的DM14#1 doamin 和其他物種的DM14親緣性頗低


5. 在 GEO 中尋找與該基因相關的表達結果。
進入GEO的main page: http://www.ncbi.nlm.nih.gov/geo/   
進入以後輸入CC2D1A
進入以後點選圖案, 圖案為疾病與基因的分布圖
回到CC2D1A GEO profiling主畫面, 點選GEO dataset就可以進一步看microarray中各個基因的相關性
紅色是高度相關, 綠色是相關性比較低的gene, 還可以點放大圖喔! 就是把游標移到下圖中, 顯示反灰的部分可以進一步看相關性gene放大圖

右邊是gene list, 圖中偏紅色是高度相關, 綠色是相關性較低


6. 利用 GEO 與 2. 的結果,以 string 進行 PPI 分析。


先進去STRING的main page: http://string-db.org/    分析蛋白質與蛋白質之間的關係
輸入CC2D1A
出現很多種的CC2D1A, 像是human, 老鼠的, 或是猩猩的, 我選擇human的CC2D1A看看有哪些protien會跟CC2D1A有interaction
出來了! 與human CC2D1A會有interaction的protien有: HTR1A, DRD2等等, 下面還有
CC2D1A的簡介以及這些與CC2D1A有interaction的protein的簡介唷!
另外, 點擊confidence的話就可以看這些protien與CC2D1A interaction的可信程度喔!
(結果如下) 較粗深藍色的線是interaction比較強的!

7. 再以 string 結果以 GEO 結果比對,預測你的實驗結果。
比較GEO的結果與STRING的結果發現, GEO search CC2D1A的結果與Aldosterone-producing adeonoma(原發性高醛固酮症)比較有關係, 但是STRING search CC2D1A的結果發現與HTR1A較有關係, 而HTRIA與神經比較有關係
 string 結果跟 GEO 結果比較的結果還是有落差, 但也可能是輸入的關鍵字不夠精準導致這樣的結果


8. 將該基因進行蛋白質結構預測


由於在RCSB Protein database無法搜尋到CC2D1A的蛋白質結構,
我轉而查詢了RIG-I的結構,RIG-I是innate immune中的PRR, 屬於RIG-I like signaling主要的成員之一, 目前我們的實驗室發現CC2D1A在RIG-I的下游可以去活化IFN-beta抵禦並毒的入侵
我使用PyMol進行RIG-I的結構分析。

詳細請見: http://iwantfuture.blogspot.tw/2013/01/pymolproteinstructure-protein.html




沒有留言:

張貼留言