~讓自己快樂一點~: 期末作業大作戰

1. 利用自己實驗的基因，或虛擬一個。
我要找的gene 是CC2D1A
它的DNA sequence是:
ATGCACAAGAGGAAAGGACCCCCGGGACCCCCGGGCAGAGGCGCCGCGGCCGCCCGCCAGCTGGGCCTGCTGGTTGACCTCTCCCCAGATGGCCTGATGATCCCTGAGGACGGGGCTAACGATGAAGAACTGGAGGCTGAGTTCTTGGCTTTGGTCGGGGGCCAGCCCCCAGCCCTGGAGAAGCTCAAAGGCAAAGGTCCCTTGCCGATGGAGGCCATTGAGAAGATGGCCAGCCTGTGCATGAGAGACCCGGATGAGGATGAGGAGGAGGGGACGGATGAGGACGACTTGGAGGCTGATGATGACCTGCTGGCGGAGCTAAATGAGGTCCTTGGAGAGGAGCAGAAGGCTTCAGAGACCCCACCTCCTGTGGCCCAGCCGAAGCCTGAGGCCCCTCATCCGGGGCTGGAGACCACCTTGCAGGAGAGGCTGGCGCTCTATCAGACAGCAATTGAAAGCGCCAGACAAGCTGGAGACAGCGCCAAGATGCGGCGCTACGATCGGGGGCTTAAAACACTGGAAAACCTGCTCGCCTCCATCCGTAAGGGCAATGCCATTGACGAAGCGGACATCCCGCCGCCAGTGGCCATAGGAAAAGGCCCGGCGTCCACGCCTACCTACAGCCCTGCACCCACCCAGCCGGCCCCTAGAATCGCGTCAGCCCCAGAGCCCAGGGTCACCCTGGAGGGACCTTCTGCCACCGCCCCAGCCTCATCTCCAGGCTTGGCTAAGCCCCAGATGCCCCCAGGTCCCTGCAGCCCTGGCCCTCTGGCCCAGTTGCAGAGCCGCCAGCGCGACTACAAGCTGGCTGCCCTCCACGCCAAGCAGCAGGGAGATACCACTGCTGCCGCTAGACACTTCCGCGTGGCTAAGAGCTTTGATGCTGTCTTGGAGGCCCTGAGCCGGGGTGAGCCCGTGGACCTCTCCTGCCTGCCCCCTCCACCCGACCAGCTGCCCCCAGACCCACCGTCACCACCGTCGCAGCCTCCGACCCCCGCTACGGCGCCCTCCACAACAGAGGTGCCCCCACCCCCGAGGACCCTGCTGGAGGCGCTGGAGCAGCGGATGGAGCGGTACCAGGTGGCCGCAGCCCAGGCCAAGAGCAAGGGGGACCAGCGGAAAGCTCGAATGCACGAGCGCATCGTCAAGCAATACCAAGATGCCATCCGAGCCCACAAGGCTGGCCGAGCCGTGGATGTCGCTGAATTGCCCGTGCCCCCAGGCTTCCCCCCAATCCAGGGCCTGGAGGCCACCAAGCCCACCCAGCAGAGTCTGGTGGGTGTCCTGGAGACTGCCATGAAGCTGGCCAACCAGGATGAAGGCCCAGAGGATGAAGAGGATGAGGTGCCTAAGAAGCAGAACAGCCCTGTGGCCCCCACAGCCCAGCCCAAAGCCCCACCCTCAAGAACTCCCCAGTCGGGATCAGCCCCAACAGCCAAAGCGCCCCCCAAAGCCACATCCACCAGAGCCCAGCAGCAGCTGGCCTTCCTAGAGGGCCGCAAGAAGCAGCTCCTGCAGGCCGCACTGCGAGCCAAGCAGAAAAACGACGTGGAGGGTGCCAAGATGCACCTGCGCCAAGCCAAGGGACTGGAGCCTATGCTGGAGGCCTCGCGCAATGGGCTGCCTGTGGACATCACCAAGGTGCCGCCTGCCCCTGTCAACAAGGACGACTTTGCCCTGGTCCAGCGGCCTGGCCCGGGTCTGTCTCAGGAGGCCGCCCGGCGCTATGGTGAACTCACCAAGCTCATACGGCAGCAGCACGAGATGTGCCTGAACCACTCAAACCAATTCACCCAGCTGGGCAACATCACTGAAACCACCAAGTTTGAAAAGTTGGCGGAGGACTGTAAGCGGAGCATGGACATTCTGAAGCAAGCCTTCGTCCGGGGTCTCCCCACGCCCACCGCCCGCTTTGAGCAAAGGACCTTCAGCGTCATCAAGATCTTCCCTGACCTCAGCAGCAACGACATGCTCCTCTTCATCGTGAAGGGCATCAACTTGCCCACACCCCCAGGACTGTCCCCTGGCGATCTGGATGTCTTTGTTCGGTTTGACTTCCCCTATCCCAACGTGGAAGAAGCTCAGAAAGACAAGACCAGTGTGATCAAGAACACAGACTCCCCTGAGTTCAAGGAGCAGTTCAAACTCTGCATCAACCGCAGCCACCGTGGCTTCCGAAGGGCCATCCAGACCAAGGGCATCAAGTTCGAAGTGGTTCACAAGGGGGGGCTGTTCAAGACTGACCGGGTGCTGGGGACAGCCCAGCTGAAGCTGGATGCACTGGAGATAGCATGTGAGGTCCGGGAGATCCTTGAGGTCCTGGATGGTCGCCGGCCCACAGGGGGGCGACTGGAGGTAATGGTCCGGATTCGGGAGCCACTGACAGCCCAGCAGTTGGAGACGACGACAGAGAGGTGGCTGGTCATTGACCCTGTGCCGGCAGCTGTGCCCACACAGGTTGCTGGGCCCAAAGGGAAGGCCCCTCCTGTGCCTGCCCCTGCAAGGGAGTCAGGGAACAGATCAGCCCGGCCCCTGCATAGCCTCAGTGTGCTGGCGTTTGACCAAGAGCGTCTGGAGCGGAAGATCCTGGCCCTCAGGCAGGCGCGGCGGCCGGTGCCCCCAGAAGTGGCCCAGCAGTACCAGGACATCATGCAACGCAGCCAGTGGCAGAGGGCACAGCTGGAGCAGGGGGGTGTGGGCATCCGACGGGAATACGCAGCCCAGCTGGAGCGGCAGCTGCAGTTCTACACGGAGGCTGCCCGGCGCCTGGGCAACGATGGCAGCAGGGATGCTGCAAAGGAGGCGCTCTATAGGCGGAATCTGGTAGAGAGTGAGCTGCAGCGGCTCCGCAGGTGA

protein sequence:

MHKRKGPPGPPGRGAAAARQLGLLVDLSPDGLMIPEDGANDEELEAEFLALVGGQPPALEKLKGKGPLPMEAIEKMASLCMRDPDEDEEEGTDEDDLEADDDLLAELNEVLGEEQKASETPPPVAQPKPEAPHPGLETTLQERLALYQTAIESARQAGDSAKMRRYDRGLKTLENLLASIRKGNAIDEADIPPPVAIGKGPASTPTYSPAPTQPAPRIASAPEPRVTLEGPSATAPASSPGLAKPQMPPGPCSPGPLAQLQSRQRDYKLAALHAKQQGDTTAAARHFRVAKSFDAVLEALSRGEPVDLSCLPPPPDQLPPDPPSPPSQPPTPATAPSTTEVPPPPRTLLEALEQRMERYQVAAAQAKSKGDQRKARMHERIVKQYQDAIRAHKAGRAVDVAELPVPPGFPPIQGLEATKPTQQSLVGVLETAMKLANQDEGPEDEEDEVPKKQNSPVAPTAQPKAPPSRTPQSGSAPTAKAPPKATSTRAQQQLAFLEGRKKQLLQAALRAKQKNDVEGAKMHLRQAKGLEPMLEASRNGLPVDITKVPPAPVNKDDFALVQRPGPGLSQEAARRYGELTKLIRQQHEMCLNHSNQFTQLGNITETTKFEKLAEDCKRSMDILKQAFVRGLPTPTARFEQRTFSVIKIFPDLSSNDMLLFIVKGINLPTPPGLSPGDLDVFVRFDFPYPNVEEAQKDKTSVIKNTDSPEFKEQFKLCINRSHRGFRRAIQTKGIKFEVVHKGGLFKTDRVLGTAQLKLDALEIACEVREILEVLDGRRPTGGRLEVMVRIREPLTAQQLETTTERWLVIDPVPAAVPTQVAGPKGKAPPVPAPARESGNRSARPLHSLSVLAFDQERLERKILALRQARRPVPPEVAQQYQDIMQRSQWQRAQLEQGGVGIRREYAAQLERQLQFYTEAARRLGNDGSRDAAKEALYRRNLVESELQRLRR

2. 找出相關疾病，相關基因，文獻。
與CC2D1A相關疾病，相關基因詳見: http://iwantfuture.blogspot.tw/2012/10/gene-disgenet.html
文獻的部分, 我們lab有發了一篇CC2D1A參與innate immunity 中RIG-I like signaling pathway的paper

3. 利用 NCBI gene 找出所有相關資訊
點進去就有囉! :)) http://iwantfuture.blogspot.tw/2012/10/ncbi.html

4. 利用 blast 進行至少 10 個物種的序列，進行親緣分析。
先把human的CC2D1A 中 DM14#1 doamin protein sequence丟到NCBI blast中去釣看看有哪些物種會與CC2D1A的DM14#1 seq有高度相似, 結果發現有高度相似的是獼猴或是猩猩的CC2D1A的DM14 doamin

比對不同物種(這邊不選human, 因為我丟進去的就是huamn的CC2D1A的DM14#1 doamin了, 再勾選human的database話出來的就是human了)

設定完成後貼上序列，把網頁拉到下面點選BLAST，

接著只用CLC sequencing軟體來製作phylogenic tree進行親源分析

AAl13969為huamn的DM14#1 doamin，
由tree可以看到人類的DM14#1 doamin 和其他物種的DM14親緣性頗低

5. 在 GEO 中尋找與該基因相關的表達結果。
進入GEO的main page: http://www.ncbi.nlm.nih.gov/geo/
進入以後輸入CC2D1A

進入以後點選圖案, 圖案為疾病與基因的分布圖

回到CC2D1A GEO profiling主畫面, 點選GEO dataset就可以進一步看microarray中各個基因的相關性

紅色是高度相關, 綠色是相關性比較低的gene, 還可以點放大圖喔! 就是把游標移到下圖中, 顯示反灰的部分可以進一步看相關性gene放大圖

右邊是gene list, 圖中偏紅色是高度相關, 綠色是相關性較低

6. 利用 GEO 與 2. 的結果，以 string 進行 PPI 分析。

先進去STRING的main page: http://string-db.org/ 分析蛋白質與蛋白質之間的關係
輸入CC2D1A

出現很多種的CC2D1A, 像是human, 老鼠的, 或是猩猩的, 我選擇human的CC2D1A看看有哪些protien會跟CC2D1A有interaction

出來了! 與human CC2D1A會有interaction的protien有: HTR1A, DRD2等等, 下面還有

CC2D1A的簡介以及這些與CC2D1A有interaction的protein的簡介唷!

另外, 點擊confidence的話就可以看這些protien與CC2D1A interaction的可信程度喔!

(結果如下) 較粗深藍色的線是interaction比較強的!

7. 再以 string 結果以 GEO 結果比對，預測你的實驗結果。

比較GEO的結果與STRING的結果發現, GEO search CC2D1A的結果與Aldosterone-producing adeonoma（原發性高醛固酮症）比較有關係, 但是STRING search CC2D1A的結果發現與HTR1A較有關係, 而HTRIA與神經比較有關係

用 string 結果跟 GEO 結果比較的結果還是有落差, 但也可能是輸入的關鍵字不夠精準導致這樣的結果

8. 將該基因進行蛋白質結構預測

由於在RCSB Protein database無法搜尋到CC2D1A的蛋白質結構，
我轉而查詢了RIG-I的結構，RIG-I是innate immune中的PRR, 屬於RIG-I like signaling主要的成員之一, 目前我們的實驗室發現CC2D1A在RIG-I的下游可以去活化IFN-beta抵禦並毒的入侵
我使用PyMol進行RIG-I的結構分析。

詳細請見: http://iwantfuture.blogspot.tw/2013/01/pymolproteinstructure-protein.html

~讓自己快樂一點~

2013年1月24日星期四

期末作業大作戰

沒有留言:

張貼留言

2013年1月24日 星期四

期末作業大作戰

沒有留言:

張貼留言

2013年1月24日星期四