2013年1月24日 星期四

期末作業大作戰

1. 利用自己實驗的基因,或虛擬一個。
我要找的gene 是CC2D1A
它的DNA sequence是:
ATGCACAAGAGGAAAGGACCCCCGGGACCCCCGGGCAGAGGCGCCGCGGCCGCCCGCCAGCTGGGCCTGCTGGTTGACCTCTCCCCAGATGGCCTGATGATCCCTGAGGACGGGGCTAACGATGAAGAACTGGAGGCTGAGTTCTTGGCTTTGGTCGGGGGCCAGCCCCCAGCCCTGGAGAAGCTCAAAGGCAAAGGTCCCTTGCCGATGGAGGCCATTGAGAAGATGGCCAGCCTGTGCATGAGAGACCCGGATGAGGATGAGGAGGAGGGGACGGATGAGGACGACTTGGAGGCTGATGATGACCTGCTGGCGGAGCTAAATGAGGTCCTTGGAGAGGAGCAGAAGGCTTCAGAGACCCCACCTCCTGTGGCCCAGCCGAAGCCTGAGGCCCCTCATCCGGGGCTGGAGACCACCTTGCAGGAGAGGCTGGCGCTCTATCAGACAGCAATTGAAAGCGCCAGACAAGCTGGAGACAGCGCCAAGATGCGGCGCTACGATCGGGGGCTTAAAACACTGGAAAACCTGCTCGCCTCCATCCGTAAGGGCAATGCCATTGACGAAGCGGACATCCCGCCGCCAGTGGCCATAGGAAAAGGCCCGGCGTCCACGCCTACCTACAGCCCTGCACCCACCCAGCCGGCCCCTAGAATCGCGTCAGCCCCAGAGCCCAGGGTCACCCTGGAGGGACCTTCTGCCACCGCCCCAGCCTCATCTCCAGGCTTGGCTAAGCCCCAGATGCCCCCAGGTCCCTGCAGCCCTGGCCCTCTGGCCCAGTTGCAGAGCCGCCAGCGCGACTACAAGCTGGCTGCCCTCCACGCCAAGCAGCAGGGAGATACCACTGCTGCCGCTAGACACTTCCGCGTGGCTAAGAGCTTTGATGCTGTCTTGGAGGCCCTGAGCCGGGGTGAGCCCGTGGACCTCTCCTGCCTGCCCCCTCCACCCGACCAGCTGCCCCCAGACCCACCGTCACCACCGTCGCAGCCTCCGACCCCCGCTACGGCGCCCTCCACAACAGAGGTGCCCCCACCCCCGAGGACCCTGCTGGAGGCGCTGGAGCAGCGGATGGAGCGGTACCAGGTGGCCGCAGCCCAGGCCAAGAGCAAGGGGGACCAGCGGAAAGCTCGAATGCACGAGCGCATCGTCAAGCAATACCAAGATGCCATCCGAGCCCACAAGGCTGGCCGAGCCGTGGATGTCGCTGAATTGCCCGTGCCCCCAGGCTTCCCCCCAATCCAGGGCCTGGAGGCCACCAAGCCCACCCAGCAGAGTCTGGTGGGTGTCCTGGAGACTGCCATGAAGCTGGCCAACCAGGATGAAGGCCCAGAGGATGAAGAGGATGAGGTGCCTAAGAAGCAGAACAGCCCTGTGGCCCCCACAGCCCAGCCCAAAGCCCCACCCTCAAGAACTCCCCAGTCGGGATCAGCCCCAACAGCCAAAGCGCCCCCCAAAGCCACATCCACCAGAGCCCAGCAGCAGCTGGCCTTCCTAGAGGGCCGCAAGAAGCAGCTCCTGCAGGCCGCACTGCGAGCCAAGCAGAAAAACGACGTGGAGGGTGCCAAGATGCACCTGCGCCAAGCCAAGGGACTGGAGCCTATGCTGGAGGCCTCGCGCAATGGGCTGCCTGTGGACATCACCAAGGTGCCGCCTGCCCCTGTCAACAAGGACGACTTTGCCCTGGTCCAGCGGCCTGGCCCGGGTCTGTCTCAGGAGGCCGCCCGGCGCTATGGTGAACTCACCAAGCTCATACGGCAGCAGCACGAGATGTGCCTGAACCACTCAAACCAATTCACCCAGCTGGGCAACATCACTGAAACCACCAAGTTTGAAAAGTTGGCGGAGGACTGTAAGCGGAGCATGGACATTCTGAAGCAAGCCTTCGTCCGGGGTCTCCCCACGCCCACCGCCCGCTTTGAGCAAAGGACCTTCAGCGTCATCAAGATCTTCCCTGACCTCAGCAGCAACGACATGCTCCTCTTCATCGTGAAGGGCATCAACTTGCCCACACCCCCAGGACTGTCCCCTGGCGATCTGGATGTCTTTGTTCGGTTTGACTTCCCCTATCCCAACGTGGAAGAAGCTCAGAAAGACAAGACCAGTGTGATCAAGAACACAGACTCCCCTGAGTTCAAGGAGCAGTTCAAACTCTGCATCAACCGCAGCCACCGTGGCTTCCGAAGGGCCATCCAGACCAAGGGCATCAAGTTCGAAGTGGTTCACAAGGGGGGGCTGTTCAAGACTGACCGGGTGCTGGGGACAGCCCAGCTGAAGCTGGATGCACTGGAGATAGCATGTGAGGTCCGGGAGATCCTTGAGGTCCTGGATGGTCGCCGGCCCACAGGGGGGCGACTGGAGGTAATGGTCCGGATTCGGGAGCCACTGACAGCCCAGCAGTTGGAGACGACGACAGAGAGGTGGCTGGTCATTGACCCTGTGCCGGCAGCTGTGCCCACACAGGTTGCTGGGCCCAAAGGGAAGGCCCCTCCTGTGCCTGCCCCTGCAAGGGAGTCAGGGAACAGATCAGCCCGGCCCCTGCATAGCCTCAGTGTGCTGGCGTTTGACCAAGAGCGTCTGGAGCGGAAGATCCTGGCCCTCAGGCAGGCGCGGCGGCCGGTGCCCCCAGAAGTGGCCCAGCAGTACCAGGACATCATGCAACGCAGCCAGTGGCAGAGGGCACAGCTGGAGCAGGGGGGTGTGGGCATCCGACGGGAATACGCAGCCCAGCTGGAGCGGCAGCTGCAGTTCTACACGGAGGCTGCCCGGCGCCTGGGCAACGATGGCAGCAGGGATGCTGCAAAGGAGGCGCTCTATAGGCGGAATCTGGTAGAGAGTGAGCTGCAGCGGCTCCGCAGGTGA

protein  sequence:
MHKRKGPPGPPGRGAAAARQLGLLVDLSPDGLMIPEDGANDEELEAEFLALVGGQPPALEKLKGKGPLPMEAIEKMASLCMRDPDEDEEEGTDEDDLEADDDLLAELNEVLGEEQKASETPPPVAQPKPEAPHPGLETTLQERLALYQTAIESARQAGDSAKMRRYDRGLKTLENLLASIRKGNAIDEADIPPPVAIGKGPASTPTYSPAPTQPAPRIASAPEPRVTLEGPSATAPASSPGLAKPQMPPGPCSPGPLAQLQSRQRDYKLAALHAKQQGDTTAAARHFRVAKSFDAVLEALSRGEPVDLSCLPPPPDQLPPDPPSPPSQPPTPATAPSTTEVPPPPRTLLEALEQRMERYQVAAAQAKSKGDQRKARMHERIVKQYQDAIRAHKAGRAVDVAELPVPPGFPPIQGLEATKPTQQSLVGVLETAMKLANQDEGPEDEEDEVPKKQNSPVAPTAQPKAPPSRTPQSGSAPTAKAPPKATSTRAQQQLAFLEGRKKQLLQAALRAKQKNDVEGAKMHLRQAKGLEPMLEASRNGLPVDITKVPPAPVNKDDFALVQRPGPGLSQEAARRYGELTKLIRQQHEMCLNHSNQFTQLGNITETTKFEKLAEDCKRSMDILKQAFVRGLPTPTARFEQRTFSVIKIFPDLSSNDMLLFIVKGINLPTPPGLSPGDLDVFVRFDFPYPNVEEAQKDKTSVIKNTDSPEFKEQFKLCINRSHRGFRRAIQTKGIKFEVVHKGGLFKTDRVLGTAQLKLDALEIACEVREILEVLDGRRPTGGRLEVMVRIREPLTAQQLETTTERWLVIDPVPAAVPTQVAGPKGKAPPVPAPARESGNRSARPLHSLSVLAFDQERLERKILALRQARRPVPPEVAQQYQDIMQRSQWQRAQLEQGGVGIRREYAAQLERQLQFYTEAARRLGNDGSRDAAKEALYRRNLVESELQRLRR 


2. 找出相關疾病,相關基因,文獻。
與CC2D1A相關疾病,相關基因詳見: http://iwantfuture.blogspot.tw/2012/10/gene-disgenet.html
文獻的部分, 我們lab有發了一篇CC2D1A參與innate immunity 中RIG-I like signaling pathway的paper

3. 利用 NCBI gene 找出所有相關資訊
點進去就有囉! :)) http://iwantfuture.blogspot.tw/2012/10/ncbi.html

4. 利用 blast 進行至少 10 個物種的序列,進行親緣分析。
先把human的CC2D1A 中 DM14#1 doamin protein sequence丟到NCBI blast中去釣看看有哪些物種會與CC2D1A的DM14#1 seq有高度相似, 結果發現有高度相似的是 獼猴或是猩猩的CC2D1A的DM14 doamin


比對不同物種(這邊不選human, 因為我丟進去的就是huamn的CC2D1A的DM14#1 doamin了, 再勾選human的database話出來的就是human了)
設定完成後貼上序列,把網頁拉到下面點選BLAST,
接著只用CLC sequencing軟體來製作phylogenic tree進行親源分析







AAl13969為huamn的DM14#1 doamin,
由tree可以看到人類的DM14#1 doamin 和其他物種的DM14親緣性頗低


5. 在 GEO 中尋找與該基因相關的表達結果。
進入GEO的main page: http://www.ncbi.nlm.nih.gov/geo/   
進入以後輸入CC2D1A
進入以後點選圖案, 圖案為疾病與基因的分布圖
回到CC2D1A GEO profiling主畫面, 點選GEO dataset就可以進一步看microarray中各個基因的相關性
紅色是高度相關, 綠色是相關性比較低的gene, 還可以點放大圖喔! 就是把游標移到下圖中, 顯示反灰的部分可以進一步看相關性gene放大圖

右邊是gene list, 圖中偏紅色是高度相關, 綠色是相關性較低


6. 利用 GEO 與 2. 的結果,以 string 進行 PPI 分析。


先進去STRING的main page: http://string-db.org/    分析蛋白質與蛋白質之間的關係
輸入CC2D1A
出現很多種的CC2D1A, 像是human, 老鼠的, 或是猩猩的, 我選擇human的CC2D1A看看有哪些protien會跟CC2D1A有interaction
出來了! 與human CC2D1A會有interaction的protien有: HTR1A, DRD2等等, 下面還有
CC2D1A的簡介以及這些與CC2D1A有interaction的protein的簡介唷!
另外, 點擊confidence的話就可以看這些protien與CC2D1A interaction的可信程度喔!
(結果如下) 較粗深藍色的線是interaction比較強的!

7. 再以 string 結果以 GEO 結果比對,預測你的實驗結果。
比較GEO的結果與STRING的結果發現, GEO search CC2D1A的結果與Aldosterone-producing adeonoma(原發性高醛固酮症)比較有關係, 但是STRING search CC2D1A的結果發現與HTR1A較有關係, 而HTRIA與神經比較有關係
 string 結果跟 GEO 結果比較的結果還是有落差, 但也可能是輸入的關鍵字不夠精準導致這樣的結果


8. 將該基因進行蛋白質結構預測


由於在RCSB Protein database無法搜尋到CC2D1A的蛋白質結構,
我轉而查詢了RIG-I的結構,RIG-I是innate immune中的PRR, 屬於RIG-I like signaling主要的成員之一, 目前我們的實驗室發現CC2D1A在RIG-I的下游可以去活化IFN-beta抵禦並毒的入侵
我使用PyMol進行RIG-I的結構分析。

詳細請見: http://iwantfuture.blogspot.tw/2013/01/pymolproteinstructure-protein.html




2013年1月13日 星期日

利用PyMOL變出protein的structure並美工加工一下, 就是一個漂亮的protein囉!

我想找的protein是RIG-I, 就需先找到RIG-I的ID 找到以後輸入到pdb中並存出pdb.text檔
之後打開PyMOL以後開啟剛剛存好的RIG-I pdb.text file
打開以後對著all選擇"S"-->show cartoon讓rpotein structure顯示為cartoon的圖示, 之後再選擇"H"--> hide line, strick以及water之後就會變成下面這張比較簡潔有力的structure pic囉!
接下來開始做美工囉!  首先可以改變chain 的color e.x. color green, chain A 同樣的指令在設chain B也變成綠色

接下來選擇右下角的S就會show出所有的a.a. 之後我選擇特殊的molecule: Zn把它特別加工: 先點選sequence中所有的Zn, 右邊選項中就會creat出一個新的folder: sele 這個folder可以重新命名: 選擇"A"--> action, rename selection之後重新輸入想要的名字就可以囉!
然後接下來可以針對Zn 做美工, 先讓Zn變成灰色! 選擇"C" color中的 gray就可以了!然後也可以去調Zn的大小就在指令輸入列中輸入: set sphere_scale=0.7, 另外, 若要放大圖的話就按滑鼠右鍵, 之後拖曳就會放大了!  ^^

之後,準備存成影片檔囉!  首先點選orient使structure角度回到正面,
點選scene -->Store --> F1 使PyMOL記憶structure的正面影像,之後在zinc上點一下滑鼠滾輪,畫面中央就會Focus在Zn上,然後store F2。
再來使用滑鼠右鍵zoom in放大Zn,store F3。
點選Movie => Program => Scene Loop => Steady  => 1 sec再來點選Movie => Program => Camera Loop => Y Roll => 4sec
最後存movie檔: save movie as--> PNG image 點選以後就會開始一張一張存了!

存好一張一張的pic以後再去movie maker去做成電影檔,在匯入pic前先設定時間,讓每張pic之間的間隔不要太久(我設0.1sec左右而已) 不然等他播放完看的人就睡著辣!