Sequence analysis note

introducion
Entrez:早期資料庫間之相互連結

Primary sequence: EX:Gene bank => 在資料庫中無法發現之序列,會建立新資料,會有GI  number (登錄號,暫時的),確定之後會有XM 號 (館藏號)

Scaffold:將短序列重疊而成之長序列

資料庫中之資訊:

Header
    Locus name Length Moleculartype Diversion Modification 
ACCESSION JQ082261 文獻以此為主
VERSION JQ082261.1 (後面的點點為不同版本之註記) GI:別裡這個,可能被刪除
FEATURE
CONTIG

Necletide
GO:有三項:(查生物資料庫講義)
  1. 生物途徑(Biological process):指基因產物所參與的生物路徑
  2. 細胞組件(Cellular component):指基因產物在細胞內外的位置
  3. 分子功能(Molecular function):指基因產物的分子活性  
-----------------------------------------------------------------------------------------------------------------

NCBI

  All Resource  :會有每個資料庫之介紹
 
   pudchem: for 藥物者做的資料庫

1.Nucleotide:
 輸入名稱: 會有()的表示為暱稱,沒括號的為正名
以FTHFS為例


點入
GeneBank 格式
















題外
點入: ORGANISM:可以知道關於此物種所有之資訊



看起來蠻少的




FASTA格式









HOW TO 獲得FASTA格式
將NCBI格式全選 貼到以下 SMS2(http://www.bioinformatics.org/sms2/)










OR直接用選的












  • Graphics( FOR primer working)







Gene






















UniProt資料庫(較強調蛋白基因功能)
NCBI較強調序列

GeneCard 多是人類資料庫,視覺化,參考用,不能直接用,可參考並回歸ncbi等。應該無法用在微生物上(商用資料庫)









留言

這個網誌中的熱門文章

Microarray分析軟體 Multiple experiment viewer

利用 Phylip 建立 MP、ML、NJ tree