Sequence analysis note
introducion
Entrez:早期資料庫間之相互連結
Primary sequence: EX:Gene bank => 在資料庫中無法發現之序列,會建立新資料,會有GI number (登錄號,暫時的),確定之後會有XM 號 (館藏號)
Scaffold:將短序列重疊而成之長序列
資料庫中之資訊:
Header
Locus name Length Moleculartype Diversion Modification
ACCESSION JQ082261 文獻以此為主
VERSION JQ082261.1 (後面的點點為不同版本之註記) GI:別裡這個,可能被刪除
FEATURE
CONTIG
Necletide
GO:有三項:(查生物資料庫講義)
NCBI
All Resource :會有每個資料庫之介紹
pudchem: for 藥物者做的資料庫
1.Nucleotide:
輸入名稱: 會有()的表示為暱稱,沒括號的為正名
以FTHFS為例
點入
GeneBank 格式
題外
點入: ORGANISM:可以知道關於此物種所有之資訊
看起來蠻少的
FASTA格式
HOW TO 獲得FASTA格式
將NCBI格式全選 貼到以下 SMS2(http://www.bioinformatics.org/sms2/)
OR直接用選的
Gene
UniProt資料庫(較強調蛋白基因功能)
NCBI較強調序列
GeneCard 多是人類資料庫,視覺化,參考用,不能直接用,可參考並回歸ncbi等。應該無法用在微生物上(商用資料庫)
Entrez:早期資料庫間之相互連結
Primary sequence: EX:Gene bank => 在資料庫中無法發現之序列,會建立新資料,會有GI number (登錄號,暫時的),確定之後會有XM 號 (館藏號)
Scaffold:將短序列重疊而成之長序列
資料庫中之資訊:
Header
Locus name Length Moleculartype Diversion Modification
ACCESSION JQ082261 文獻以此為主
VERSION JQ082261.1 (後面的點點為不同版本之註記) GI:別裡這個,可能被刪除
FEATURE
CONTIG
Necletide
GO:有三項:(查生物資料庫講義)
- 生物途徑(Biological process):指基因產物所參與的生物路徑
- 細胞組件(Cellular component):指基因產物在細胞內外的位置
- 分子功能(Molecular function):指基因產物的分子活性
NCBI
All Resource :會有每個資料庫之介紹
pudchem: for 藥物者做的資料庫
1.Nucleotide:
輸入名稱: 會有()的表示為暱稱,沒括號的為正名
以FTHFS為例
點入
GeneBank 格式
題外
點入: ORGANISM:可以知道關於此物種所有之資訊
看起來蠻少的
HOW TO 獲得FASTA格式
將NCBI格式全選 貼到以下 SMS2(http://www.bioinformatics.org/sms2/)
OR直接用選的
- Graphics( FOR primer working)
Gene
UniProt資料庫(較強調蛋白基因功能)
NCBI較強調序列
GeneCard 多是人類資料庫,視覺化,參考用,不能直接用,可參考並回歸ncbi等。應該無法用在微生物上(商用資料庫)
留言
張貼留言