手机看片欧美日韩,久久精品国产主播一区二区,欧美亚洲中日韩中文字幕在线

基因組數(shù)據(jù)庫(kù)注釋及分析開(kāi)發(fā)程式調(diào)研

英文名字解釋:?

?biology, bio? 生物學(xué);

gene 基因:是指控制生物性狀的遺傳信息,通常由DNA序列來(lái)承載。基因也可視作基本遺傳單位,亦即一段具有功能性的DNA或RNA序列;?Genome 基因組。

RNA:核糖核酸(縮寫為RNA,即Ribonucleic Acid),存在于生物細(xì)胞以及部分病毒、類病毒中的遺傳信息載體。?RNA由核糖核苷酸經(jīng)磷酸二酯鍵縮合而成長(zhǎng)鏈狀分子。

DNA:? 脫氧核糖核酸(英語(yǔ):deoxyribonucleic acid,縮寫:DNA)又稱去氧核糖核酸,是一種生物大分子,可組成遺傳指令,引導(dǎo)生物發(fā)育與生命機(jī)能運(yùn)作。主要功能是信息儲(chǔ)存,可比喻為“藍(lán)圖”或“配方”。DNA是一種長(zhǎng)鏈聚合物,組成單位稱為核苷酸,而糖類與磷酸借由酯鍵相連,組成其長(zhǎng)鏈骨架。

了解基因組數(shù)據(jù)庫(kù)的建立方法,開(kāi)源基因組數(shù)據(jù)程式調(diào)研,基因注釋方法,分析比對(duì)方法調(diào)研。

基因組測(cè)序

Illumina:?全世界的生物學(xué)家都將加利福尼亞 Illumina 公司創(chuàng)造的 DNA 測(cè)序儀廣泛用于基因組學(xué)應(yīng)用,包括全基因組測(cè)序。該公司在 AWS 上構(gòu)建其 BaseSpace 工具,以支持研究人員直接向云中上傳用于分析的大量數(shù)據(jù)集并使用 Amazon Glacier 長(zhǎng)期存儲(chǔ)實(shí)驗(yàn)結(jié)果。查看Ruby SDK:?https://github.com/basespace/basespace-ruby-sdk

PacBio:?PacBio Sequel系統(tǒng)可用于高確信度地表征異構(gòu)體多樣性,分析人類轉(zhuǎn)錄組的全面復(fù)雜性,發(fā)現(xiàn)新的基因、異構(gòu)體和基因融合事件,研究動(dòng)植物的轉(zhuǎn)錄本多樣性,以改進(jìn)基因組注釋和基因發(fā)掘?https://www.pacb.com/cn/applications/rna-sequencing/

參考:植物生物學(xué)基因組數(shù)據(jù)庫(kù)匯總:http://www.sohu.com/a/164341318_732029

基因組注釋

見(jiàn): 百科解釋

? ? ? ?基因組注釋主要包括四個(gè)研究方向:重復(fù)序列的識(shí)別;非編碼RNA的預(yù)測(cè);基因結(jié)構(gòu)預(yù)測(cè)和基因功能注釋。我們將分別對(duì)這四個(gè)領(lǐng)域進(jìn)行闡述。
注釋之前首先得構(gòu)建基因模型,有三種策略:同源預(yù)測(cè)(homology-based prediction), 從頭注釋(di novo prediction)和基于轉(zhuǎn)錄組預(yù)測(cè)(transcriptome-based prediction),然后才是功能注釋,蛋白功能域注釋,基因本體論注釋,通路注釋。

處理

下圖提供了注釋過(guò)程的概述。基因組序列被掩蓋(灰色),并且轉(zhuǎn)錄物(藍(lán)色),蛋白質(zhì)(綠色)和RNA-Seq讀數(shù)(橙色)與基因組對(duì)齊。如果可用于注釋的生物體,則策劃的RefSeq基因組序列也是對(duì)齊的(粉紅色)。然后進(jìn)行基于轉(zhuǎn)錄和蛋白質(zhì)比對(duì)的基因模型預(yù)測(cè)(棕色)。在RefSeq和預(yù)測(cè)模型中選擇最好的模型,命名和加入(紫色)。最后,注釋產(chǎn)品被格式化并部署到公共資源(黃色)。

一個(gè)整合植物基因組學(xué)工具和資源的網(wǎng)站: <http://www.plantgdb.org/>
給出了一套完整的注釋流程以及每一步的輸入和輸出情況:<http://bioservices.usd.edu/gsap.html>

線粒體基因組分析工具: http://www.zilhua.com/1173.html

? ? ? ?長(zhǎng)序列注釋軟件:LoReAn(Long Read Annotation)軟件,是一種利用短和長(zhǎng)讀取cDNA測(cè)序,蛋白質(zhì)證據(jù)和從頭預(yù)測(cè)的自動(dòng)化注釋流水pipeline,以生成準(zhǔn)確的基因組注釋。基于對(duì)兩種真菌和兩種植物基因組的注釋,證明LoReAn通過(guò)整合從PacBio或MinION測(cè)序平臺(tái)產(chǎn)生的單分子cDNA測(cè)序數(shù)據(jù),并正確預(yù)測(cè)基因結(jié)構(gòu)并捕獲其他注釋pipeline漏掉的基因,更加優(yōu)于目前流行的注釋工具。

完整的植物比較基因組學(xué)和數(shù)據(jù)庫(kù)合集:?http://www.lifeomics.com/?p=24759

常用的基因組注釋軟件:

常用的比對(duì)可視化工具:

http://tools.bat.infspire.org/circoletto/

線粒體圈圖繪制工具:

http://ogdraw.mpimp-golm.mpg.de/

GBrowse

? ? ? ?GBrowse是個(gè)開(kāi)源的基因組瀏覽器;是一個(gè)圖形化展示基因組數(shù)據(jù);與Ensemble、UCSC Genome Browser、mapviewer等同屬一類,但其目的是開(kāi)源工具本身,注重工具的易用性,可配置性,文檔等,如果你也想展示自己的數(shù)據(jù),GBrowse是最好的選擇。包括數(shù)據(jù)的制備、多種數(shù)據(jù)庫(kù)的支持、靈活而強(qiáng)大的配置語(yǔ)法、可以定制的插件庫(kù)、完善的文檔教程等等;
wiki: http://gmod.org/wiki/Gbrowse

? ? ? ?接觸過(guò)基因組學(xué)的同學(xué)想必都知道UCSC Genome Browser,在那里可以像看書一樣瀏覽數(shù)十種物種的基因組,包括編碼序列,調(diào)控序列,ChIP-chip數(shù)據(jù),芯片數(shù)據(jù),EST序列,保守序列等等; 可以指定要看的位置,比如Human chrX:151,073,054-151,383,976,隨意放大縮小,展開(kāi)或收起數(shù)據(jù)。

? ? ? ?但是如果你想要瀏覽的物種不在UCSC Genome Browser,你應(yīng)該試試GBrowse!GBrowse是個(gè)開(kāi)源的基因組瀏覽器框架,你只需要導(dǎo)入特定格式的數(shù)據(jù),就可以在GBrowse的圖形界面里瀏覽你的基因組了。GBrowse的界面到底什么樣子?可以看看FlyBaseWormBase.

BioRuby

http://bioruby.org/

? ? ? ?BioRuby提供了一套完整的免費(fèi)開(kāi)發(fā)工具和生物信息學(xué)和分子生物學(xué)圖書館,用于Ruby編程語(yǔ)言。BiouRube具有用于序列分析、通路分析、蛋白質(zhì)建模和系統(tǒng)發(fā)育分析的組件;它支持許多廣泛使用的數(shù)據(jù)格式,并提供方便地訪問(wèn)數(shù)據(jù)庫(kù)、外部程序和公共Web服務(wù),包括BLAST、KEGG、GenBank、MEDLINE和GO。

? ? ? ?BioRuby附帶教程、文檔和交互環(huán)境,可以在shell中使用,也可以在Web瀏覽器中使用。

Ruby UCSC API

https://github.com/misshie/bioruby-ucsc-api/

? ? ? ?Ruby UCSC API是一個(gè)使用Ruby編程語(yǔ)言訪問(wèn)UCSC基因組數(shù)據(jù)庫(kù)的程序庫(kù)。API是作為一個(gè)BioRuby插件設(shè)計(jì)的,構(gòu)建在ActiveRecord 3框架上進(jìn)行對(duì)象-關(guān)系映射,使得不需要編寫SQL語(yǔ)句。當(dāng)前版本API支持UCSC基因組數(shù)據(jù)庫(kù)中的所有生物,包括人類、哺乳動(dòng)物、脊椎動(dòng)物、后口動(dòng)物、昆蟲(chóng)、線蟲(chóng)和酵母。當(dāng)查詢基因組區(qū)域時(shí),API使用二叉樹(shù)索引(若可行)。API也支持使用本地下載的*.2bit文件進(jìn)行基因組序列查詢,它們沒(méi)有存儲(chǔ)在官方MySQL數(shù)據(jù)庫(kù)中。API純粹用Ruby編程語(yǔ)言實(shí)現(xiàn),可以通過(guò)RubyGem獲得。
?

GenBank

https://www.ncbi.nlm.nih.gov/genbank/

? ? ? ?GenBank?是NIH基因序列數(shù)據(jù)庫(kù),注釋公開(kāi)的所有公開(kāi)的DNA序列。

Ruby on Gen 資源

一篇基于Ruby的基因組大規(guī)模數(shù)據(jù)分析統(tǒng)計(jì):?http://journal.embnet.org/index.php/embnetjournal/article/view/753/1113

來(lái)自Mazhaorong的郵件回復(fù):

1. 基因組數(shù)據(jù)庫(kù)就是NCBI和EBI呀

https://www.ncbi.nlm.nih.gov/genome

https://www.ebi.ac.uk/genomes/

?

2. ? 業(yè)界最流行的軟件流程是啥我不清楚,不過(guò)你可以看看NCBI的:

https://www.ncbi.nlm.nih.gov/genome/annotation_euk/process/

還有就是你可以看看各種 genome paper 的 Methods 章節(jié)。

隨便舉個(gè)例子:比如草莓:https://www.nature.com/articles/ng.740

?

順便推薦個(gè)權(quán)威生物信息學(xué)社區(qū):?https://www.biostars.org

?

一些結(jié)論:

Predicting correct organelle rRNA gene structures is indeed a remaining frontier, due to their enormous variability and accelerated rate of evolution

預(yù)測(cè)正確細(xì)胞器rRNA基因結(jié)構(gòu)確實(shí)是一個(gè)艱巨而前沿的任務(wù),由于它們的巨大的變異性和加速的進(jìn)化速度導(dǎo)致未來(lái)的變化不可預(yù)期。

?

?

蜀ICP備15035023號(hào)-4

<rp id="pptpi"><xmp id="pptpi"><th id="pptpi"></th><dl id="pptpi"><pre id="pptpi"><noframes id="pptpi"><code id="pptpi"></code><kbd id="pptpi"><strong id="pptpi"><pre id="pptpi"></pre></strong></kbd>
  • <var id="pptpi"><dl id="pptpi"></dl></var>
    <menu id="pptpi"></menu>

    
    <rt id="pptpi"></rt>
  • <rp id="pptpi"><strong id="pptpi"><meter id="pptpi"></meter></strong></rp>
  • <p id="pptpi"></p>
    主站蜘蛛池模板: 惠水县| 镇江市| 宝应县| 塔河县| 睢宁县| 吉首市| 平遥县| 保山市| 五原县| 三河市| 龙泉市| 新竹县| 厦门市| 历史| 景东| 平武县| 二连浩特市| 平山县| 河津市| 枞阳县| 太湖县| 佛山市| 凤凰县| 禄丰县| 云南省| 远安县| 开阳县| 安远县| 鄯善县| 松溪县| 永川市| 卓资县| 太康县| 特克斯县| 金昌市| 木里| 临沭县| 余姚市| 深州市| 炎陵县| 邹城市|