台灣留學生出席國際會議補助

2010年1月5日 星期二

A Software Tool to Process HIV Ultra-deep Sequencing Nucleotide Data

論文發表人: 羅健記 (新墨西哥大學 電腦科學所 碩士班)

 

http://cnls.lanl.gov/q-bio/index.html

 

454生命科學公司所開發的焦磷酸測序技術是一種超高通量的DNA測序方式,其所產生大量的序列資訊內容可被用於不同的基因組研究。然而如此大量的數據是需要一個適當的處理方式,才能做後續的分析使用。因此,我們開發出一個工具來處理這樣的數據內容,使用者輸入超深度測序序列和參考序列的FASTA檔案,程式將會輸出精簡、壓縮,具有排序統計量和根據密碼子排列好的序列。此工具已成功地應用於最近的一份研究報告並投稿於PLoS One期刊(PLoS ONE 4(5): e5683),該研究報告揭示HIV 1病毒的動態基因序列及可能造成藥物治療失敗的可能機轉。

 

Massive sequence reads generated by 454 Life Sciences pyrosequencing technology enable a variety of applications on genome research. A method for processing the huge amount of datasets for subsequent analysis is necessary. We have developed a software tool for this purpose. Given input with ultra-deep sequencing sequences and a reference sequence in FASTA format, the program will output with compressed, identity-tallied and codon-aligned sequence alignment. This tool has been successfully applied on a recent study to reveal dynamic HIV-1 escape and large population shifts during drug treatment.