La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

DNA 序列完全比對搜尋系統 指導教授 : 張玉盈 教授 組員 : 陳政浩、林峰世、陳俊仁. 背景 Human Genome Project DNA 研究 未來發展.

Presentaciones similares


Presentación del tema: "DNA 序列完全比對搜尋系統 指導教授 : 張玉盈 教授 組員 : 陳政浩、林峰世、陳俊仁. 背景 Human Genome Project DNA 研究 未來發展."— Transcripción de la presentación:

1 DNA 序列完全比對搜尋系統 指導教授 : 張玉盈 教授 組員 : 陳政浩、林峰世、陳俊仁

2 背景 Human Genome Project DNA 研究 未來發展

3 DNA 序列比對之難處 一段 DNA 序列的長度通常有數萬至 數百萬個字元數。 DNA 序列沒有「字」的概念。

4 簡介 DNA 序列,可將其視為由 4 個字母 A , C , G , 及 T 所組成。 演算法使用 n-gram/2L 來實作 DNA 序列的完全 比對。 優點 : n-gram/2L 是以 n-gram inverted index 為 基礎,做出兩層的索引架構,有效地提昇效能。

5 Sliding Technique

6 Index Building Algorithm 1. Extracting 4-subsequences 2. Building the back-end index 3. Extracting 2-grams 4. Building the front-end index

7 建構 back-end-index

8 建構 front-end-index

9 Query Processing Query: A B B C D 2-gram: AB, BB, BC, CD Subsequence: 0 DC CB BA 43210 matches ABCD

10 Cover in Query 當我們欲查詢的字串 Q 與文件中的字串 S 欲 cover 時,必定符合以下條件之一: ( 1 ) Q 的字尾與 S 的字首相符 ( 2 ) Q 的字首與 S 的字尾相符 ( 3 ) Q 包含整個 S ( 4 ) S 包含整個 Q 。

11 Query Processing Query: A B B C D 2-gram: AB, BB, BC, CD Subsequence: 0 DC CB BA 43210 matches ABCD

12 Query Processing Query: A B B C D 2-gram: AB, BB, BC, CD Subsequence: 1 DC CB BB 43210 matches BBCD A B B C D Sub 1 Sub X

13 Query Processing Query: A B B C D 2-gram: AB, BB, BC, CD Subsequence: 2 DC CB 43210 matches BCD A B B C D Sub 2 Sub X

14 Query Processing Query: A B B C D 2-gram: AB, BB, BC, CD Subsequence: 3 BA DC 43210 matches CDAB A B B C D A B Sub 3 Sub X

15 Query Processing Query: A B B C D 2-gram: AB, BB, BC, CD Subsequence: 4 CB BA 43210 matches ABC

16 Query Processing Query: A B B C D 2-gram: AB, BB, BC, CD Subsequence: 5 BA 43210 matches AB A B B C D Sub x Sub 5

17 Query Processing 0. ABCD 1. BBCD 2. BCD 3. CDAB 4. ABC 5. AB Sub 1 : BBCD Sub 2 : BCDA Sub 3 : CDAB Sub 5 : DDAB

18 Query Processing Sub 1 : BBCD Sub 2 : BCDA Sub 3 : CDAB Sub 5 : DDAB Document 0 10 D 9 C 8 BB BADD 76543 BADCBADCBB5 DCBADCBADD4 CBADCBADCB3 BADDCBBADC2 ADCBADCBAD1 DCBBADDCBA0 9876543210

19 Query Processing Sub 1 : BBCD Sub 2 : BCDA Sub 5 : DDAB Document 1 A 9 D 8 CB BADC 76543

20 Query Processing Document 2 B 9 A 8 D 7 D D 6 C 5 BB BADC 43210 Sub 1 : BBCD Sub 2 : BCDA Sub 3 : CDAB Sub 5 : DDAB BADCBADCBB5 DCBADCBADD4 CBADCBADCB3 BADDCBBADC2 ADCBADCBAD1 DCBBADDCBA0 9876543210

21 開發環境 硬體環境 : CPU : AMD Athlon64 3000+ RAM : DDR 400 2GB 軟體環境 : Windows XP Service Pack 2 JDK 1.5.0_09 MySQL 4.1.12a-nt NetBeans IDE 5.5

22 結論 實作時遇到的困難 心得

23 DEMO


Descargar ppt "DNA 序列完全比對搜尋系統 指導教授 : 張玉盈 教授 組員 : 陳政浩、林峰世、陳俊仁. 背景 Human Genome Project DNA 研究 未來發展."

Presentaciones similares


Anuncios Google