วันพุธที่ 23 กุมภาพันธ์ พ.ศ. 2554

การบ้านวิชา Bioinformatics เรื่อง SNPs and HapMap database


การบ้านวิชา Bioinformatics

เรื่อง SNPs and HapMap database

เสนอ

รศ.ดร.วสันต์ จันทราทิตย์
จัดทำโดย
.. ธัญญรัตน์
เจริญตา
51642494
..จิรภรณ์
ยะคำแจ้
5214402325
..ธนพร
แหไธสง
5214402864
นายพฤทธิ์
ราชรักษ์
5217400498
นายวิศรุต
ชัยเลิศทธิ์
5326000059





จงทำการนำเข้าข้อมูลนี้ใช้งานกับโปรแกรม Haploview และตอบคำถามต่อไปนี้

1. จงแสดงค่าสถิติต่างที่ได้จากการนำเข้าข้อมูลที่เตรียมได้ (จากหน้าต่าง check marker) พร้อมอธิบาย

ตอบ

จากข้อมูลดิบ genotype SNP ที่ได้ นำมาเข้าสู่โปรแกรม haploview ได้ผลดังนี้





คำนวนข้อมูลพื้นฐานแต่ละ Marker โดยกรองค่า HWpval (ค่า p value ของ Hardy-Weinberg equilibrium หรือค่าโอกาสความน่าจะเป็นที่มีข้อมูลจีโนไทป์มีการกระจายตัวที่แตกต่างกันจาก Hardy-Weinberg equilibrium) ที่ 0.05
จากตารางแสดงถึงค่า Position (ตำแหน่งของ Marker) ที่ตัวอย่างที่ 1 (Name rs8192709) จะเป็น nucleotide ตัวที่ 46189114 บนสาย DNA ค่า HWpval เท่ากับ 1.0 (แสดงว่า SNP ตำแหน่งนี้มีการกระจายตัวแบบสุ่มภายใต้ Hardy-Weinberg equilibrium) ค่า Allele (บ่งบอกถึง major และ minor ของ allele ที่ตำแหน่ง SNP นั้นๆ) มี major และ minor เป็น C และ T ตามลำดับ ค่า MAF (Minor allele frequency) เท่ากับ 0.024 ซึ่งหมายถึง SNP ในตำแหน่งนี้จะมีโอกาสเปลี่ยนจาก C เป็น T ที่ 2.4% และ ค่า Rating คือค่าที่บอกว่าโปรแกรมได้มีการวิเคราะห์ข้อมูลจีโนไทป์ใน marker นั้นๆ หากมีเครื่องหมายถูกจะหมายถึงข้อมูลจีโนไทป์ใน marker นั้นได้ผ่านการทดสอบแล้ว
จากตารางเมื่อกรองค่า HWpval ที่ 0.05 จะพบข้อมูลที่ไม่มีการกระจายตัวของ SNP อย่างอิสระ อยู่ 9 ตำแหน่ง (ค่า HWpval ต่ำกว่า 0.05) และมีข้อมูลผ่านการทดสอบแล้วอยู่ 24 ตำแหน่ง (มีเครื่องหมายถูกในช่องค่า Rating) ซึ่งค่าที่ผ่านการทดสอบแล้วจะถูกนำไปสร้างเป็น linkage disequilibrium map เพื่อดู Group ต่อไป

2. แสดงภาพ linkage disequilibrium map พร้อมอธิบาย

ตอบ







การวิเคราะห์ linkage disequilibrium map เพื่อศึกษาว่าอัลลิลที่อยู่คนละตำแหน่งบนโครโมโซมเดียวกัน มีโอกาสถ่ายทอดไปด้วยกันมากกว่าหรือน้อยกว่าค่าคาดหวัง จากภาพพบว่าบล็อคที่ 1 ประกอบด้วย SNP rs2099311 และ rs8100458 มีความยาวประมาณ 1 kb และไม่ถ่ายทอดไปด้วยกับ rs8192709 ซึ่งอยู่ห่างจาก rs2099311 ประมาณ 1.8 kb ดังที่แสดงในรูป
จากการวิเคราะห์พบว่ามีจำนวน 4 บล็อค บล็อกที่ 1 มี SNP 2 ตำแหน่ง บล็อคที่ 2 มี 8 ตำแหน่ง บล็อคที่ 3 มี 2 ตำแหน่ง และบล็อคที่ 4 มี 6 ตำแหน่ง





3. แสดงภาพ Haplotype block พร้อมอธิบาย

ตอบ







การวิเคราะห์ Haplotype block เพื่อศึกษาว่า SNP ในแต่ละบล็อกมีลักษณะอย่างไร ในแต่ละลักษณะมีโอกาสที่จะเป็นเท่าไหร่ และแต่ละลักษณะในแต่ละบล็อกมีโอกาสการ recombinant อย่างไร เช่น ในบล็อกที่ 1 มี 3 ลักษณะคือ AC มีโอกาส 45.8%, CT มีโอกาส 31% และ AT มีโอกาส 23.2% ในบล็อกที่ 2 มี 6 ลักษณะ ในบล็อกที่ 3 มี 2 ลักษณะ และในบล็อกที่ 4 มี 4 ลักษณะ
โอกาสการ recombinant เกิดได้ 24 แบบ โดยแต่ละแบบมีรูปแบบดังตัวอย่างต่อไปนี้




วันอังคารที่ 22 กุมภาพันธ์ พ.ศ. 2554

Bioinformatics (01416554): Haploview assignment

รายชื่อกลุ่ม
นายนัยสิทธิ์  ยิ่งกำแหง 521500145
นายกรินทร์   สว่างเดชารักษ์ 5314200082 
นางสาวนภากานต์  เกวี  521500144  
นายราชันย์   อัพภัยชา 521490028  
นางสาววรวรรณ  มสาริญานนท์  5314900173 
จงทำการนำเข้าข้อมูลนี้ใช้งานกับโปรแกรม Haploview และตอบคำถามต่อไปนี้
1. จงแสดงค่าสถิติต่างที่ได้จากการนำเข้าข้อมูลที่เตรียมได้ (จากหน้าต่าง check marker) พร้อมอธิบาย
- จากผลที่ได้ จะทำการระบุตำแหน่งของ SNP ได้ทั้งหมด 52 ตำแหน่ง
- โดยเมื่อใช้ค่า Default ของโปรแกรมที่ให้ค่า HW p-value ที่ 0.001 จะมี จำนวน SNP ที่นำมาจัดเข้าการวิเคราะห์ต่อๆไปได้ทั้งหมด 34 ตำแหน่ง
เมื่อทำการปรับค่าของ HW p-value ไปที่ 0.05 แล้วผลที่ได้ปรากฏดังนี้
- จำนวนของ SNP ที่จะนำไปวิเคราะห์ต่อไปเหลือเพียง 24 ตำแหน่ง ที่มีค่าอยู่ใน HW p-value ที่ 0.05

2. แสดงภาพ linkage disequilibrium map พร้อมอธิบาย

ดังจะเห็นว่าได้มีการแบ่งออกเป็น 4 บล็อก
โดย Block แต่ละกลุ่มจะมีขนาดที่แตกต่างกันไป
กลุ่มที่ 1 เป็นกลุ่มที่ประกอบไปด้วย SNP 3 ตำแหน่ง
กลุ่มที่ 2 มีขนาดใหญ่ มี SNP ทั้งหมด8 ตำแหน่ง
กลุ่มที่ 3 มีขนาดเล็กที่สุดใน 4 กลุ่ม มี SNP ทั้งหมด 2 ตำแหน่ง
กลุ่มที่ 4 จะประกอบด้วย SNP ทั้งหมด 6 ตำแหน่ง
ตัวเลขจะแสดงค่า D’ ที่น้อยกว่า 1 ซึ่งหมายถึงมี recombination หรือ recurrent mutation เกิดขึ้น ยิ่งค่านี้น้อยแสดงว่ามีโอกาสเกิดการ mutation ได้สูง
สีแดงและชมพูคือ LOD น้อยกว่า 2
สีขาวและน้ำเงินคือ LOD มากกว่าหรือเท่ากับ 2
LOD คือ log of Likelihood odd ratio ซึ่งบอกนัยสำคัญของค่า D’ 

3. แสดงภาพ Haplotype block พร้อมอธิบาย
จากผลที่ได้ จะเห็นว่าเราสามารถแบ่งกลุ่มของ SNP ออกได้เป็น 4 กลุ่ม โดยในแต่ละกลุ่ม จะมีแนวโน้มที่แต่ละ SNP จะไปด้วยกันระหว่างกลุ่ม โดยจะได้ขออธิบายเป็นโอกาสที่จะเกิดในแต่ละกลุ่มลักษณะและการมี Linkage ของแต่ละลักษณะต่อไป และแสดงค่า multiallelic D' ไว้ระหว่างแต่ละ haplotype block เพื่อบอกระดับของความเชื่อมโยงกัน
รูปแบบความสัมพันธ์ที่น่าจะมี Linkage disequilibrium ดังตารางต่อไปนี้
ระหว่างกลุ่ม
ลักษณะของ Genotype
โอกาสที่ปรากฏ
ลักษณะของ Block ถัดไปที่มี Linkage
1-2
AC
0.458
TTACCTAG
CT
0.310
TTACCTGG
AT
0.232
TTACCTGG
CCCTTCGT
CCATTCGT
CCCTTCGG
TCATTTGG
2-3
TTACCTAG
0.459
AC
TTACCTGG
0.332
AC
GT
CCATTCGT
0.113
AC
CCATTCGT
0.054
AC
CCCTTCGG
0.024
AC
GT
TCATTTGG
0.12
AC
3-4
AC
0.679
CCCAAG
TCTACT
CCCGAG
GT
0.321
CTCAAG