การบ้าน Bioinformatics (01416554)
Haploview assignment
เสนอ
ร.ศ. ดร. วสันต์ จันทราทิตย์
จัดทำโดย
นางสาวหทัยรัตน์ ราชนิยม | 5217400412 |
นายปาณัสม์ พูลสวัสดิ์ | 5314400995 |
นายอภิศักดิ์ หลักฐาน | 5314401100 |
นางสาวอรสิริ ศิริพันธุ์ | 5314401118 |
นายวรรัตน์ เครือสุวรรณ์ | 5317400201 |
รายงานนี้เป็นส่วนหนึ่งของรายวิชา 01416554 Bioinformatics
ภาคเรียนที่ 2 ปีการศึกษา 2553
มหาวิทยาลัยเกษตรศาสตร์
ภาพที่ 1 ผลการคัดเลือกข้อมูลจีโนไทป์ที่มีการการกระจายแบบสมดุลตามกฎของ Hardy-Weinberg (p>0.05)
ในการศึกษาแบบ population base case control กลุ่มควบคุมที่ใช้ในการศึกษาต้องตรวจสอบการกระจายของจีโนไทป์ให้เป็นไปตามทฤษฎีสมดุลของฮาร์ดี-ไวน์เบิร์ก (p>0.05) คือ ในประชากรใดๆ ต้องมีความถี่ของจีโนไทป์คงที่ในทุกรุ่น ถ้าความถี่ของจีโนไทป์ในกลุ่มควบคุมใดที่มีค่า P<0.05 เราจะไม่นากลุ่มควบคุมนั้นมาใช้ในการศึกษา เนื่องจากพบความถี่ของจีโนไทป์แบบใดแบบหนึ่งมากเกินไป ส่งผลให้ผลบวกปลอมจากกลุ่มควบคุมข้างต้นได้ จากตำแหน่งของสนิปส์ทั้งหมด 52 ตาแหน่ง เมื่อตั้งค่า HW p-value cutoff ของโปรแกรมเป็น 0.05 หรือค่าโอกาสความน่าจะเป็นที่ข้อมูลจีโนไทป์นี้มีการกระจายแบบสมดุลตามทฤษฎีสมดุลของฮาร์ดี-ไวน์เบิร์กพบว่า สนิปส์ 9 ตาแหน่ง (กรอบสีเขียว) มีค่า P<0.05 ซึ่งหมายถึง ข้อมูลสนิปส์ ทั้ง 9 ตาแหน่งมี case/control ratios ของสนิปส์แตกต่างกันอย่างมีนัยสำคัญทางสถิติ ดังนั้นข้อมูลสนิปส์ที่มีการกระจายแบบสมดุลทั้งหมด 24 ตำแหน่งที่เหลือจะถูกนำมาศึกษาว่าเครื่องหมายพันธุกรรมที่อยู่ใกล้กันมีโอกาสถ่ายทอดไปด้วยกันมากกว่าหรือน้อยกว่าค่าคาดหวัง
2. แสดงภาพ linkage disequilibrium map พร้อมอธิบาย
ภาพที่ 2 แผนที่การถ่ายทอดไปด้วยกัน (Linkage disequilibrium ; LD) โดยใช้โปรแกรม Haploview การถ่ายทอดไปด้วยกันพิจารณาจากค่า D’≥ 0.8
การวิเคราะห์หา Linkage disequilibrium (LD) เพื่อศึกษาการถ่ายทอดอัลลีลที่อยู่คนละตำแหน่งบนโครโมโซมเดียวกัน ซึ่งมีโอกาสที่จะถ่ายทอดจากรุ่นหนึ่งไปยังรุ่นหนึ่งด้วยกัน ปรากฎการณ์ที่สนิปส์หลายตำแหน่งถูกถ่ายทอดไปด้วยกันในกลุ่มประชากรพบบ่อยกว่าการที่พบโดยบังเอิญ เรียกกลุ่มของสนิปส์เหล่านี้ว่า Linkage disequilibrium ต่อกัน ดังนั้นการศึกษาแฮพโพลไทป์จึงมีความน่าเชื่อถือในการวิเคราะห์หาความสัมพันธ์กับการเกิดโรคมากกว่าการศึกษาสนิปส์แค่ตำแหน่งเดียว จากข้อมูลสนิปส์จำนวน 24 ตำแหน่งที่ศึกษาว่าเครื่องหมายพันธุกรรมที่อยู่ใกล้กันมีโอกาสถ่ายทอดไปด้วยกันมากกว่าหรือน้อยกว่าค่าคาดหวังพบว่า สามารถแบ่งได้เป็น 4 กลุ่ม ดังแสดงตามภาพที่ 2 โดยที่เครื่องหมายพันธุกรรมที่อยู่ใกล้กันมีโอกาสถ่ายทอดไปด้วยกันมากกว่าหรือน้อยกว่าค่าคาดหวังนั้นจะพิจารณาจากค่า Lewontin’s coefficience (D’) ที่คำนวณจากระยะทางและความถี่อัลลีลของแต่ละคู่สนิปส์ การสร้างบล็อกมาจากการเลือกพารามิเตอร์ solid spin ซึ่งโปรแกรมจะเลือกตำแหน่งที่มีการถ่ายทอดไปด้วยกันสูง (strong LD) ของสนิปส์ตัวแรกและตัวสุดท้ายใน LD chart และสนิปส์ที่อยู่ใน LD เรียกว่า haplotype block ซึ่งสีในแต่ละบล็อกจะแสดงผลการศึกษาค่า LD ข้างต้น ทั้งนี้ 4 กลุ่มของเครื่องหมายพันธุกรรมแบ่งเป็น กลุ่มที่ 1 มีสนิปส์จำนวน 2 ตำแหน่ง (rs2099361และ rs8100458) มีความยาวประมาณ 1 กิโลเบส กลุ่มที่ 2 มี 7 ตำแหน่ง (rs1872125, rs8101756, rs7250601, rs7250745, rs16974799, rs10500282, rs11672911 และ rs3745274) มีความยาว 11 กิโลเบส กลุ่มที่ 3 มี 2 ตำแหน่ง (rs2279344 และ rs2279345) และกลุ่มที่ 4 มี 6 ตำแหน่ง (rs2306606, rs6508965, rs8192719, rs11882450, rs11673270 และ rs10853744) มีความยาว 5 กิโลเบส ตามลำดับ
3. แสดงภาพ Haplotype block พร้อมอธิบาย
ภาพที่ 3 ผลของ Haplotype block ที่ได้จากการวิเคราะห์ด้วยโปรแกรม Haploview
จากการวิเคราะห์ด้วยโปรแกรม Haploview พบว่า ขนาดของ haplotype block ขึ้นกับปัจจัยที่สำคัญ คือ การเกิดรีคอมบิเนชั่น (recombination) ในขั้นตอนของการสร้างเซลล์สืบพันธุ์หรือไมโอซิส (meiosis) ทำให้ SNP ที่อยู่ติดกันมีโอกาสน้อยลงที่จะถูกถ่ายทอดไปด้วยกัน นั่นคือ ขนาดของ haplotype block จะเล็กลงเมื่อเวลาผ่านไปหลายชั่วอายุคน จากการวิเคราะห์ด้วยโปรแกรม Haploview พบ haplotype block ทั้ง 4 กลุ่ม คือ
ไม่มีความคิดเห็น:
แสดงความคิดเห็น