Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

เหตุใดจึงมีประโยชน์ในการเปรียบเทียบและจัดแนว biosequences


การจัดตำแหน่งขึ้นอยู่กับความจริงที่ว่าสิ่งมีชีวิตทั้งหมดสัมพันธ์กันโดยวิวัฒนาการ วิธีนี้ใช้ว่านิวคลีโอไทด์ (DNA, RNA) และชุดโปรตีนของสปีชีส์ที่อยู่ใกล้กันมากขึ้นในวิวัฒนาการต้องแสดงความคล้ายคลึงกันที่สูงขึ้น

การจัดตำแหน่งเป็นขั้นตอนของการจัดเรียงลำดับเพื่อให้ได้ระดับความเหมือนกันสูงสุด ซึ่งกำหนดระดับของความคล้ายคลึงกันระหว่างลำดับด้วย มีสองลำดับที่คล้ายคลึงกันหากส่งบรรพบุรุษร่วมกัน

ระดับของความคล้ายคลึงที่ได้มาจากการจัดแนวลำดับสามารถเป็นประโยชน์ในการตัดสินใจความเป็นไปได้ของความคล้ายคลึงระหว่างสองลำดับ การสนับสนุนการจัดตำแหน่งดังกล่าวจะกำหนดตำแหน่งสัมพัทธ์ของสปีชีส์ต่างๆ ในต้นไม้วิวัฒนาการ ซึ่งเรียกว่าต้นไม้สายวิวัฒนาการ

ปัญหาของการจัดตำแหน่งของลำดับทางชีวภาพสามารถกำหนดได้ดังนี้ − ให้ลำดับทางชีวภาพอินพุตสองลำดับขึ้นไป รับรู้ลำดับเดียวกันกับลำดับย่อยที่มีการอนุรักษ์ไว้สูง ถ้าหลายลำดับที่จะจัดตำแหน่งเป็นสอง จะเรียกว่าการจัดแนวลำดับคู่ ดังนั้นจึงเป็นการจัดตำแหน่งหลายลำดับ

ลำดับที่จะแยกแยะและจัดเรียงตัวอาจเป็นนิวคลีโอไทด์ (DNA/RNA) หรือกรดอะมิโน (โปรตีน) สำหรับนิวคลีโอไทด์ สัญลักษณ์ 2 ตัวจะเรียงกันถ้าตรงกัน แต่สำหรับกรดอะมิโน สัญลักษณ์ 2 ตัวจะเรียงตัวกันหากตรงกัน หรือหากตัวใดตัวหนึ่งสามารถเปลี่ยนจากอีกสัญลักษณ์หนึ่งได้โดยการแทนที่ที่ปรากฏในธรรมชาติ

มีการจัดตำแหน่งสองประเภทรวมทั้งการจัดตำแหน่งภายในกับการจัดตำแหน่งสากล แบบแรกกำหนดว่าเฉพาะพื้นที่ของลำดับเท่านั้นที่ถูกจัดตำแหน่ง ในขณะที่ส่วนหลังจำเป็นต้องจัดตำแหน่งตลอดความยาวทั้งหมดของลำดับ

สำหรับนิวคลีโอไทด์หรือกรดอะมิโน การแทรก การลบ และการแทนที่จะปรากฏในธรรมชาติโดยมีความเป็นไปได้หลายระดับ เมทริกซ์การแทนที่กำหนดความน่าจะเป็นของการแทนที่ของนิวคลีโอไทด์หรือกรดอะมิโน และความน่าจะเป็นของการแทรกและการลบออก

มักใช้อักขระช่องว่าง "−" เพื่อระบุตำแหน่งที่ไม่ต้องการจัดตำแหน่งสองสัญลักษณ์ สามารถคำนวณคุณภาพของการจัดตำแหน่งได้ โดยทั่วไปโครงสร้างการให้คะแนนจะถูกกำหนด ซึ่งโดยทั่วไปจะนับสัญลักษณ์ที่เหมือนกันหรือเหมือนกันเป็นคะแนนบวกและช่องว่างเป็นค่าลบ

ผลรวมเชิงพีชคณิตของคะแนนถือเป็นขอบเขตการจัดตำแหน่ง วัตถุประสงค์ของการจัดตำแหน่งเพื่อให้ได้คะแนนสูงสุดระหว่างการจัดตำแหน่งที่เป็นไปได้ อย่างไรก็ตาม การค้นหาการจัดตำแหน่งที่เหมาะสมนั้นมีค่าใช้จ่ายสูง ดังนั้นจึงมีการพัฒนาเทคนิคฮิวริสติกหลายเทคนิคเพื่อค้นหาการจัดตำแหน่งที่ไม่เหมาะสม

จีโนมคือชุดของยีนทั้งหมดของสิ่งมีชีวิต เมื่อต้องการโปรตีน ยีนที่เทียบเท่ากันจะถูกคัดลอกไปยังอาร์เอ็นเอ RNA เป็นสายโซ่ของนิวคลีโอไทด์ DNA ทำการสังเคราะห์โมเลกุลอาร์เอ็นเอหลายโมเลกุล โดยแต่ละตัวมีหน้าที่เฉพาะในการทำงานของเซลล์