Structural Bioinformatics
ณฐพล พรพุฒธพงศ์Structural bioinformatics เป็นงานอีกแขนงหนึ่งของ bioinformatics ที่เกี่ยวข้องกับการศึกษาโครงสร้างของสารชีวโมเลกุลด้วยด้วยวิธีทางคอมพิวเตอร์ ประกอบกับความรู้ทางด้านฟิสิกส์และเคมี ซึ่งศาสตร์ด้านฟิสิกส์และเคมีเป็นส่วนที่เพิ่มเติมเข้ามาจากนิยามของ bioinformatics ที่เราเข้าใจกัน ทำให้งานทางด้านนี้ไม่ใช่เรื่องง่ายเลยครับ การค่อนข้างอยู่ในวงจำกัดเนื่องจากต้องใช้บุคลากรหลายแขนงมาทำงานร่วมกัน รวมไปถึงขั้นตอนการทำงานส่วนใหญ่ต้องการคอมพิวเตอร์ที่มีสมรรถนะสูงมาก ซึ่งในประเทศไทยยังไม่มีกลุ่มวิจัยที่สนใจและมีความพร้อมที่จะทำงานวิจัยทางด้านนี้อย่างเพียงพอ
ถ้ามองย้อนกลับไปราวทศวรรษที่ 1950 โครงสร้างสามมิติของ myoglobin ซึ่งเป็นโปรตีนตัวแรกในวาฬ ถูกสร้างขึ้นด้วยวิธี X-ray crystallography โดยนักวิทยาศาสตร์สองท่านคือ แมก เพอรุส (Max Perutz) นักวิทยาศาสตร์ชาวอังกฤษ และ เซอร์ จอร์น ควูเดอรี่ เคนดรอวว์ (Sir John Coudery Kendraw) นักวิทยาศาสตร์ออสเตรีย ผลงานชิ้นนี้เอง ทำให้นักวิทยาศาสตร์ทั้งสองท่านได้รับรางวัลโนเบลในปี ค.ศ. 1962 และยังเป็นจุดเริ่มต้นยุคแห่งการศึกษาโครงสร้างระดับสูงของสารชีวโมเลกุล ในปัจจุบันวิธีในการค้นหาโครงสร้างสามมิติของสารชีวโมเลกุลต่างๆ ได้รับการพัฒนาขึ้นมาก จนมีเทคนิคและวิธีการที่หลากหลายมากขึ้น ในด้านของวิทยาการคอมพิวเตอร์ ก็มีการพัฒนาขีดความสามารถไปด้วยกันกับการพัฒนาโครงสร้างสามมิติ ทำให้มีการสร้างข้อมูลโครงสร้างสามมิติที่มีคุณภาพสูงเกิดขึ้นมากมาย งานวิจัยทางด้าน structural bioinformatics นั้นจะเกี่ยวข้องกับข้อมูลโครงสร้างของสารชีวโมเลกุลในทุกระดับ แต่ส่วนใหญ่จะมุ่งเน้นไปที่การศึกษาโครงสร้างของโปรตีนในระดับตติยภูมิซึ่งเป็นโครงสร้างสามมิติเป็นหลัก
สิ่งมีชีวิตทุกชนิดประกอบขึ้นจากสารประกอบทางชีวเคมีต่างๆ มากมาย โดยที่สารเหล่านั้นจะทำงานประสานกันอย่างต่อเนื่อง เกิดเป็นกลไกต่างๆ เพื่อให้สิ่งมีชีวิตสามารถดำรงชีพอยู่รอดได้ในธรรมชาติ ความสามารถหรือคุณสมบัติต่างๆ ของสารชีวโมเลกุลเหล่านั้น เกิดขึ้นมาจากรูปแบบการเรียงตัวของอะตอมและอันตรกิริยา (interaction) ระหว่างอะตอมด้วยกันนั่นเอง ดังนั้น การคำนวนต่างๆ จึงต้องอยู่บนพื้นฐานการเกิดอันตรกิริยาของอะตอมแต่ละตัวเป็นหลัก
งานวิจัยทางด้าน structure bioinformatics จะแบ่งคร่าวๆ เป็นสองแขนงหลักตามชนิดของข้อมูลในระดับโครงสร้าง คือ ข้อมูลในระดับปฐมภูมิ (primary structure) จะเกี่ยวข้องกับการนำลำดับของสารชีวโมเลกุลแต่ละชนิดมาทำนายโครงสร้างและสมบัติต่างๆ ของสารชีวโมเลกุลนั้นๆส่วนข้อมูลระดับตติยภูมิ (tertiary structure) จะเกี่ยวข้องกับการนำข้อมูลโครงสร้างสามมิติมาเพื่อศึกษาสมบัติทางเคมี และชีวเคมี
ระดับโครงสร้างของสารชีวโมเลกุลและฐานข้อมูล
ตามที่ผู้อ่านทุกท่านทราบกันดีอยู่แล้วว่า bio-informatics เป็นศาสตร์ที่เกิดขึ้นจากความต้องการที่จะใช้ข้อมูลทางชีววิทยาอย่างเป็นระบบและมีประสิทธิภาพสูงที่สุด รวมถึงการตอบโจทย์ทางชีววิทยาต่างๆ ด้วยการประมวลผลจากข้อมูล ซึ่งงานด้าน structure bioinformatics ก็เป็นเช่นเดียวกัน แต่ลักษณะของข้อมูลอาจจะแตกต่างกันออกไป ไม่ได้เป็นแบบที่หลายคนคุ้นเคย เหมือนงานในด้าน sequence analysis หรือ bioinformatics สาขาอื่นๆ ดังนั้น ผมเลยจะถือโอกาสนี้ แนะนำให้ท่านผู้อ่านได้รู้จักกับชนิดของข้อมูลหลักๆ ในงานด้าน structure bioinformatics กันสักเล็กน้อยครับ ลักษณะข้อมูลของโครงสร้างโมเลกุล (molecular structure) จะแบ่งออกตามระดับของโครงสร้าง ซึ่งมีทั้งหมดสี่ระดับ ได้แก่ โครงสร้างในระดับปฐมภูมิ (primary structure) ทุติยภูมิ (secondary structure) ตติยภูมิ (tertiary structure) และสุดท้ายในระดับจตุรภูมิ (quaternary structure)
ลักษณะโครงสร้างโมเลกุลในระดับปฐมภูมินี้ยังไม่ซับซ้อนครับ หลายคนอาจจะคุ้นหน้าคุ้นตากันดี เนื่องจากเป็นข้อมูลจำพวก DNA sequence, RNA sequence หรือ protein sequence นั่นเอง ข้อมูลในระดับนี้ส่วนใหญ่ได้มาจากการทำ DNA sequencing แล้วจึงนำ DNA sequence ที่ได้มาแปรเป็น RNA หรือ protein sequence ด้วยโปรแกรมคอมพิวเตอร์ในภายหลัง เนื่องจากการทำ RNA sequencing และ protein sequencing ทำได้ยากและมีต้นทุนสูง นักวิทยาศาสตร์ที่ทำงานด้าน bioinformatics ที่ไม่ต้องอาศัยข้อมูลจากห้องปฏิบัติการของตัวเอง ก็สามารถค้นหาข้อมูลที่ต้องการและ download ข้อมูลเหล่านั้นมาจากฐานข้อมูลต่างๆ อาทิเช่น GenBank, EBI, UniProt เป็นต้น
ถัดไปเป็นโครงสร้างในระดับทุติยภูมิ ผมจะยกตัวอย่างเป็น protein sequence ก่อนนะครับ โครงสร้างในระดับนี้ เราจะพิจารณาถึงการเกิดอันตรกริยาของกรดอะมีโนตัวที่อยู่ใกล้ๆ กัน เกิดเป็นโครงสร้างอย่างง่ายๆ ที่เรียกว่า helix กับ strand นั่นเอง ส่วนโครงสร้างในระดับทุติยภูมิของ DNA sequence และ RNA sequence จะหมายถึงการจับคู่ของเบสในสายของ DNA และ RNA นั่นเอง ข้อมูลในระดับนี้ได้จากการใช้โปรแกรมคอมพิวเตอร์ไปวัดมุมต่างๆ ในโครงสร้างระดับตติยะภูมิ ที่ได้จากการทดลองแล้วระบุว่าเป็น helix, strand, coil และ turn แล้วเก็บในฐานข้อมูล โดยปกติเราไม่นิยมใช้ข้อมูลในระดับสักเท่าไหร่ เนื่องจากเราสามารถสังเกตุได้จากโครงสร้างในระดับที่สูงกว่านี้ได้โดยตรงอยู่แล้ว
โครงสร้างระดับตติยภูมิ ขัอมูลในระดับนี้ได้จากการทดลองเพื่อหาโครงสร้างสามมิติของสารชีวโมเลกุลด้วยวิธีต่างๆ เช่น X–ray diffraction, nuclear magnetic resonance (NMR) และการถ่ายภาพจากกล้องจุลทรรศน์อิเล็กตรอน (electron microscopy) ข้อมูลนี้จะมีหลายลักษณะตั้งแต่ข้อมูลที่มีรายละเอียดต่ำที่สุด คือ ภาพการกระเจิงของรังสีเอ็กซ์ จากนั้นก็เป็นข้อมูลที่มรายละเอียดมากขึ้น อย่างเช่น ภาพกราฟที่ได้จาก NMR ซึ่งต้องใช้คอมพิวเตอร์มาสร้างเป็น electron map แล้วจึงระบุตำแหน่งของอะตอมแต่ละตัวลงไปในระนาบสามมิติ ซึ่งข้อมูลที่เป็นตำแหน่งของอะตอมนี้เป็นข้อมูลในระดับสุดท้ายซึ่งสามารถนำไปวิเคราะห์ต่อไปได้อีกมากมาย นักวิจัยสามารถหาข้อมูลเหล่านี้ได้จากฐานข้อมูล protein data bank (www.pdb.org/) ข้อมูลในระดับนี้ถือเป็นข้อมูลหลักของงานด้าน structural bioinformatics เลยทีเดียว
ลำดับสุดท้าย คือ ข้อมูลโครงสร้างในระดับจตุรภูมิ ซึ่งเป็นข้อมูลที่เกี่ยวข้องกับการเรียงตัวของโปรตีนหลายๆ โมเลกุล เมื่อมีสารชีวโมเลกุลมากกว่า 1 โมเลกุลมาอยู่ด้วยกัน ซึ่งมักจะได้มาจากการทำ X–ray crystallography ข้อมูลในระดับนี้มีค่อนข้างน้อยและมักจะไม่ถูกนำมาวิเคราะห์ต่อ
งานวิจัยด้าน structural bioinformatics
งานวิจัยทางด้าน structural bioinformatics สามารถแบ่งออกได้เป็น 2 ลักษณะใหญ่ๆ ครับ ลักษณะแรก จะเรียกว่า structure prediction นั่นก็คือการทำนายโครงสร้างในระดับทุติยภูมิ ตติยภุมิ ไปจนถึงขั้นจตุรภูมิ โดยอาศัยข้อมูลจาก protein sequence ซึ่งเป็นโครงสร้างปฐมภูมินั่นเอง ส่วนงานอีกลักษณะหนึ่ง เรียกว่า structure analysis งานแบบนี้จะเป็นการสังเกตุสมบัติของสารชีวโมเลกุลในระดับโครงสร้าง โดยใช้ข้อมูลโครงสร้างสามมิติเป็นพื้นฐานในการวิเคราะห์
Structure prediction
การทำงานด้าน structure prediction นี้ นักวิจัยจะนำข้อมูลโครงสร้างในระดับปฐมภูมิ (ซึ่งก็คือ DNA sequence, RNA sequence และ protein sequence นั่นเอง) มาผ่านขั้นตอนการคำนวณด้วยโปรแกรมคอมพิวเตอร์ เพื่อทำนายโครงสร้างในระดับที่สูงกว่าออกมา ในตำรา bioinformatics หลายฉบับจัดงานประเภทนี้เป็นงานทางด้าน sequence analysis รูปแบบหนึ่ง เพียงแต่ผลลัพธ์ที่ได้จะอยู่ในรูปของโครงสร้างสามมิติครับ
งานวิจัยในกลุ่มนี้เริ่มต้นขึ้นหลังจากที่มีโครงสร้างสามมิติของสารชีวโมเลกุลเพิ่มมากขึ้น จึงมีการศึกษาเปรียบเทียบระหว่างโครงสร้างด้วยกันพบว่า ลักษณะใน sequence สามารถเชื่อมโยงถึงลักษณะการเกิดโครงสร้างได้ นักวิจัยสามารถทำนายถึงลักษณะของโครงสร้างต่างๆ ได้จาก sequence ประกอบกับการหาโครงสร้างสามมิติของสารชีวโมเลกุล แม้จะเจริญก้าวหน้ามากในช่วงหลังแต่ก็ยังทำได้ยากมากกว่าการหา sequence ทำให้ปริมาณ sequence ที่ถูกเก็บอยู่ในฐานข้อมูล เติบโตในอัตราที่เร็วมากเมื่อเปรียบเทียบกับปริมาณข้อมูลโครงสร้างที่ได้จากการทดลอง จึงมีการพัฒนาเทคนิคการหาโครงสร้างจาก sequence เพื่อที่จะใช้ข้อมูล sequence ที่มีอยู่มากมายมาใช้ในการศึกษาเชิงโครงสร้างได้โดยไม่ต้องรอที่จะหาโครงสร้างโดยวิธีทางห้องปฏิบัติการก่อน ทำให้งานวิจัยที่ต้องการข้อมูลทางด้านโครงสร้างสามารถดำเนินไปได้รวดเร็วยิ่งขึ้นงานหลักๆ ในกลุ่มนี้เช่น
การทำนายโครงสร้างระดับทุติยภูมิ (secondary structure predic-tion)
การทำนายโครงสร้างในระดับทุติยภูมิเป็นการทำนายลักษณะของโครงสร้าง ว่าบริเวณใดที่มีลักษณะโครงสร้างเป็น helix, strand, coil หรือ turn โดยอาศัยการจดจำการเรียงตัวของกรดอะมิโนต่างๆ ใน protein sequence นั้นๆ
ยุคเริ่มแรกการทำนายโครงสร้างในระดับนี้อาศัยการนับจำนวนของกรดอะมิโนแต่ละตัวที่ปรากฏในโครงสร้างลักษณะต่างๆ ในโครงสร้างสามมิติในฐานข้อมูล แล้วนำมาสร้างเป็นคะแนนให้กรดอะมิโนแต่ละตัวเพื่อนำมาใช้ในการทำนาย วิธีนี้มีความถูกต้องที่ต่ำมาก ในปัจจุบันมีการปรับปรุงวิธีการจดจำรูปแบบของกรดอะมิโนในโครงสร้างลักษณะต่างๆ ด้วยวิธีทางสถิติและ machine learning ช่วยให้การทำนายมีความถูกต้องมากขึ้นถึง 70% แต่โดยทั่วไปมักไม่นิยมที่จะทำนายโครงสร้างในระดับนี้นัก เพราะความถูกต้องจะต่ำกว่าการไปทำนายโครงสร้างสามมิติโดยตรง ซึ่งจะทำให้ทราบถึงโครงสร้างในระดับทุติยภูมิอยู่แล้ว ยกเว้นมักจะถูกนำไปใช้ในการทำนาย transmembrane helix ของโปรตีนในที่อยู่บนเยื่อหุ้มเซลล์ (cell membrane) ซึ่งมีความถูกต้องสูงกว่าการทำนายโครงสร้างทุติยภูมิแบบอื่นๆ และยังเป็นขั้นตอนที่จำเป็นในการทำนายโครงสร้างสามมิติของโปรตีนที่ี่อยู่บนเยื่อหุ้มเซลล์อีกด้วย
การทำนายโครงสร้างสามมิติของโปรตีน
หน้าที่และการทำงานของสารชีวโมเลกุลต่างๆ มีความเกี่ยวข้องกับโครงสร้างโมเลกุลของสารเหล่านั้นเป็นอย่างมาก ดังนั้น การศึกษากลไกการทำงานของสารชีวโมเลกุลชนิดต่างๆ โดยเฉพาะโปรตีนอย่างละเอียดจึงจำเป็นต้องศึกษาจากโครงสร้างของโมเลกุล แต่การทดลองเพื่อหาโครงสร้างของโปรตีนบางชนิดนั้นทำได้ยากมาก การทำนายโครงสร้างสามมิติจากลำดับของกรดอะมิโนโดยตรง จึงเป็นทางออกหนึ่งที่ดีมากทางหนึ่ง วิธีการทำนายโครงสร้างโมเลกุลที่ใช้พื้นฐานความรู้ทางวิวัฒนาการมาประกอบ ที่เราเรียกว่า homology modeling นั้น ดูจะเป็นวิธีการที่มีความถูกต้องมากที่สุดในบรรดาวิธีการทำนายที่ใช้อยู่ในปัจจุบัน วิธีการนี้จะใช้โปรตีนที่มีลำดับของกรดอะมิโนที่คล้ายคลึงกัน ซึ่งคาดว่าจะมีความสัมพันธ์ทางวิวัฒนาการ และมีโครงสร้างสามมิิติจากการทดลองมาเป็นต้นแบบ เพื่อใช้ในการทำนายโครงสร้างของโปรตีนที่ยังไม่รู้โครงสร้าง โดยโครงสร้างซึ่งเป็นผลลัพธ์จากการทำนายสามารถนำไปใช้ในการศึกษาอันตรกริยาระหว่างโปรตีนและลิแกนด์ (ligand) ได้ แต่ทั้งนี้ต้องขึ้นอยู่กับคุณภาพของโครงสร้างที่ทำนายได้ด้วย นอกจากนี้ โครงสร้างแบบนี้ ยังถูกนำไปใช้ในการสร้างโครงสร้างจากแผนที่อิเล็คตรอนที่ได้จากการทำ X–ray crystall-ography หรือ NMR ด้วย
การทำนายโครงสร้างของสายนิวคลีโอไทด์
ในอดีตไม่ค่อยมีนักวิจัยให้ความสนใจกับลักษณะโครงสร้างของ DNA และ RNA เท่าไรนัก เนื่องจากยังไม่พบความเชื่อมโยงระหว่างโครงสร้างกับการทำงาน แต่ต่อมาภายหลัง มีงานวิจัยหลายชิ้นที่ชี้ให้เห็นว่าโครงสร้างของ DNA เกี่ยวข้องกับการแสดงออก (express) ของยีนที่อยู่ในบริเวณนั้น รวมถึงการค้นพบ RNA ในกลุ่มของ functional RNA ซึ่งมีลักษณะโครงสร้างที่ซับซ้อนและหลากหลายมากกว่า RNA ในกลุ่ม ribosomal RNA (rRNA) และ transfer RNA (tRNA) จึงมีการศึกษาโครงสร้างรวมไปถึงการทำนายโครงสร้างของ DNA และ RNA เพิ่มขึ้น การทำนายโครงสร้างทุติยภูมิ มักจะเป็นการทำนายโครงสร้างของ RNA มากกว่า DNA เพราะลักษณะของ RNA มักจะเกิดขึ้นจากการจับกันของคู่เบสบน sequence ของตัวเอง เกิดเป็นโครงสร้างที่มีความเสถียรมากขึ้น ที่เรียกว่า ก้าน (stem) ของโครงสร้าง เทคนิคการทำนายโครงสร้างของ RNA จะเป็นการค้นหา inverted sequence ประกอบกับการทำนายพลังงานที่เกิดขึ้นเพื่อดูความเสถียรของโครงสร้าง การทำนายโครงสร้างของสาย RNA นั้นเป็นขั้นตอนที่สำคัญในการค้นหาตำแหน่งของยีน RNA และการศึกษาหน้าที่ของยีนนั้นๆ
Structure analysis
งานวิจัยอีกแบบหนึ่งของ structural bioinformatics เป็นงานวิจัยที่เกี่ยวข้องกับการนำข้อมูลโครงสร้างสามมิติมาใช้ศึกษากลไกการทำงานรวมถึงผลของโครงสร้างต่อหน้าที่ของสารชีวโมเลกุลนั้นๆ โดยข้อมูลที่นำมาใช้ศึกษา จะเป็นข้อมูลโครงสร้างที่ได้จากการทดลองแต่ในบางครั้งก็มีการนำโครงสร้างที่ได้จากการทำนายมาใช้ในการศึกษาด้วย เนื่องจากเป็นงานวิจัยที่ทำกับโครงสร้างสามมิติซึ่งจะต้องใช้เครื่องคอมพิวเตอร์ที่มีประสิทธิภาพค่อนข้างสูงใช้เวลานานเท่าการวิจัยในด้านอื่นๆ
Structure visualization
การหาโครงสร้างของสารชีวโมเลกุลด้วยวิธีทางห้องปฏิบัติการ จะได้ผลออกมาเป็นภาพหรือกราฟที่ดูไม่ออก และต้องนำมาแปลผลด้วยวิธีคำนวนต่างๆ จนออกมาเป็นรูปร่างจริงของโปรตีน เริ่มแรกนั้นนักวิทยาศาสตร์ที่ต้องการศึกษาโครงสร้างของสารและสมบัติต่างๆ ได้สร้างโครงสร้างที่แปลผลมาได้ ด้วยแท่งเหล็กและลูกบอลทรงกลมเป็นแบบจำลอง (model) ขึ้นมาหรือเป็นรูปทรงแบบหยาบๆ จากดินเหนียว จนกระทั่งคอมพิวเตอร์ได้รับการพัฒนาขึ้นจนสามารถประมวลผลภาพกราฟฟิกสามมิติจึงได้มีการเขียนโปรแกรมขึ้นเพื่อใช้ในการดูโครงสร้างสามมิติของสารชีวโมเลกุลต่างๆ และถูกเพิ่มเติมความสามารถใหม่ๆ เข้าไป เช่น การระบุโครงสร้างในระดับทุติยภูมิ การคำนวณพื้นผิวของโครงสร้าง การวาดรูปแบบการ์ตูนเพื่อใช้ในการตีพิมพ์ รวมถึงการพัฒนาอุปกรณ์สามมิติที่ใช้ในการเรียนการสอนซึ่งเป็นการถ่ายภาพแบบจำลองของโปรตีนอย่างหยาบเข้าไปในคอมพิวเตอร์แล้วมีการซ้อนทับรูปร่างของโปรตีนอย่างละเอียดลงไป ทำให้ผู้สอนสามารถหมุนและเคลืื่อนย้ายได้อย่างอิสระ แทนที่จะแสดงแค่จุดของอะตอมและขีดของพันธะเท่านั้น นอกจากนี้ยังสามารถเพิ่มเติมอุปกรณ์ต่างๆ เพื่อให้เหมาะกับการสอนได้อีกด้วย งานวิจัยในกลุ่มนี้อาจมองแล้วเป็นเรื่องง่ายๆ แต่ว่าเป็นส่วนสำคัญที่ทำให้งานวิจัยที่เกี่ยวข้องกับงานโครงสร้างสามารถทำได้ง่ายและรวดเร็วขึ้น อีกทั้งยังเป็นจุดเริ่มต้นของงานวิจัยที่เกี่ยวกับโครงสร้างอีกด้วย
Molecular docking
อย่างที่ทราบกันดีว่ากลไกการทำงานต่างๆ ในร่างกายของเรานั้น เกิดขึ้นจากการเกิดอันตรกริยากันระหว่างโมเลกุลในร่างกายทั้งสิ้น โดยเฉพาะสารชีวเคมีต่างๆ เช่น โปรตีน หรือ DNA เป็นต้น การศึกษากลไกการเกิดอันตรกริยาเหล่านี้ด้วยวิธีทางห้องปฏิบัตืการทำได้ยากและสิ้นเปลืองค่าใช้จ่ายมาก จึงมีการจำลองการเกิดอันตรกริยาด้วยคอมพิวเตอร์ขึ้น งานวิจัยทางด้านนี้เป็นการจำลองการเกิดอันตรกริยากันของสาร 2 ชนิดขึ้นไป ซึ่งกระบวนการเหล่านี้แบ่งออกเป็นสองส่วน คือส่วนที่ใช้ในการสุ่มตำแหน่งการจับ และการคำนวนพลังงานที่เกิดขึ้นจากการเข้าจับ ในช่วงเริ่มต้นความสนใจของนักวิจัยมุ่งไปที่การหายาใหม่ๆ เพื่อนำมาใช้ในการรักษาโรค การศึกษาจึงเน้นไปที่การเกิดอันตรกริยาของสารเคมีที่น่าจะเป็นยากับโปรตีนเป้าหมาย ก่อนที่จะทำการทดสอบจริงในห้องปฏิบัติการ ซึ่งการใช้คอมพิวเตอร์เข้ามาจำลองการจับกันนี้ช่วยประหยัดเวลาในการค้นหายาใหม่เป็นอันมาก ภายหลังโปรแกรมคอมพิวเตอร์ที่ใช้ในการศึกษาพัฒนาขึ้นอย่างรวดเร็ว ในปัจจุบันนักวิจัยสามารถศึกษากลไกการเกิดอันตรกริยาของสารที่หลากหลายมากขึ้น ซับซ้อนมากขึ้นและมีขนาดใหญ่ได้
Molecular simulation
เป็นการจำลองโมเลกุลต่างๆ ในสภาวะที่เสมือนจริงในคอมพิวเตอร์ และควบคุมการเคลื่อนที่และอันตรกริยาของแต่ละอะตอมด้วยกฏและสมการทางฟิสิกส์ เช่นการนำโปรตีนไปใส่ในสภาวะจำลองที่เป็นน้ำ หลังจากนั้นสภาวะจำลองจะถูกดำเนินไปข้างหน้าด้วยการขยับอะตอมทุกตัวด้วยสมการทางฟิสิกส์ซึ่งลักษณะจะคล้ายกับสมการการเคลื่อนที่ในแนวเส้นตรงที่เรียนกันในสมัยมัธยมปลาย ในช่วงเวลาเป็น 1 ในพันล้านส่วนของวินาที เช่นนี้ไปเรื่อยๆ จนกระทั่งตัวระบบ (system) ซึ่งก็คือ โปรตีนและน้ำที่ล้อมรอบเข้าสู่สภาวะสมดุล หลังจากนั้นจึงจะสามารถศึกษาพฤติกรรมต่างๆ ของระบบได้ โดยมากวิธีนี้จะถูกนำมาใช้สังเกตุเหตุการที่ไม่สามารถมองเห็นด้วยตาได้ เช่นลักษณะการเปิดปิดของ catalytic site ในเอนไซม์ต่างๆ การเคลื่อนที่ของโมเลกุลต่างๆในน้ำ การเกิดอัตรกริยาระหว่างสารชีวโมเลกุลด้วยกัน ใช้คำนวนค่าทางอุณหพลศาสตร์ (thermodynamic) ต่างๆ ของระบบ นอกจากนี้ยังถูกนำไปใช้ทำนายโครงสร้างอีกด้วย จะเห็นว่างานทางด้านนี้สามารถนำมาหาคำตอบทางชีววิทยาที่หลากหลาย และยังให้ความถูกต้องที่สูงมากด้วย แต่ด้วยข้อจำกัดทางการคำนวนที่ต้องใช้เครื่องคอมพิวเตอร์ขนาดใหญ่และใช้เวลาในการคำนวณมาก นักวิจัยจำนวนมากจึงหันไปใช้วิธีที่ให้คำตอบได้ในระดีบที่เพียงพอต่อความต้องการแต่ใช้เวลาในการคำนวณน้อยกว่ามากๆ แทน งานวิจัยด้านนี้จึงมีการพัฒนาช้าเมื่อเทียบกับงานวิจัยด้านอื่นๆ ทาง structure analysis
งานด้าน structural bioinformatics ยังมีอีกมากมายครับ ส่วนที่ผมนำมาเล่าให้ฟังในบทความนี้เป็นเพียงแค่ส่วนที่สำคัญและมีแนวทางงานวิจัยที่ชัดเจนแล้วเท่านั้น ยังมีงานอีกมากมายที่จะคาบเกี่ยวกับงานวิจัยทางฟิสิกส์ซึ่งผมไม่ได้นำมาเล่าให้ฟังครับ ถ้าผู้อ่านสนใจ อาจจะต้องค้นคว้าหาข้อมูลในเชิงลึกต่อไป จากงานวิจัยหลักๆ ที่กล่าวมานั้น นักวิจัยสามารถประยุกต์วิธีและขบวนการเหล่านี้ไปใช้ตอบคำถามทางชีววิทยาได้มากมาย เช่น การนำโครงสร้างไปช่วยในการเปรียบเทียบ sequence ที่มีความแตกต่างมากๆ ได้ การระบุหน้าที่ด้วยการเปรียบเทียบโครงสร้างแทนการเปรียบเทียบ sequence ซึ่งในบางกรณีที่ใช้ sequence แล้วหาคำตอบไม่ได้ แต่อาจจะใช้โครงสร้างแทนได้ดีกว่า ในประเทศไทยยังไม่ค่อยมีการริเริ่มงานวิจัยด้านนี้อย่างจริงจังเท่าไรนัก คงต้องอาศัยความร่วมมือนักวิจัยหลายๆ แขนงเพื่อช่วยให้งานทางด้านนี้เกิดขึ้นอย่างจริงจังต่อไปในอนาคต
ถ้ามองย้อนกลับไปราวทศวรรษที่ 1950 โครงสร้างสามมิติของ myoglobin ซึ่งเป็นโปรตีนตัวแรกในวาฬ ถูกสร้างขึ้นด้วยวิธี X-ray crystallography โดยนักวิทยาศาสตร์สองท่านคือ แมก เพอรุส (Max Perutz) นักวิทยาศาสตร์ชาวอังกฤษ และ เซอร์ จอร์น ควูเดอรี่ เคนดรอวว์ (Sir John Coudery Kendraw) นักวิทยาศาสตร์ออสเตรีย ผลงานชิ้นนี้เอง ทำให้นักวิทยาศาสตร์ทั้งสองท่านได้รับรางวัลโนเบลในปี ค.ศ. 1962 และยังเป็นจุดเริ่มต้นยุคแห่งการศึกษาโครงสร้างระดับสูงของสารชีวโมเลกุล ในปัจจุบันวิธีในการค้นหาโครงสร้างสามมิติของสารชีวโมเลกุลต่างๆ ได้รับการพัฒนาขึ้นมาก จนมีเทคนิคและวิธีการที่หลากหลายมากขึ้น ในด้านของวิทยาการคอมพิวเตอร์ ก็มีการพัฒนาขีดความสามารถไปด้วยกันกับการพัฒนาโครงสร้างสามมิติ ทำให้มีการสร้างข้อมูลโครงสร้างสามมิติที่มีคุณภาพสูงเกิดขึ้นมากมาย งานวิจัยทางด้าน structural bioinformatics นั้นจะเกี่ยวข้องกับข้อมูลโครงสร้างของสารชีวโมเลกุลในทุกระดับ แต่ส่วนใหญ่จะมุ่งเน้นไปที่การศึกษาโครงสร้างของโปรตีนในระดับตติยภูมิซึ่งเป็นโครงสร้างสามมิติเป็นหลัก
สิ่งมีชีวิตทุกชนิดประกอบขึ้นจากสารประกอบทางชีวเคมีต่างๆ มากมาย โดยที่สารเหล่านั้นจะทำงานประสานกันอย่างต่อเนื่อง เกิดเป็นกลไกต่างๆ เพื่อให้สิ่งมีชีวิตสามารถดำรงชีพอยู่รอดได้ในธรรมชาติ ความสามารถหรือคุณสมบัติต่างๆ ของสารชีวโมเลกุลเหล่านั้น เกิดขึ้นมาจากรูปแบบการเรียงตัวของอะตอมและอันตรกิริยา (interaction) ระหว่างอะตอมด้วยกันนั่นเอง ดังนั้น การคำนวนต่างๆ จึงต้องอยู่บนพื้นฐานการเกิดอันตรกิริยาของอะตอมแต่ละตัวเป็นหลัก
งานวิจัยทางด้าน structure bioinformatics จะแบ่งคร่าวๆ เป็นสองแขนงหลักตามชนิดของข้อมูลในระดับโครงสร้าง คือ ข้อมูลในระดับปฐมภูมิ (primary structure) จะเกี่ยวข้องกับการนำลำดับของสารชีวโมเลกุลแต่ละชนิดมาทำนายโครงสร้างและสมบัติต่างๆ ของสารชีวโมเลกุลนั้นๆส่วนข้อมูลระดับตติยภูมิ (tertiary structure) จะเกี่ยวข้องกับการนำข้อมูลโครงสร้างสามมิติมาเพื่อศึกษาสมบัติทางเคมี และชีวเคมี
ระดับโครงสร้างของสารชีวโมเลกุลและฐานข้อมูล
ตามที่ผู้อ่านทุกท่านทราบกันดีอยู่แล้วว่า bio-informatics เป็นศาสตร์ที่เกิดขึ้นจากความต้องการที่จะใช้ข้อมูลทางชีววิทยาอย่างเป็นระบบและมีประสิทธิภาพสูงที่สุด รวมถึงการตอบโจทย์ทางชีววิทยาต่างๆ ด้วยการประมวลผลจากข้อมูล ซึ่งงานด้าน structure bioinformatics ก็เป็นเช่นเดียวกัน แต่ลักษณะของข้อมูลอาจจะแตกต่างกันออกไป ไม่ได้เป็นแบบที่หลายคนคุ้นเคย เหมือนงานในด้าน sequence analysis หรือ bioinformatics สาขาอื่นๆ ดังนั้น ผมเลยจะถือโอกาสนี้ แนะนำให้ท่านผู้อ่านได้รู้จักกับชนิดของข้อมูลหลักๆ ในงานด้าน structure bioinformatics กันสักเล็กน้อยครับ ลักษณะข้อมูลของโครงสร้างโมเลกุล (molecular structure) จะแบ่งออกตามระดับของโครงสร้าง ซึ่งมีทั้งหมดสี่ระดับ ได้แก่ โครงสร้างในระดับปฐมภูมิ (primary structure) ทุติยภูมิ (secondary structure) ตติยภูมิ (tertiary structure) และสุดท้ายในระดับจตุรภูมิ (quaternary structure)
ลักษณะโครงสร้างโมเลกุลในระดับปฐมภูมินี้ยังไม่ซับซ้อนครับ หลายคนอาจจะคุ้นหน้าคุ้นตากันดี เนื่องจากเป็นข้อมูลจำพวก DNA sequence, RNA sequence หรือ protein sequence นั่นเอง ข้อมูลในระดับนี้ส่วนใหญ่ได้มาจากการทำ DNA sequencing แล้วจึงนำ DNA sequence ที่ได้มาแปรเป็น RNA หรือ protein sequence ด้วยโปรแกรมคอมพิวเตอร์ในภายหลัง เนื่องจากการทำ RNA sequencing และ protein sequencing ทำได้ยากและมีต้นทุนสูง นักวิทยาศาสตร์ที่ทำงานด้าน bioinformatics ที่ไม่ต้องอาศัยข้อมูลจากห้องปฏิบัติการของตัวเอง ก็สามารถค้นหาข้อมูลที่ต้องการและ download ข้อมูลเหล่านั้นมาจากฐานข้อมูลต่างๆ อาทิเช่น GenBank, EBI, UniProt เป็นต้น
ถัดไปเป็นโครงสร้างในระดับทุติยภูมิ ผมจะยกตัวอย่างเป็น protein sequence ก่อนนะครับ โครงสร้างในระดับนี้ เราจะพิจารณาถึงการเกิดอันตรกริยาของกรดอะมีโนตัวที่อยู่ใกล้ๆ กัน เกิดเป็นโครงสร้างอย่างง่ายๆ ที่เรียกว่า helix กับ strand นั่นเอง ส่วนโครงสร้างในระดับทุติยภูมิของ DNA sequence และ RNA sequence จะหมายถึงการจับคู่ของเบสในสายของ DNA และ RNA นั่นเอง ข้อมูลในระดับนี้ได้จากการใช้โปรแกรมคอมพิวเตอร์ไปวัดมุมต่างๆ ในโครงสร้างระดับตติยะภูมิ ที่ได้จากการทดลองแล้วระบุว่าเป็น helix, strand, coil และ turn แล้วเก็บในฐานข้อมูล โดยปกติเราไม่นิยมใช้ข้อมูลในระดับสักเท่าไหร่ เนื่องจากเราสามารถสังเกตุได้จากโครงสร้างในระดับที่สูงกว่านี้ได้โดยตรงอยู่แล้ว
โครงสร้างระดับตติยภูมิ ขัอมูลในระดับนี้ได้จากการทดลองเพื่อหาโครงสร้างสามมิติของสารชีวโมเลกุลด้วยวิธีต่างๆ เช่น X–ray diffraction, nuclear magnetic resonance (NMR) และการถ่ายภาพจากกล้องจุลทรรศน์อิเล็กตรอน (electron microscopy) ข้อมูลนี้จะมีหลายลักษณะตั้งแต่ข้อมูลที่มีรายละเอียดต่ำที่สุด คือ ภาพการกระเจิงของรังสีเอ็กซ์ จากนั้นก็เป็นข้อมูลที่มรายละเอียดมากขึ้น อย่างเช่น ภาพกราฟที่ได้จาก NMR ซึ่งต้องใช้คอมพิวเตอร์มาสร้างเป็น electron map แล้วจึงระบุตำแหน่งของอะตอมแต่ละตัวลงไปในระนาบสามมิติ ซึ่งข้อมูลที่เป็นตำแหน่งของอะตอมนี้เป็นข้อมูลในระดับสุดท้ายซึ่งสามารถนำไปวิเคราะห์ต่อไปได้อีกมากมาย นักวิจัยสามารถหาข้อมูลเหล่านี้ได้จากฐานข้อมูล protein data bank (www.pdb.org/) ข้อมูลในระดับนี้ถือเป็นข้อมูลหลักของงานด้าน structural bioinformatics เลยทีเดียว
ลำดับสุดท้าย คือ ข้อมูลโครงสร้างในระดับจตุรภูมิ ซึ่งเป็นข้อมูลที่เกี่ยวข้องกับการเรียงตัวของโปรตีนหลายๆ โมเลกุล เมื่อมีสารชีวโมเลกุลมากกว่า 1 โมเลกุลมาอยู่ด้วยกัน ซึ่งมักจะได้มาจากการทำ X–ray crystallography ข้อมูลในระดับนี้มีค่อนข้างน้อยและมักจะไม่ถูกนำมาวิเคราะห์ต่อ
งานวิจัยด้าน structural bioinformatics
งานวิจัยทางด้าน structural bioinformatics สามารถแบ่งออกได้เป็น 2 ลักษณะใหญ่ๆ ครับ ลักษณะแรก จะเรียกว่า structure prediction นั่นก็คือการทำนายโครงสร้างในระดับทุติยภูมิ ตติยภุมิ ไปจนถึงขั้นจตุรภูมิ โดยอาศัยข้อมูลจาก protein sequence ซึ่งเป็นโครงสร้างปฐมภูมินั่นเอง ส่วนงานอีกลักษณะหนึ่ง เรียกว่า structure analysis งานแบบนี้จะเป็นการสังเกตุสมบัติของสารชีวโมเลกุลในระดับโครงสร้าง โดยใช้ข้อมูลโครงสร้างสามมิติเป็นพื้นฐานในการวิเคราะห์
Structure prediction
การทำงานด้าน structure prediction นี้ นักวิจัยจะนำข้อมูลโครงสร้างในระดับปฐมภูมิ (ซึ่งก็คือ DNA sequence, RNA sequence และ protein sequence นั่นเอง) มาผ่านขั้นตอนการคำนวณด้วยโปรแกรมคอมพิวเตอร์ เพื่อทำนายโครงสร้างในระดับที่สูงกว่าออกมา ในตำรา bioinformatics หลายฉบับจัดงานประเภทนี้เป็นงานทางด้าน sequence analysis รูปแบบหนึ่ง เพียงแต่ผลลัพธ์ที่ได้จะอยู่ในรูปของโครงสร้างสามมิติครับ
งานวิจัยในกลุ่มนี้เริ่มต้นขึ้นหลังจากที่มีโครงสร้างสามมิติของสารชีวโมเลกุลเพิ่มมากขึ้น จึงมีการศึกษาเปรียบเทียบระหว่างโครงสร้างด้วยกันพบว่า ลักษณะใน sequence สามารถเชื่อมโยงถึงลักษณะการเกิดโครงสร้างได้ นักวิจัยสามารถทำนายถึงลักษณะของโครงสร้างต่างๆ ได้จาก sequence ประกอบกับการหาโครงสร้างสามมิติของสารชีวโมเลกุล แม้จะเจริญก้าวหน้ามากในช่วงหลังแต่ก็ยังทำได้ยากมากกว่าการหา sequence ทำให้ปริมาณ sequence ที่ถูกเก็บอยู่ในฐานข้อมูล เติบโตในอัตราที่เร็วมากเมื่อเปรียบเทียบกับปริมาณข้อมูลโครงสร้างที่ได้จากการทดลอง จึงมีการพัฒนาเทคนิคการหาโครงสร้างจาก sequence เพื่อที่จะใช้ข้อมูล sequence ที่มีอยู่มากมายมาใช้ในการศึกษาเชิงโครงสร้างได้โดยไม่ต้องรอที่จะหาโครงสร้างโดยวิธีทางห้องปฏิบัติการก่อน ทำให้งานวิจัยที่ต้องการข้อมูลทางด้านโครงสร้างสามารถดำเนินไปได้รวดเร็วยิ่งขึ้นงานหลักๆ ในกลุ่มนี้เช่น
การทำนายโครงสร้างระดับทุติยภูมิ (secondary structure predic-tion)
การทำนายโครงสร้างในระดับทุติยภูมิเป็นการทำนายลักษณะของโครงสร้าง ว่าบริเวณใดที่มีลักษณะโครงสร้างเป็น helix, strand, coil หรือ turn โดยอาศัยการจดจำการเรียงตัวของกรดอะมิโนต่างๆ ใน protein sequence นั้นๆ
ยุคเริ่มแรกการทำนายโครงสร้างในระดับนี้อาศัยการนับจำนวนของกรดอะมิโนแต่ละตัวที่ปรากฏในโครงสร้างลักษณะต่างๆ ในโครงสร้างสามมิติในฐานข้อมูล แล้วนำมาสร้างเป็นคะแนนให้กรดอะมิโนแต่ละตัวเพื่อนำมาใช้ในการทำนาย วิธีนี้มีความถูกต้องที่ต่ำมาก ในปัจจุบันมีการปรับปรุงวิธีการจดจำรูปแบบของกรดอะมิโนในโครงสร้างลักษณะต่างๆ ด้วยวิธีทางสถิติและ machine learning ช่วยให้การทำนายมีความถูกต้องมากขึ้นถึง 70% แต่โดยทั่วไปมักไม่นิยมที่จะทำนายโครงสร้างในระดับนี้นัก เพราะความถูกต้องจะต่ำกว่าการไปทำนายโครงสร้างสามมิติโดยตรง ซึ่งจะทำให้ทราบถึงโครงสร้างในระดับทุติยภูมิอยู่แล้ว ยกเว้นมักจะถูกนำไปใช้ในการทำนาย transmembrane helix ของโปรตีนในที่อยู่บนเยื่อหุ้มเซลล์ (cell membrane) ซึ่งมีความถูกต้องสูงกว่าการทำนายโครงสร้างทุติยภูมิแบบอื่นๆ และยังเป็นขั้นตอนที่จำเป็นในการทำนายโครงสร้างสามมิติของโปรตีนที่ี่อยู่บนเยื่อหุ้มเซลล์อีกด้วย
การทำนายโครงสร้างสามมิติของโปรตีน
หน้าที่และการทำงานของสารชีวโมเลกุลต่างๆ มีความเกี่ยวข้องกับโครงสร้างโมเลกุลของสารเหล่านั้นเป็นอย่างมาก ดังนั้น การศึกษากลไกการทำงานของสารชีวโมเลกุลชนิดต่างๆ โดยเฉพาะโปรตีนอย่างละเอียดจึงจำเป็นต้องศึกษาจากโครงสร้างของโมเลกุล แต่การทดลองเพื่อหาโครงสร้างของโปรตีนบางชนิดนั้นทำได้ยากมาก การทำนายโครงสร้างสามมิติจากลำดับของกรดอะมิโนโดยตรง จึงเป็นทางออกหนึ่งที่ดีมากทางหนึ่ง วิธีการทำนายโครงสร้างโมเลกุลที่ใช้พื้นฐานความรู้ทางวิวัฒนาการมาประกอบ ที่เราเรียกว่า homology modeling นั้น ดูจะเป็นวิธีการที่มีความถูกต้องมากที่สุดในบรรดาวิธีการทำนายที่ใช้อยู่ในปัจจุบัน วิธีการนี้จะใช้โปรตีนที่มีลำดับของกรดอะมิโนที่คล้ายคลึงกัน ซึ่งคาดว่าจะมีความสัมพันธ์ทางวิวัฒนาการ และมีโครงสร้างสามมิิติจากการทดลองมาเป็นต้นแบบ เพื่อใช้ในการทำนายโครงสร้างของโปรตีนที่ยังไม่รู้โครงสร้าง โดยโครงสร้างซึ่งเป็นผลลัพธ์จากการทำนายสามารถนำไปใช้ในการศึกษาอันตรกริยาระหว่างโปรตีนและลิแกนด์ (ligand) ได้ แต่ทั้งนี้ต้องขึ้นอยู่กับคุณภาพของโครงสร้างที่ทำนายได้ด้วย นอกจากนี้ โครงสร้างแบบนี้ ยังถูกนำไปใช้ในการสร้างโครงสร้างจากแผนที่อิเล็คตรอนที่ได้จากการทำ X–ray crystall-ography หรือ NMR ด้วย
การทำนายโครงสร้างของสายนิวคลีโอไทด์
ในอดีตไม่ค่อยมีนักวิจัยให้ความสนใจกับลักษณะโครงสร้างของ DNA และ RNA เท่าไรนัก เนื่องจากยังไม่พบความเชื่อมโยงระหว่างโครงสร้างกับการทำงาน แต่ต่อมาภายหลัง มีงานวิจัยหลายชิ้นที่ชี้ให้เห็นว่าโครงสร้างของ DNA เกี่ยวข้องกับการแสดงออก (express) ของยีนที่อยู่ในบริเวณนั้น รวมถึงการค้นพบ RNA ในกลุ่มของ functional RNA ซึ่งมีลักษณะโครงสร้างที่ซับซ้อนและหลากหลายมากกว่า RNA ในกลุ่ม ribosomal RNA (rRNA) และ transfer RNA (tRNA) จึงมีการศึกษาโครงสร้างรวมไปถึงการทำนายโครงสร้างของ DNA และ RNA เพิ่มขึ้น การทำนายโครงสร้างทุติยภูมิ มักจะเป็นการทำนายโครงสร้างของ RNA มากกว่า DNA เพราะลักษณะของ RNA มักจะเกิดขึ้นจากการจับกันของคู่เบสบน sequence ของตัวเอง เกิดเป็นโครงสร้างที่มีความเสถียรมากขึ้น ที่เรียกว่า ก้าน (stem) ของโครงสร้าง เทคนิคการทำนายโครงสร้างของ RNA จะเป็นการค้นหา inverted sequence ประกอบกับการทำนายพลังงานที่เกิดขึ้นเพื่อดูความเสถียรของโครงสร้าง การทำนายโครงสร้างของสาย RNA นั้นเป็นขั้นตอนที่สำคัญในการค้นหาตำแหน่งของยีน RNA และการศึกษาหน้าที่ของยีนนั้นๆ
Structure analysis
งานวิจัยอีกแบบหนึ่งของ structural bioinformatics เป็นงานวิจัยที่เกี่ยวข้องกับการนำข้อมูลโครงสร้างสามมิติมาใช้ศึกษากลไกการทำงานรวมถึงผลของโครงสร้างต่อหน้าที่ของสารชีวโมเลกุลนั้นๆ โดยข้อมูลที่นำมาใช้ศึกษา จะเป็นข้อมูลโครงสร้างที่ได้จากการทดลองแต่ในบางครั้งก็มีการนำโครงสร้างที่ได้จากการทำนายมาใช้ในการศึกษาด้วย เนื่องจากเป็นงานวิจัยที่ทำกับโครงสร้างสามมิติซึ่งจะต้องใช้เครื่องคอมพิวเตอร์ที่มีประสิทธิภาพค่อนข้างสูงใช้เวลานานเท่าการวิจัยในด้านอื่นๆ
Structure visualization
การหาโครงสร้างของสารชีวโมเลกุลด้วยวิธีทางห้องปฏิบัติการ จะได้ผลออกมาเป็นภาพหรือกราฟที่ดูไม่ออก และต้องนำมาแปลผลด้วยวิธีคำนวนต่างๆ จนออกมาเป็นรูปร่างจริงของโปรตีน เริ่มแรกนั้นนักวิทยาศาสตร์ที่ต้องการศึกษาโครงสร้างของสารและสมบัติต่างๆ ได้สร้างโครงสร้างที่แปลผลมาได้ ด้วยแท่งเหล็กและลูกบอลทรงกลมเป็นแบบจำลอง (model) ขึ้นมาหรือเป็นรูปทรงแบบหยาบๆ จากดินเหนียว จนกระทั่งคอมพิวเตอร์ได้รับการพัฒนาขึ้นจนสามารถประมวลผลภาพกราฟฟิกสามมิติจึงได้มีการเขียนโปรแกรมขึ้นเพื่อใช้ในการดูโครงสร้างสามมิติของสารชีวโมเลกุลต่างๆ และถูกเพิ่มเติมความสามารถใหม่ๆ เข้าไป เช่น การระบุโครงสร้างในระดับทุติยภูมิ การคำนวณพื้นผิวของโครงสร้าง การวาดรูปแบบการ์ตูนเพื่อใช้ในการตีพิมพ์ รวมถึงการพัฒนาอุปกรณ์สามมิติที่ใช้ในการเรียนการสอนซึ่งเป็นการถ่ายภาพแบบจำลองของโปรตีนอย่างหยาบเข้าไปในคอมพิวเตอร์แล้วมีการซ้อนทับรูปร่างของโปรตีนอย่างละเอียดลงไป ทำให้ผู้สอนสามารถหมุนและเคลืื่อนย้ายได้อย่างอิสระ แทนที่จะแสดงแค่จุดของอะตอมและขีดของพันธะเท่านั้น นอกจากนี้ยังสามารถเพิ่มเติมอุปกรณ์ต่างๆ เพื่อให้เหมาะกับการสอนได้อีกด้วย งานวิจัยในกลุ่มนี้อาจมองแล้วเป็นเรื่องง่ายๆ แต่ว่าเป็นส่วนสำคัญที่ทำให้งานวิจัยที่เกี่ยวข้องกับงานโครงสร้างสามารถทำได้ง่ายและรวดเร็วขึ้น อีกทั้งยังเป็นจุดเริ่มต้นของงานวิจัยที่เกี่ยวกับโครงสร้างอีกด้วย
Molecular docking
อย่างที่ทราบกันดีว่ากลไกการทำงานต่างๆ ในร่างกายของเรานั้น เกิดขึ้นจากการเกิดอันตรกริยากันระหว่างโมเลกุลในร่างกายทั้งสิ้น โดยเฉพาะสารชีวเคมีต่างๆ เช่น โปรตีน หรือ DNA เป็นต้น การศึกษากลไกการเกิดอันตรกริยาเหล่านี้ด้วยวิธีทางห้องปฏิบัตืการทำได้ยากและสิ้นเปลืองค่าใช้จ่ายมาก จึงมีการจำลองการเกิดอันตรกริยาด้วยคอมพิวเตอร์ขึ้น งานวิจัยทางด้านนี้เป็นการจำลองการเกิดอันตรกริยากันของสาร 2 ชนิดขึ้นไป ซึ่งกระบวนการเหล่านี้แบ่งออกเป็นสองส่วน คือส่วนที่ใช้ในการสุ่มตำแหน่งการจับ และการคำนวนพลังงานที่เกิดขึ้นจากการเข้าจับ ในช่วงเริ่มต้นความสนใจของนักวิจัยมุ่งไปที่การหายาใหม่ๆ เพื่อนำมาใช้ในการรักษาโรค การศึกษาจึงเน้นไปที่การเกิดอันตรกริยาของสารเคมีที่น่าจะเป็นยากับโปรตีนเป้าหมาย ก่อนที่จะทำการทดสอบจริงในห้องปฏิบัติการ ซึ่งการใช้คอมพิวเตอร์เข้ามาจำลองการจับกันนี้ช่วยประหยัดเวลาในการค้นหายาใหม่เป็นอันมาก ภายหลังโปรแกรมคอมพิวเตอร์ที่ใช้ในการศึกษาพัฒนาขึ้นอย่างรวดเร็ว ในปัจจุบันนักวิจัยสามารถศึกษากลไกการเกิดอันตรกริยาของสารที่หลากหลายมากขึ้น ซับซ้อนมากขึ้นและมีขนาดใหญ่ได้
Molecular simulation
เป็นการจำลองโมเลกุลต่างๆ ในสภาวะที่เสมือนจริงในคอมพิวเตอร์ และควบคุมการเคลื่อนที่และอันตรกริยาของแต่ละอะตอมด้วยกฏและสมการทางฟิสิกส์ เช่นการนำโปรตีนไปใส่ในสภาวะจำลองที่เป็นน้ำ หลังจากนั้นสภาวะจำลองจะถูกดำเนินไปข้างหน้าด้วยการขยับอะตอมทุกตัวด้วยสมการทางฟิสิกส์ซึ่งลักษณะจะคล้ายกับสมการการเคลื่อนที่ในแนวเส้นตรงที่เรียนกันในสมัยมัธยมปลาย ในช่วงเวลาเป็น 1 ในพันล้านส่วนของวินาที เช่นนี้ไปเรื่อยๆ จนกระทั่งตัวระบบ (system) ซึ่งก็คือ โปรตีนและน้ำที่ล้อมรอบเข้าสู่สภาวะสมดุล หลังจากนั้นจึงจะสามารถศึกษาพฤติกรรมต่างๆ ของระบบได้ โดยมากวิธีนี้จะถูกนำมาใช้สังเกตุเหตุการที่ไม่สามารถมองเห็นด้วยตาได้ เช่นลักษณะการเปิดปิดของ catalytic site ในเอนไซม์ต่างๆ การเคลื่อนที่ของโมเลกุลต่างๆในน้ำ การเกิดอัตรกริยาระหว่างสารชีวโมเลกุลด้วยกัน ใช้คำนวนค่าทางอุณหพลศาสตร์ (thermodynamic) ต่างๆ ของระบบ นอกจากนี้ยังถูกนำไปใช้ทำนายโครงสร้างอีกด้วย จะเห็นว่างานทางด้านนี้สามารถนำมาหาคำตอบทางชีววิทยาที่หลากหลาย และยังให้ความถูกต้องที่สูงมากด้วย แต่ด้วยข้อจำกัดทางการคำนวนที่ต้องใช้เครื่องคอมพิวเตอร์ขนาดใหญ่และใช้เวลาในการคำนวณมาก นักวิจัยจำนวนมากจึงหันไปใช้วิธีที่ให้คำตอบได้ในระดีบที่เพียงพอต่อความต้องการแต่ใช้เวลาในการคำนวณน้อยกว่ามากๆ แทน งานวิจัยด้านนี้จึงมีการพัฒนาช้าเมื่อเทียบกับงานวิจัยด้านอื่นๆ ทาง structure analysis
งานด้าน structural bioinformatics ยังมีอีกมากมายครับ ส่วนที่ผมนำมาเล่าให้ฟังในบทความนี้เป็นเพียงแค่ส่วนที่สำคัญและมีแนวทางงานวิจัยที่ชัดเจนแล้วเท่านั้น ยังมีงานอีกมากมายที่จะคาบเกี่ยวกับงานวิจัยทางฟิสิกส์ซึ่งผมไม่ได้นำมาเล่าให้ฟังครับ ถ้าผู้อ่านสนใจ อาจจะต้องค้นคว้าหาข้อมูลในเชิงลึกต่อไป จากงานวิจัยหลักๆ ที่กล่าวมานั้น นักวิจัยสามารถประยุกต์วิธีและขบวนการเหล่านี้ไปใช้ตอบคำถามทางชีววิทยาได้มากมาย เช่น การนำโครงสร้างไปช่วยในการเปรียบเทียบ sequence ที่มีความแตกต่างมากๆ ได้ การระบุหน้าที่ด้วยการเปรียบเทียบโครงสร้างแทนการเปรียบเทียบ sequence ซึ่งในบางกรณีที่ใช้ sequence แล้วหาคำตอบไม่ได้ แต่อาจจะใช้โครงสร้างแทนได้ดีกว่า ในประเทศไทยยังไม่ค่อยมีการริเริ่มงานวิจัยด้านนี้อย่างจริงจังเท่าไรนัก คงต้องอาศัยความร่วมมือนักวิจัยหลายๆ แขนงเพื่อช่วยให้งานทางด้านนี้เกิดขึ้นอย่างจริงจังต่อไปในอนาคต
http://www.4shared.com/file/258233565/b93a2d42/THAI_Bioinformatics-April_2010.html?
ReplyDeleteนี่เป็น link สำหรับ download นิตยสารฉบับ PDF ของเดือนเมษายนครับ
http://fold.it/portal/
ReplyDeleteอาจารย์ให้นักเรียนที่เรียนวิชานี้กลับไป download เกมส์ fold protein มาเล่นค่ะ เพิ่งเรียนมา สดๆ ร้อนๆ ลองดูนะคะ
ขอบคุณครับ จะลอง download มาเล่นดูครับ ท่าทางน่าสนุก
ReplyDelete