Friday, January 1, 2010

Highlight

Bioinformatics: ศาสตร์แขนงใหม่ที่คนไทยต้องรู้จัก
ประเวช อรรจวัฒนวงศ์

สวัสดีปีใหม่ครับ สำหรับคอลัมน์ Highlight ในปีนี้ ผมอยากจะจัดให้เป็น series ของ bioinformatics แบบจริงๆ เสียที หลังจากที่เราได้พยายามตั้งไข่กันมาหลายเดือน ดังนั้น Highlight ในปีนี้ ผมจะพาท่านผู้อ่านมาทำความรู้จักกับศาสตร์ที่เราเรียกกันว่า bioinformatics กันครับ เพื่อที่จะได้เข้าใจในเบื้องต้นว่า สิ่งที่เราเคยเข้าใจเกี่ยวกับ bioinformatics นั้นเป็นไปอย่างที่เราคิดไว้หรือไม่ และในเนื้อหาของ e-Magazine ฉบับต่อๆ ไปก็จะแนะนำสาขาย่อยต่างๆ ของ bioinformatics รวมไปถึง ศาสตร์ใหม่ๆ อย่างเช่น genomics, proteomics, functional genomics, metabolomics ด้วย และเพื่อไม่ให้เป็นการเสียเวลา เราไปทำความรู้จักกับ bioinformatics กันเลยครับ

คำว่า bioinformatics นั้น น่าจะเกิดขึ้นบนโลกใบนี้ตั้งแต่ปี ค.ศ. 1978 โดยนักชีววิทยาทฤษฎี (theoretical biologist) ชาวฮอล์แลนชื่อ พอลเลี่ยน ฮ๊อจเวก (Paulien Hogeweg) เธอจบปริญญาเอกจากมหาวิทยาลัยอูเทรก (Utrecht University) ประเทศเนเธอแลนด์ และมีผลงานวิจัยมากมายเกี่ยวกับการประยุกต์ใช้สารสนเทศในงานชีววิทยา ต่อมาเมื่อโลกแห่งวิทยาศาสตร์หมุนเข้าสู่ยุคของจีโนม (genomic era) นักวิจัยจำนวนมากมุ่งเป้าการศึกษาไปที่การค้นหาลำดับดีเอ็นเอของสิ่งมีชีวิตหลากหลายชนิด ไม่กี่ปีหลังจากนั้น เทคโนโลยีการถอดรหัสพันธุกรรมก็กลายเป็นเรื่องที่แสนจะง่ายดาย ทำให้เรามีข้อมูลลำดับดีเอ็นเอมากมายมหาศาล ทีนี้ก็จำเป็นที่จะต้องมีการจัดเก็บข้อมูลอย่างเป็นระบบ เพื่อให้สะดวกต่อการค้นหาและนำข้อมูลนั้นไปวิเคราะห์ต่อไป วิทยาการทางคอมพิวเตอร์จึงเริ่มเบนเข็มทิศเข้ามาทางงานวิจัยด้านชีววิทยามากขึ้น และด้วยเหตุนี้เองคำว่า bioinformatics ก็เริ่มกลายมาเป็นคำพูดที่แพร่หลาย จนปัจจุบัน bioinformatics ถูกบัญญัติไว้เป็นศัพท์คำหนึ่งในภาษาอังกฤษอย่างเป็นทางการ ส่วนในภาษาไทยผมคิดว่า น่าจะมีผู้บัญญัติไว้ว่า bioinformatics แปลได้เทียบเท่ากับคำว่า "ชีวสารสนเทศศาสตร์" ถึงแม้ว่าศาสตร์สาขานี้ไม่ใช่เรื่องใหม่อีกต่อไปแล้วในต่างประเทศ แต่ผมเชื่อว่ายังใหม่สำหรับคนไทย และตำรา bioinformatics ที่เขียนเป็นภาษาไทยก็มีน้อยเต็มที ดังนั้นนักเรียน นักศึกษา นักวิจัย รวมทั้งผู้สนใจทั่วไป จำเป็นต้องหาข้อมูลจากแหล่งความรู้และตำราต่างประเทศเป็นหลัก (และผมเชื่อว่าคงจะเป็นเช่นนี้ไปในอีกหลายปีข้างหน้า) จึงจำเป็นที่จะต้องสร้างความคุ้นเคยกับคำศัพท์ต่างๆ เหล่านี้ไว้ เพื่อเป็นประโยชน์ในการสืบค้นข้อมูลในอนาคต ผมจึงขอแปลคำศัพท์เป็นภาษาไทยเท่าที่จำเป็นเท่านั้น

Bioinformatics คืออะไร

ผมเชื่อว่าคนไทยจำนวนมาก รวมทั้งนักวิทยาศาสตร์ไทยอีกจำนวนไม่น้อย มองภาพ bioinformatics ยังไม่ชัดเท่าที่ควรนัก หลายคนคิดว่าถ้าเราเรียนคอมพิวเตอร์ครึ่งหนึ่งและเรียนชีววิทยาอีกครึ่งหนึ่ง แล้วเราจะเข้าใจ bioinformatics ได้ทันที สิ่งนี้ไม่มีความถูกต้องเลย ที่เป็นเช่นนั้นก็เพราะองค์ความรู้ทางด้านคอมพิวเตอร์ที่จะต้องนำมาใช้ทาง bioinformatics นั้นต่างออกไปจากเนื้อหาวิชาคอมพิวเตอร์ปกติที่มีการสอนในสถาบันต่างๆ หรือแม้แต่องค์ความรู้ทางชีววิทยาที่เกี่ยวข้องกับ bioinformatics เองก็แตกต่างจากเนื้อหาชีววิทยาทั่วไป ถึงตรงนี้หลายคนคงนึกสงสัยแล้วว่า วิชา bioinformatics นี่คืออะไรกันแน่ อันที่จริงแล้ว ปัจจุบันนี้ ยังไม่มีสถาบันใดหรือท่านผู้ใดให้ความหมายของคำว่า bioinformatics อย่างเป็นที่ยอมรับโดยสากล แต่คำจำกัดความที่แต่ละคนเสนอไว้ มีใจความคล้ายคลึงกัน ผมขอเรียบเรียงความหมายของ bioinformatics จากคำจำกัดความที่ผู้รู้ทั้งหลายได้กำหนดไว้ เพื่อให้ง่ายต่อการเข้าใจเสียใหม่นะครับ

bioinformatics เป็นวิชาใหม่ที่มีลักษณะเป็นสหสาขาวิชา (multidiscriplinary subject) ซึ่งถือกำเนิดขึ้นมาจากศาสตร์เก่าแก่ 2 สาขา นั่นคือ คณิตศาสตร์ (ผมรวมไปถึงสถิติและเทคโนโลยีทางด้านคอมพิวเตอร์และสารสนเทศ ซึ่งเป็นผลพวงมาจากความก้าวหน้าทางคณิตศาสตร์) และชีววิทยา โดยเฉพาะอย่างยิ่งอณูชีววิทยา (molecular biology) ที่ผลิตข้อมูลจำพวกลำดับดีเอ็นเอ และโปรตีนออกมามากมาย ทำให้ bioinformatics น่าจะหมายถึงการประยุกต์ใช้ความรู้ทางคอมพิวเตอร์มาใช้ในการจัดเก็บ สืบค้น กลั่นกรอง และวิเคราะห์ข้อมูลชนิดต่างๆ ทางชีววิทยา ซึ่งส่วนมากมักจะเป็นลำดับดีเอ็นเอ ลำดับโปรตีน หรือข้อมูลทางชีววิทยาที่เกิดจากเทคโนโลยี high throughput เช่น microarray data ให้เกิดเป็น information

จากความหมายที่ผมให้ไว้นี้ มันจำเพาะกว่าการนำคอมพิวเตอร์มาใช้ในงานชีววิทยา นักวิจัยหลายคนใช้คอมพิวเตอร์ในการจัดทำรายงานความก้าวหน้าของโครงการมีการเก็บภาพถ่ายจากกล้องจุลทรรศน์ไว้ในคอมพิวเตอร์ แบบนี้ไม่ถือว่าเป็น bioinformatics เพราะการเก็บข้อมูลเหล่านี้ ไม่ได้อยู่ในรูปแบบเป็นฐานข้อมูลที่ถูกต้องและสืบค้นได้ง่าย แม้แต่เครื่องมือวิทยาศาสตร์สมัยใหม่ที่มีราคาแพงเป็นหลักแสน หลักล้านบาท ก็มักจะมีการควบคุมการทำงานด้วยระบบคอมพิวเตอร์ และมีโปรแกรมสำหรับควบคุมการทำงานติดตั้งมาด้วย เช่น real-time PCR, DNA sequencer, HPLC เป็นต้น ก็ไม่นับเป็น bioinformatics เพราะนั่นเป็นเพียงแค่ interface ของเครื่องจักรที่ควบคุมให้ทำงานด้วยโปรแกรมคอมพิวเตอร์เท่านั้น ไม่มีการจัดเก็บข้อมูลและวิเคราะห์ข้อมูลใดๆ เกิดขึ้นเลย

ถ้าท่านผู้อ่านลองนึกภาพย้อนกลับไปเมื่อสัก 20 ปีก่อน ในช่วงเวลาที่ยังไม่มีผู้เชี่ยวชาญด้าน bioinformatics เลย แต่กระแสงานวิจัยทางด้าน bioinformatics จัดเป็นงานวิจัยระดับแนวหน้า (frontier researches) ในสมัยนั้น นักชีววิทยาจำนวนหนึ่งเริ่มขยับตัวเองเข้าสู่งานวิจัยแนวใหม่ ซึ่งพวกเขาก็ยังคงเป็นนักชีววิทยามากกว่านักวิจัยทาง bioinformatics ส่วนคนอีกกลุ่มหนึ่งที่สนใจงานด้านนี้ ก็เริ่มย้ายตัวเองออกจากความเป็นนักคอมพิวเตอร์เพื่อเข้ามาเป็นนัก bioinformatics แต่เขาพวกนั้นยังคงมีความเป็นนักคอมพิวเตอร์อยู่มาก เมื่อคน 2 กลุ่มเริ่มหันเข้ามาสู่ bioinformatics ด้วยพื้นฐานที่แตกต่างกัน ก็ทำให้ bioinformatics มีขอบเขตกว้าง และมีการบัญญัติศัพท์ใหม่ๆ ขึ้นมากมาย เพื่ออธิบายลักษณะงานวิจัยที่พวกเขาได้ทำอยู่

นักวิจัยที่มีพื้นฐานมาจากด้านคอมพิวเตอร์ จะมองชีววิทยาเป็นโจทย์แบบหนึ่ง และพยายามใช้เทคนิค แนวความคิด ทฤษฎีทางสถิติ คอมพิวเตอร์ คณิตศาสตร์ประยุกต์ เข้ามาแก้ปัญหาชีววิทยา นักวิจัยกลุ่มนี้จะเรียกศาสตร์สาขานี้ว่า computational biology (หรือบางคนเรียกว่า ชีววิทยาเชิงคำนวณ) ส่วนนักวิจัยกลุ่มที่มีพื้นฐานมาจากด้านชีววิทยา มักจะมองคอมพิวเตอร์เป็นเครื่องมือวิจัยอย่างหนึ่ง ที่จะถูกนำมาใช้ในการวิเคราะห์ข้อมูลทางชีววิทยา และสุดท้ายก็จะใช้ความรู้ทางชีววิทยาแปรผลนั้นอีกครั้งหนึ่ง คนกลุ่มนี้มักจะเรียกศาสตร์ที่ตัวเองศึกษาว่า bioinformatics

วันหนึ่งข้างหน้า นักวิจัยรุ่นใหม่ที่จะเกิดมาเป็น bioinformatician ก็ไม่ได้มาจากฝั่งชีววิทยาหรือคอมพิวเตอร์อีกต่อไป แต่นักวิจัยกลุ่มนี้จะถูกฝึกปรือขึ้นมาเป็น bioinformatician ด้วยองค์ความรู้ที่ถูกกลั่นกรองและตกผลึกมาจาก bioinformaticians รุ่นก่อนๆ ... เอาเป็นว่า ไม่ว่าจะเป็น computational biology หรือ bioinformatics เรากำลังหมายถึงศาสตร์ชนิดเดียวกัน ที่มีความหลากหลายในรูปแบบของโจทย์วิจัย และแนวทางแก้ปัญหา ผมจะขอใช้คำว่า bioinformatics แทนศาสตร์ทั้งหมดเหล่านี้ในส่วนต่อๆ ไปของเนื้อหานะครับ

Bioinformaticians เขาทำวิจัยอะไรกันบ้าง

งานวิจัยในยุกบุกเบิกของ bioinformatics น่าจะเป็นการจัดการข้อมูลทางชีววิทยา ซึ่งสมัยนั้นก็มีแต่ลำดับดีเอ็นเอ และลำดับโปรตีนเป็นหลัก มีการสร้างฐานข้อมูลต่างๆ มากมายเพื่อรองรับปริมาณข้อมูลที่นักชีววิทยาสร้างขึ้น นอกจากงานด้านการบริหารข้อมูลแล้วการวิเคราะห์ลำดับดีเอ็นเอ ลำดับอาร์เอ็นเอ และลำดับโปรตีน ก็เป็นงานวิจัยสำคัญในยุกนั้น มีการนำเสนอวิธีการเปรียบเทียบลำดับดีเอ็นเอด้วยวิธีการที่เรียกว่า alignment นอกจากนี้ยังมีการคาดเดาแบบแผน (pattern) ของดีเอ็นเอที่จำเพาะเจาะจงซึ่งซ่อนอยู่ใน sequence เช่น promoter หรือ motif ต่างๆ อีกด้วย งานวิจัยแบบนี้เราเรียกว่า sequence analysis ความสำคัญของ sequence analysis ได้ขยายตัวเพิ่มขึ้นตามปริมาณของลำดับดีเอ็นเอที่เพิ่มมากขึ้นทุกวัน ปัจจุบัน งานวิจัยประเภทนี้ไม่ใช่เรื่องใหม่อีกต่อไป แต่กลับกลายมาเป็นเรื่องจำเป็นที่นักชีววิทยาหลายสาขาต้องเรียนรู้เพื่อใช้ในการวิเคราะห์ข้อมูลเบื้องต้น

Bioinformaticians บางกลุ่มสนใจงานด้าน molecular phylogenetics ซึ่งเป็นการศึกษาความสัมพันธ์ทางวิวัฒนาการของสิ่งมีชีวิตโดยอาศัยข้อมูลจากการทดลองทางอณูชีววิทยา ไม่ว่าจะเป็น fingerprint patterns ลำดับดีเอ็นเอ หรือลำดับโปรตีน เพื่อมาอธิบายว่าสิ่งมีชีวิตที่พวกเขาศึกษานั้นมีความเกี่ยวข้องกันอย่างไร การหาคำตอบเหล่านี้ จำเป็นต้องใช้ความรู้ทางวิวัฒนาการและคณิตศาสตร์มาคำนวณหาอัตราการกลายพันธุ์ (mutation rate) และอัตราการวิวัฒนาการ (evolutionary rate) ของนิวคลีโอไทด์ในลำดับดีเอ็นเอ เพื่อสร้างเป็น evolutionary models แบบต่างๆ แล้วพวกเขาจึงใช้ model เหล่านั้น มาสร้างเป็นแผนภาพการวิวัฒนาการของสิ่งมีชีวิตที่เราเรียกกันว่า phylogenetic tree นั่นเอง

เราทราบกันดีว่าการศึกษาโครงสร้างของโปรตีนสักชนิดหนึ่ง เป็นงานที่ต้องอาศัยเวลานานและความชำนาญสูง แต่นักวิจัยจำนวนมากไม่อาจรอให้โครงสร้างของโปรตีนทั้งหมดถูกสร้างขึ้นจาก X-ray crystallography หรือ NMR ดังนั้น bioinformaticians บางกลุ่มจึงเริ่มศึกษาการทำนายโครงสร้างสามมิติของโปรตีน โดยอาศัยความรู้ทางเคมี และแน่นอนทีสุด การทำนายโครงสร้างของโปรตีนซึ่งเป็นสารชีวโมเลกุลขนาดใหญ ไม่ได้เกิดจากการคำนวณเพียงครั้งเดียวหรือสองครั้ง แต่นั่นเกิดจากการคำนวณนับครั้งไม่ถ้วนด้วยคอมพิวเตอร์ที่มีประสิทธิภาพสูง นักวิจัยกลุ่มนี้ พยายามค้นหาแนวทางต่างๆ มาใช้ในการทำนายโครงสร้างของโปรตีน อาร์เอ็นเอ หรือแม้แต่ดีเอ็นเอเองก็ตาม เราเรียกงานวิจัยแนวนี้ว่า structural bioinformatics

เมื่อโลกของชีววิทยาผ่านเข้าสู่ยุกจีโนม (genomic era) ไปจนกระทั่งยุกของโปรตีโอม (proteomic era) ความต้องการใช้โปรแกรมคอมพิวเตอร์เพื่อวิเคราะห์ผลการทดลองจากห้องปฏิบัติการมีมากขึ้น ประกอบกับความสามารถของเทคโนโลยีทางวิทยาศาสตร์ที่สามารถผลิตข้อมูลจำนวนมหาศาลได้ในเวลารวดเร็วหรือที่เราเรียกกันว่า high throughput technology ยิ่งทำให้ bioinformaticians พยายามค้นหาวิธีการใหม่ แนวคิดใหม่ เพื่อสร้างเป็นโปรแกรมคอมพิวเตอร์ออกมาสนองตอบความต้องการของนักชีววิทยา หนึ่งในบรรดา high throughput technology ที่มาแรงมากๆ ก็คือ microarray ซึ่งจัดได้ว่าเป็นการเปิดมิติใหม่ของการศึกษา proteomics และ transcriptomics เลยทีเดียว ทำให้การศึกษา bioinformaticians อีกกลุ่มหนึ่งที่มีความเชี่ยวชาญทางด้านสถิติวิเคราะห์ หันมาสนใจวิธีการวิเคราะห์ข้อมูล และในที่สุดก็เกิดเป็นสาขาหนึ่งของงานวิจัยทาง bioinformatics ที่เรียกว่า microarray analysis

อีกสาขาหนึ่งของ bioinformatics ที่กำลังมาแรงในปัจจุบัน คือ system biology นักวิจัยกลุ่มที่ทำงานด้านนี้ สนใจศึกษาการทำงานของสารชีวโมเลกุล (โดยส่วนมากก็มักจะเป็นโปรตีนหรือยีนต่างๆ) อย่างเป็นระบบ เราอาจเรียกว่า system biology เป็นการจำลองสรีรวิทยาในระดับเซลล์ (cellular physiology) เข้ามาไว้ในคอมพิวเตอร์นั่นเอง นักวิจัยกลุ่มนี้จะใช้ความรู้ทาง kinetics เข้ามาช่วยในการสร้าง model ของระบบที่เขาสนใจศึกษา เช่น การ model metabolic pathway ในการย่อยสลายไขมัน เป็นต้น

นอกจากนี้ ยังมีงานวิจัยรูปแบบอื่นๆ อีกมากมายที่เป็นงานวิจัยระดับแนวหน้าของ bioinformatics ที่เมืองไทยยังขาดแคลนแหล่งความรู้และนักวิจัยในสาขานั้นๆ อยู่ อาทิเช่น mathematical modelling, metabolomics, interactomics, functional genomics หรือแม้แต่ metagenomics และอีกมากมายหลายสาขาที่มีความเกี่ยวข้องกับ bioinformatics ซึ่งผมจะพยายามนำมาเสนอให้ท่านผู้อ่านได้ทำความรู้จักกันในครั้งต่อๆ ไปครับ

3 comments:

  1. อันที่จริงยังมีศัพท์อีกคำหนึงที่ใช้แทนคำว่า bioinformatics นั่นคือ biocomputing แต่ไม่ค่อยใช้กันแพร่หลายเท่ากับคำว่า bioinformatics ครับ

    ReplyDelete
  2. กระจ่างดีครับ

    ReplyDelete
  3. ขอบคุณมากค่ะ ได้ความรู้เยอะมาก กำลังอยากรู้เกี่ยวกับงานวิจัยด้านนี้พอดีเลยค่ะ

    ReplyDelete