เล่มที่ 32
ชีวสนเทศศาสตร์
สามารถแชร์ได้ผ่าน :
การศึกษาข้อมูลทางชีววิทยาโดยใช้ชีวสนเทศศาสตร์

การใช้วิธีการทางสารสนเทศในการศึกษาข้อมูลชีววิทยา หรือชีวสนเทศนั้น ต้องอาศัยองค์ประกอบหลักดังต่อไปนี้

๑. เครื่องมือทางชีวสนเทศศาสตร์

            ก. คอมพิวเตอร์

            การจัดการข้อมูลโดยอาศัยคอมพิวเตอร์นั้น หากข้อมูลมีจำนวนไม่มาก อาจใช้คอมพิวเตอร์ส่วนบุคคลได้ แต่เนื่องจากในปัจจุบันได้มีการเชื่อมโยงข้อมูล จากห้องปฏิบัติการต่างๆ ทั่วโลกเข้าไว้ด้วยกัน ทำให้ปริมาณข้อมูลมีจำนวนมากขึ้นกว่าเดิมหลายเท่า ดังนั้น จึงต้องใช้คอมพิวเตอร์ ที่มีประสิทธิภาพสูงมากในการจัดการ จัดเก็บ และวิเคราะห์ข้อมูล ที่มีจำนวนมหาศาลเหล่านี้ ในเวลาอันรวดเร็ว ตัวอย่างเช่น ซูเปอร์คอมพิวเตอร์ของบริษัท IBM ชื่อว่า บลูจีน นั้น มีความสามารถในการคำนวณสูงถึง ๑,๐๐๐ ล้านล้านหน่วยการทำงาน ต่อวินาที หรือ ๑ เพตะฟลอปส์ โดยมีประสิทธิภาพที่เร็วกว่าคอมพิวเตอร์ที่ใช้ทั่วไปถึงประมาณ ๒ ล้านเท่า และมีราคาสูงถึงกว่า ๑๐๐ ล้านดอลลาร์


ระบบปฏิบัติการเครือข่ายคอมพิวเตอร์ ซึ่งการเชื่อมคอมพิวเตอร์ส่วนบุคคลเข้าด้วยกัน เป็นเครือข่ายคอมพิวเตอร์ที่มีประสิทธิภาพในการคำนวณสูง

            ข. เครือข่ายคอมพิวเตอร์ (cluster computer)

            นอกจากการใช้ซูเปอร์คอมพิวเตอร์ที่มีความเร็วสูง และมีราคาสูงมาก ในการดำเนินการกับข้อมูลที่มหาศาลแล้ว นักวิทยาศาสตร์อาจใช้วิธีการเชื่อมคอมพิวเตอร์ส่วนบุคคลเข้าด้วยกัน เป็นเครือข่ายคอมพิวเตอร์ โดยมีระบบปฏิบัติการที่สามารถแจกงานให้แต่ละเครื่อง ทำงานได้อย่างมีระบบ ทำให้มีประสิทธิภาพสูงสุดในการประมวลผล ใกล้เคียงกับซูเปอร์คอมพิวเตอร์ แต่มีราคาถูกกว่า

            ค. อินเทอร์เน็ต

            อินเทอร์เน็ต คือ เครือข่ายคอมพิวเตอร์ขนาดใหญ่ที่มีการเชื่อมโยงไปเกือบทั่วโลก โดยไม่มีคอมพิวเตอร์ที่เป็นศูนย์กลาง ดังนั้น หากมีคอมพิวเตอร์ใด หรือสายที่เชื่อมต่อระหว่างคอมพิวเตอร์คู่ใดชำรุด อินเทอร์เน็ตก็ยังสามารถทำงานได้

            บริการทางอินเทอร์เน็ต ที่นิยมใช้กันอย่างแพร่หลายที่สุด คือ World Wide Web (WWW) ซึ่งเป็นระบบการจัดข้อมูลในรูปข้อความหลายมิติ (hypertext) เมื่อผู้ใช้บริการเลือกข้อความหรือคำใดๆ ในข้อมูลแล้ว โปรแกรมใน WWW จะค้นหาคำ หรือข้อความที่เกี่ยวข้องและอ่านข้อมูลนั้น ดังนั้น โปรแกรมที่ใช้ใน WWW จะต้องสามารถอ่านข้อมูลที่เลือกมาได้ ตัวอย่างโปรแกรม เช่น Internet Explorer ของบริษัท Microsoft และ Netscape Navigator ของบริษัท Netscape Communications

๒. วิธีการทางสนเทศศาสตร์ (informatics)

วิธีการทางสนเทศศาสตร์ในการจัดการข้อมูล ศึกษา และวิเคราะห์ข้อมูลทางชีววิทยา มีหลายวิธี ดังตัวอย่างต่อไปนี้

            ก. การสร้างและการสืบค้นในฐานข้อมูล (database)

            จากการที่ข้อมูลทางชีววิทยาเพิ่มขึ้นอย่างมากในปัจจุบัน ทำให้มีความจำเป็น ที่จะต้องมีการบริหาร และจัดการกับข้อมูลอย่างเป็นระบบ วิธีที่นิยมคือ วิธีจัดระเบียบข้อมูล ในรูปแบบฐานข้อมูล (database)

            ข้อมูลในฐานข้อมูลมักเป็นข้อมูลที่เป็นจริง ที่ผ่านกระบวนการจัดการ ดัดแปลง ให้มีความหมาย และส่วนใหญ่ใช้เพื่อสนองตอบผู้ใช้เฉพาะกลุ่ม การจัดทำฐานข้อมูล ทำให้สามารถเข้าถึงข้อมูลได้อย่างมีประสิทธิภาพ หลีกเลี่ยงการแปรเปลี่ยน และการซ้ำซ้อนของข้อมูล รวมทั้งเพื่อความปลอดภัยของข้อมูล

            ฐานข้อมูลชีวสนเทศศาสตร์ (bioinformatics database) เป็นฐานข้อมูลที่ประกอบด้วย ข้อมูลทางชีวภาพของชีวโมเลกุลต่างๆ เช่น
  • ข้อมูลลำดับนิวคลีโอไทด์ของดีเอ็นเอของฐานข้อมูล GenBank ของสหรัฐอเมริกา ฐานข้อมูล EMBL (European Molecular Biology Laboratory) ของสหภาพยุโรป และฐานข้อมูล DDBJ (DNA Data Bank of Japan) ของประเทศญี่ปุ่น
  • ข้อมูลที่เกี่ยวข้องกับโปรตีน เช่น ฐานข้อมูล PDB (Protein Data Bank) ซึ่งมีข้อมูลลำดับกรดแอมิโน หรือโครงสร้างของโปรตีน
            ผู้ใช้สามารถสืบค้นข้อมูลจากฐานข้อมูลเหล่านี้ได้ทางอินเทอร์เน็ต ด้วยการส่งไปรษณีย์อิเล็กทรอนิกส์ (หรือส่งอีเมล) ติดต่อโดยตรง กับฐานข้อมูล หรือติดต่อกับบริการค้นหาข้อมูลที่มีอยู่บนเครือข่ายอินเทอร์เน็ต

            ข. การเปรียบเทียบข้อมูล

            เป็นการสร้าง หรือการใช้โปรแกรมคอมพิวเตอร์ ในการเปรียบเทียบข้อมูลจากชีวโมเลกุล ชนิดต่างๆ เพื่อตรวจสอบความเหมือน หรือความแตกต่างของข้อมูลจาก ๒ แหล่ง หรือมากกว่า เช่น โปรแกรมการเปรียบเทียบข้อมูลลำดับนิวคลีโอไทด์ หรือลำดับกรดแอมิโน

            ประโยชน์ในการเปรียบเทียบข้อมูล ตัวอย่างเช่น การเปรียบเทียบข้อมูลของสารชีวโมเลกุล ที่ไม่ทราบสมบัติมาก่อนกับข้อมูลของสารชีวโมเลกุล ที่เราทราบสมบัติทางชีวภาพอยู่แล้ว หากพบว่าเหมือนหรือคล้ายกัน จะทำให้สามารถคาดเดาได้ว่า ชีวโมเลกุลทั้งสองชนิดนั้น มีแนวโน้มที่จะมีสมบัติ เช่น หน้าที่การทำงานเช่นเดียวกัน หรือมีวิวัฒนาการการเปลี่ยนแปลงที่ใกล้เคียงกัน


ตัวอย่างฐานข้อมูลโครงสร้างของโปรตีน เช่น PDB, UniProt, swissprot

            ค. การหารูปแบบของข้อมูล

            การหารูปแบบ หรือกลุ่มของข้อมูลจากข้อมูลจำนวนมากเป็นอีกวิธีหนึ่ง ที่จะช่วยในการหาความหมายของข้อมูล ได้อย่างมีประสิทธิภาพยิ่งขึ้น เช่น การใช้เทคโนโลยีเหมืองข้อมูล (data mining) ซึ่งเป็นวิธีการทางชีวสนเทศศาสตร์ ที่ใช้ในการค้นหาความหมายของข้อมูล ที่มีอยู่มากมายในฐานข้อมูลต่างๆ โดยใช้คอมพิวเตอร์ในการวิเคราะห์ จัดหมวดหมู่ ด้วยหลักการทางคณิตศาสตร์และสถิติ แทนการตัดสินใจโดยมนุษย์ ซึ่งอาจมีการลำเอียงได้ ข้อมูลที่มีอยู่จะนำไปจัดรูปแบบ หรือจัดหมวดหมู่ของข้อมูลในรูปแบบที่เข้าใจได้ง่าย ทำให้สามารถเข้าใจความหมายของข้อมูลได้ดียิ่งขึ้น หรือเพื่อให้สามารถคาดเดา หรือทำนายแนวโน้มที่จะเกิดขึ้น เพื่อช่วยในการตัดสินใจ

            ง. การวิเคราะห์ข้อมูลโดยใช้โปรแกรมและเครือข่ายอินเทอร์เน็ต

            แต่เดิมการใช้โปรแกรมคอมพิวเตอร์ ในการวิเคราะห์ข้อมูลด้วยวิธีการชีวสนเทศนั้น ทำโดยการ (download) โปรแกรม จากโดเมนสาธารณะ public domain ไปใช้กับคอมพิวเตอร์ส่วนบุคคล แต่เนื่องจากในปัจจุบัน มีข้อมูลทางชีววิทยาเพิ่มขึ้นอย่างมากมาย เกินกำลังการคำนวณของคอมพิวเตอร์ส่วนบุคคล จึงได้มีการพัฒนาโปรแกรมคอมพิวเตอร์เก็บไว้ในโดเมนสาธารณะ ซึ่งเป็นระบบคอมพิวเตอร์ที่มีขนาดใหญ่ และอนุญาตให้ผู้สนใจ เลือกใช้โปรแกรมได้ โดยติดต่อกับโดเมนสาธารณะทางอินเทอร์เน็ต โดยไม่เสียค่าใช้จ่าย ยกเว้นบางโปรแกรม ที่อาจต้องเสียค่าลิขสิทธิ์ ตัวอย่างโปรแกรมที่ใช้วิเคราะห์ข้อมูลโดยผ่านอินเทอร์เน็ต เช่น
  • โปรแกรมใช้หาคู่สมของดีเอ็นเอ
  • โปรแกรมการแปลงสายดีเอ็นเอ เป็นสายโปรตีน หรือแปลงสายโปรตีนเป็นดีเอ็นเอ
  • โปรแกรมใช้เปรียบเทียบความเหมือน (identity) หรือความคล้ายคลึง (similarity) ระหว่างสายดีเอ็นเอหรือโปรตีน
  • โปรแกรมการหาส่วนดีเอ็นเอที่เป็นยีน
  • โปรแกรมการหาโครงสร้างของโปรตีน
            นอกจากวิธีการดังที่กล่าวมาแล้วข้างต้น ยังมีวิธีการอื่นๆที่ใช้ในชีวสนเทศอีกหลายวิธีการ ซึ่งไม่อาจกล่าวถึงได้ทั้งหมดในบทความนี้

๓. นักชีวสนเทศ

            นักชีวสนเทศมี ๒ ประเภท ได้แก่ นักชีวสนเทศที่เป็นผู้สร้าง (creator) หรือออกแบบเครื่องมือ หรือโปรแกรม ที่นักวิทยาศาสตร์ใช้ในการถอดรหัสหรือความหมาย ของข้อมูลทางวิทยาศาสตร์ โดยการพัฒนาขั้นตอนวิธี (algorithm) หรือคำสั่ง ให้คอมพิวเตอร์ทำงานได้สำเร็จตามวัตถุประสงค์ นอกจากนี้ นักชีวสนเทศยังอาจเป็นผู้สร้าง และออกแบบฐานข้อมูล หรืออาจออกแบบเครื่องมือ สำหรับนำไปใช้ในด้านเทคโนโลยีเหมืองข้อมูล ซึ่งต้องสามารถวิเคราะห์ และจัดรูปแบบของข้อมูล ที่อยู่ในรูปที่เข้าใจได้ง่ายด้วย ซึ่งงานในลักษณะนี้ ผู้ที่มีพื้นฐานทางคอมพิวเตอร์ และเทคโนโลยีสารสนเทศ (information technology) จะทำได้ดี อย่างไรก็ตาม บุคคลดังกล่าวนี้ จะต้องมีพื้นฐาน และเข้าใจหลักการทางชีววิทยาด้วย

            นักชีวสนเทศอีกแบบหนึ่ง คือ ผู้ใช้เทคโนโลยีชีวสนเทศ ซึ่งบุคคลกลุ่มนี้คือ นักวิทยาศาสตร์ทั่วไป ที่ใช้เครื่องมือที่ได้รับการพัฒนาแล้ว ในการวิเคราะห์ข้อมูลในงานวิจัย ส่วนใหญ่เป็นผู้ที่มีความชำนาญสูงทางด้านชีววิทยา และใช้เทคโนโลยี จากโปรแกรมสำเร็จรูป ที่มีจำหน่าย หรือการใช้เครือข่ายอินเทอร์เน็ตในการใช้เครื่องมือ ที่มีตามโดเมนสาธารณะต่างๆ