รหัสตัวอักษรไทยที่ใช้ในระบบคอมพิวเตอร์ ความสำคัญของรหัสที่จะใช้ในระบบคอมพิวเตอร์นั้น มิได้ใช้สำหรับแทนตัวข้อมูลที่จะให้คอมพิวเตอร์ประมวลผล แต่เพียงอย่างเดียวเท่านั้น แต่ยังใช้แทนคำสั่ง ที่จะสั่งให้คอมพิวเตอร์ทำงาน หรือควบคุมระบบการทำงานต่างๆ รวมทั้ง ใช้ในการประมวลผลข้อมูลให้เกิดขึ้นตามความต้องการ คอมพิวเตอร์เป็นเทคโนโลยี ที่ได้รับการพัฒนามาจากประเทศทางตะวันตก ซึ่งใช้อักษรละติน ดังนั้น จึงมีผู้กำหนดรูปแบบของตัวอักษรละตินเป็นรหัสที่จะให้คอมพิวเตอร์รับรู้ได้ รหัสที่กำหนดนี้จะต้องเหมาะสมกับการทำงานของ คอมพิวเตอร์ที่ใช้หลักการของเลขฐานสอง ดังนั้น จึง กำหนดรหัสแทนตัวอักษรละตินเหล่านั้นเป็นรหัสเลขฐานสอง ซึ่งมีหลักตัวเลขที่เล็กที่สุด คือ บิต เมื่อนำตัวเลขฐานสอง หลายหลักหรือหลายบิตมาประกอบกันเป็นกลุ่มตั้งแต่ ๖, ๗ หรือ ๘ บิต เรียกว่า ไบต์ รหัสแทนอักษรภาษาละตินที่นิยมใช้กันจริงๆ จนเป็นมาตรฐานใช้กันทั่วโลกมีเพียง ๒ รหัส คือ รหัสแอสกี (ASCII; American standard code for information interchange) และรหัสเอ็บซีดิก (EBCDIC; extended binary- code-decimal interchange code) |
รหัสแอสกีเป็นรหัสที่องค์การระหว่างประเทศว่าด้วย การมาตรฐาน (International Standard Organization; ISO) กำหนดขึ้น และใช้กันในระบบคอมพิวเตอร์ทั่วไป โดยใช้อีกชื่อว่า รหัสไอเอสโอ ๖๔๖-๑๙๘๓ (ISO 646- 1983) รหัสแอสกีหรือรหัสไอเอสโอ ที่มีเพียง ๗ บิต ใน แต่ละประเทศจะใช้แตกต่างกันเล็กน้อย โดยเฉพาะในเรื่อง เครื่องหมายพิเศษบางตัว เช่น อักษรแทนเงินตรา รหัสที่ ไอเอสโอกำหนดนี้มีเพียง ๗ บิต จึงแทนรหัสของตัวอักษร ได้ ๒๗ หรือ = ๑๒๘ ตัว โดยกำหนดให้รหัส ๓๒ ตัวแรก คือ ๐๐๐๐๐๐๐ ถึง ๐๐๑๑๑๑๑ เป็นรหัสควบคุม เช่น ส่ง เสียงปิ๊บ ปัดแคร่ (CR; carriage return) ขึ้นบรรทัดใหม่ (LF; line feed) จบเอกสาร (EOT; end of text) เป็นต้น ส่วนรหัสเอ็บซีดิก เป็นรหัสที่มีประวัติความเป็นมาค่อนข้างยาวนาน และมีรากฐานมาจากการใช้บัตรเจาะรูแบบฮอลเลอริท โดยมีช่องเจาะอยู่ ๑๒ แถว จัดเป็นแถว ๐ ถึง ๙, ๑๑ และ ๑๒ รหัสบนบัตรเจาะรูส่วนที่เป็นแถว ๐ ถึง ๙ จะแปลเป็นเลขฐานสองโดยตรง ซึ่งเรียกรหัสนี้ว่า บีซีดี (BCD; binary code decimal) ส่วนแถวที่ ๑๑ และ ๑๒ จะได้รับการแปลเป็นเลขฐานสองควบคู่กันไปด้วยแถวละ ๑ หลัก ผลที่ได้คือ จะได้รหัสที่ประกอบด้วยตัวเลขฐานสอง ๖ บิต หลังจากนั้นก็ได้มีการปรับปรุงขึ้น จนในที่สุดรหัสเอ็บซีดิกได้รับการขยายให้ครบ ๘ บิต โดยให้มีตัวอักษรตัวเล็กและตัวใหญ่ อยู่รวมกัน เพื่อให้การแสดงรหัสของคอมพิวเตอร์เป็นที่เข้าใจได้ ง่าย การแสดงด้วยการแทนรหัสกับตัวอักษรโดยตรง จึงไม่เป็นที่นิยมกันนัก เพราะอ่านลำบาก เปลืองเนื้อที่ และ จดจำได้ยาก การแสดงรหัสจึงแสดงในรูปของตาราง ซึ่งถ้า เป็นรหัส ๘ บิต จะแสดงในรูปตารางขนาด ๑๖ x ๑๖ และ ถ้าเป็นรหัส ๗ บิต จะแสดงในรูปตารางขนาด ๑๖ x ๘ โดย หมายเลขบรรทัด ๐-๑๕ ใช้แทนรหัสเลขท้าย ๔ บิต (เลข ๔ บิต ได้แก่ ๐๐๐๐ ถึง ๑๑๑๑ มี ๑๖ จำนวน เลขบรรทัดจะ ใช้เลขฐาน ๑๖ เป็นตัวบอกคือ ๐, ๑, ๒, ๓, ๔, ๕, ๖, ๗, ๘, ๙, A, B, C, D, E และ F) ส่วนหมายเลขสดมภ์ ๐-๗ หรือ ๐-๑๕ ใช้แทนรหัสเลขต้น ๓ บิต หรือ ๔ บิต (เอ็บซีดิก) กำกับด้วยเลขฐาน ๑๖ เช่นกัน |
รหัสเอบซีดิก แสดงในรูปตารางขนาด ๑๖ x ๑๖ |
เนื่องจากรหัสแอสกีมีเพียง ๗ บิต (แทนตัวอักษรได้ ๑๒๘ ตัว) เมื่อนำมาใช้แสดงตัวอักษรไทยและอังกฤษ จึงมี ความจำเป็นที่จะต้องขยายเพิ่มอีก ๑ บิต เพื่อให้ได้เป็น ตารางขนาด ๑๖ x ๑๖ และแสดงความหมาย โดยถ้าใน บิตแรกเป็น ๐ ก็จะคงรหัสแอสกีเดิม และถ้าเป็น ๑ ก็แสดง เป็นรหัสไทย แต่สำหรับรหัสเอ็บซีดิกมีรูปแบบอักษรได้ ๒๕๖ ตัว จึงสามารถใส่อักษรไทยลงในช่องว่างได้พอ |
ตารางแสดงรหัสภาษาไทยบนตารางรหัสเอ็บซีดิก |
สำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรมกระทรวงอุตสาหกรรม ได้ดำเนินการกำหนดรหัสมาตรฐานภาษาไทย เพื่อใช้กับงานคอมพิวเตอร์ โดยมีขอบข่ายของการใช้รหัสดังนี้ ๑. มาตรฐานนี้ กำหนดรหัสภาษาไทย เพื่อใช้กับคอมพิวเตอร์ และแลกเปลี่ยนข้อมูล ๒. มาตรฐานนี้ ครอบคลุมรหัสภาษาไทย ซึ่งแบ่งออกเป็นสองกลุ่ม คือ กลุ่มไอเอสโอ ๖๔๖-๑๙๘๓ และกลุ่มเอ็บซีดิก ๓. มาตรฐานนี้ กำหนดเฉพาะตัวอักษรภาษาไทย โดยยึดหลักการไม่เปลี่ยนแปลงรหัส ที่องค์การระหว่างประเทศ ว่าด้วยการมาตรฐาน ได้กำหนดไว้แล้ว ตามไอเอสโอ ๖๔๖-๑๙๘๓ และเอ็บซีดิก การกำหนดรหัสในตารางเพิ่มต่อไอเอสโอ ๖๔๖-๑๙๘๓ จะดูจากตารางที่มีขนาด ๑๖ x ๑๖ ได้ โดยตำแหน่งของอักษรภาษาไทยเริ่มจากตำแหน่ง A1 (สดมภ์ A แถว ๑) |
ตารางแสดงรหัสภาษาไทยบนตารางรหัสแอสกี |
การพัฒนาคอมพิวเตอร์ให้สามารถทำงาน และรับส่งข้อมูลตัวอักษรไทยได้นั้น จำเป็นต้องมีการกำหนดรหัสที่ใช้แทนอักษรไทย ซึ่งได้แก่ ตัวอักษรไทย ตัวเลขไทย และเครื่องหมายพิเศษที่ใช้สื่อความหมายภาษาไทย จำแนกเป็นกลุ่มได้ดังนี้ ตัวอักษรไทย ได้แก่
|