เล่มที่ 11
การพัฒนาอักษรไทยในเครื่องคอมพิวเตอร์
สามารถแชร์ได้ผ่าน :
รหัสตัวอักษรไทยที่ใช้ในระบบคอมพิวเตอร์

            ความสำคัญของรหัสที่จะใช้ในระบบคอมพิวเตอร์นั้น มิได้ใช้สำหรับแทนตัวข้อมูลที่จะให้คอมพิวเตอร์ประมวลผล แต่เพียงอย่างเดียวเท่านั้น แต่ยังใช้แทนคำสั่ง ที่จะสั่งให้คอมพิวเตอร์ทำงาน หรือควบคุมระบบการทำงานต่างๆ รวมทั้ง ใช้ในการประมวลผลข้อมูลให้เกิดขึ้นตามความต้องการ

            คอมพิวเตอร์เป็นเทคโนโลยี ที่ได้รับการพัฒนามาจากประเทศทางตะวันตก ซึ่งใช้อักษรละติน ดังนั้น จึงมีผู้กำหนดรูปแบบของตัวอักษรละตินเป็นรหัสที่จะให้คอมพิวเตอร์รับรู้ได้ รหัสที่กำหนดนี้จะต้องเหมาะสมกับการทำงานของ คอมพิวเตอร์ที่ใช้หลักการของเลขฐานสอง ดังนั้น จึง กำหนดรหัสแทนตัวอักษรละตินเหล่านั้นเป็นรหัสเลขฐานสอง ซึ่งมีหลักตัวเลขที่เล็กที่สุด คือ บิต เมื่อนำตัวเลขฐานสอง หลายหลักหรือหลายบิตมาประกอบกันเป็นกลุ่มตั้งแต่ ๖, ๗ หรือ ๘ บิต เรียกว่า ไบต์

            รหัสแทนอักษรภาษาละตินที่นิยมใช้กันจริงๆ จนเป็นมาตรฐานใช้กันทั่วโลกมีเพียง ๒ รหัส คือ รหัสแอสกี (ASCII; American standard code for information interchange) และรหัสเอ็บซีดิก (EBCDIC; extended binary- code-decimal interchange code)
ตารางแสดงรหัสภาษาไทยบนตารางรหัสเอ็บซีดิก
            รหัสแอสกีเป็นรหัสที่องค์การระหว่างประเทศว่าด้วย การมาตรฐาน (International Standard Organization; ISO) กำหนดขึ้น และใช้กันในระบบคอมพิวเตอร์ทั่วไป โดยใช้อีกชื่อว่า รหัสไอเอสโอ ๖๔๖-๑๙๘๓ (ISO 646- 1983) รหัสแอสกีหรือรหัสไอเอสโอ ที่มีเพียง ๗ บิต ใน แต่ละประเทศจะใช้แตกต่างกันเล็กน้อย โดยเฉพาะในเรื่อง เครื่องหมายพิเศษบางตัว เช่น อักษรแทนเงินตรา รหัสที่ ไอเอสโอกำหนดนี้มีเพียง ๗ บิต จึงแทนรหัสของตัวอักษร ได้ ๒ หรือ = ๑๒๘ ตัว โดยกำหนดให้รหัส ๓๒ ตัวแรก คือ ๐๐๐๐๐๐๐ ถึง ๐๐๑๑๑๑๑ เป็นรหัสควบคุม เช่น ส่ง เสียงปิ๊บ ปัดแคร่ (CR; carriage return) ขึ้นบรรทัดใหม่ (LF; line feed) จบเอกสาร (EOT; end of text) เป็นต้น

            ส่วนรหัสเอ็บซีดิก เป็นรหัสที่มีประวัติความเป็นมาค่อนข้างยาวนาน และมีรากฐานมาจากการใช้บัตรเจาะรูแบบฮอลเลอริท โดยมีช่องเจาะอยู่ ๑๒ แถว จัดเป็นแถว ๐ ถึง ๙, ๑๑ และ ๑๒ รหัสบนบัตรเจาะรูส่วนที่เป็นแถว ๐ ถึง ๙ จะแปลเป็นเลขฐานสองโดยตรง ซึ่งเรียกรหัสนี้ว่า บีซีดี (BCD; binary code decimal) ส่วนแถวที่ ๑๑ และ ๑๒ จะได้รับการแปลเป็นเลขฐานสองควบคู่กันไปด้วยแถวละ ๑ หลัก ผลที่ได้คือ จะได้รหัสที่ประกอบด้วยตัวเลขฐานสอง ๖ บิต หลังจากนั้นก็ได้มีการปรับปรุงขึ้น จนในที่สุดรหัสเอ็บซีดิกได้รับการขยายให้ครบ ๘ บิต โดยให้มีตัวอักษรตัวเล็กและตัวใหญ่ อยู่รวมกัน

            เพื่อให้การแสดงรหัสของคอมพิวเตอร์เป็นที่เข้าใจได้ ง่าย การแสดงด้วยการแทนรหัสกับตัวอักษรโดยตรง จึงไม่เป็นที่นิยมกันนัก เพราะอ่านลำบาก เปลืองเนื้อที่ และ จดจำได้ยาก การแสดงรหัสจึงแสดงในรูปของตาราง ซึ่งถ้า เป็นรหัส ๘ บิต จะแสดงในรูปตารางขนาด ๑๖ x ๑๖ และ ถ้าเป็นรหัส ๗ บิต จะแสดงในรูปตารางขนาด ๑๖ x ๘ โดย หมายเลขบรรทัด ๐-๑๕ ใช้แทนรหัสเลขท้าย ๔ บิต (เลข ๔ บิต ได้แก่ ๐๐๐๐ ถึง ๑๑๑๑ มี ๑๖ จำนวน เลขบรรทัดจะ ใช้เลขฐาน ๑๖ เป็นตัวบอกคือ ๐, ๑, ๒, ๓, ๔, ๕, ๖, ๗, ๘, ๙, A, B, C, D, E และ F) ส่วนหมายเลขสดมภ์ ๐-๗ หรือ ๐-๑๕ ใช้แทนรหัสเลขต้น ๓ บิต หรือ ๔ บิต (เอ็บซีดิก) กำกับด้วยเลขฐาน ๑๖ เช่นกัน
รหัสเอบซีดิก แสดงในรูปตารางขนาด ๑๖ x ๑๖
รหัสเอบซีดิก แสดงในรูปตารางขนาด ๑๖ x ๑๖
            เนื่องจากรหัสแอสกีมีเพียง ๗ บิต (แทนตัวอักษรได้ ๑๒๘ ตัว) เมื่อนำมาใช้แสดงตัวอักษรไทยและอังกฤษ จึงมี ความจำเป็นที่จะต้องขยายเพิ่มอีก ๑ บิต เพื่อให้ได้เป็น ตารางขนาด ๑๖ x ๑๖ และแสดงความหมาย โดยถ้าใน บิตแรกเป็น ๐ ก็จะคงรหัสแอสกีเดิม และถ้าเป็น ๑ ก็แสดง เป็นรหัสไทย แต่สำหรับรหัสเอ็บซีดิกมีรูปแบบอักษรได้ ๒๕๖ ตัว จึงสามารถใส่อักษรไทยลงในช่องว่างได้พอ
ตารางแสดงรหัสภาษาไทยบนตารางรหัสเอ็บซีดิก
ตารางแสดงรหัสภาษาไทยบนตารางรหัสเอ็บซีดิก
            สำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรมกระทรวงอุตสาหกรรม ได้ดำเนินการกำหนดรหัสมาตรฐานภาษาไทย เพื่อใช้กับงานคอมพิวเตอร์ โดยมีขอบข่ายของการใช้รหัสดังนี้

            ๑. มาตรฐานนี้ กำหนดรหัสภาษาไทย เพื่อใช้กับคอมพิวเตอร์ และแลกเปลี่ยนข้อมูล
            ๒. มาตรฐานนี้ ครอบคลุมรหัสภาษาไทย ซึ่งแบ่งออกเป็นสองกลุ่ม คือ กลุ่มไอเอสโอ ๖๔๖-๑๙๘๓ และกลุ่มเอ็บซีดิก
            ๓. มาตรฐานนี้ กำหนดเฉพาะตัวอักษรภาษาไทย โดยยึดหลักการไม่เปลี่ยนแปลงรหัส ที่องค์การระหว่างประเทศ ว่าด้วยการมาตรฐาน ได้กำหนดไว้แล้ว ตามไอเอสโอ ๖๔๖-๑๙๘๓ และเอ็บซีดิก

            การกำหนดรหัสในตารางเพิ่มต่อไอเอสโอ ๖๔๖-๑๙๘๓ จะดูจากตารางที่มีขนาด ๑๖ x ๑๖ ได้ โดยตำแหน่งของอักษรภาษาไทยเริ่มจากตำแหน่ง A1 (สดมภ์ A แถว ๑)
ตารางแสดงรหัสภาษาไทยบนตารางรหัสแอสกี
ตารางแสดงรหัสภาษาไทยบนตารางรหัสแอสกี
            การพัฒนาคอมพิวเตอร์ให้สามารถทำงาน และรับส่งข้อมูลตัวอักษรไทยได้นั้น จำเป็นต้องมีการกำหนดรหัสที่ใช้แทนอักษรไทย ซึ่งได้แก่ ตัวอักษรไทย ตัวเลขไทย และเครื่องหมายพิเศษที่ใช้สื่อความหมายภาษาไทย จำแนกเป็นกลุ่มได้ดังนี้

ตัวอักษรไทย ได้แก่
  • พยัญชนะ ได้แก่ ก ข ฃ ค ค ฆ ง จ ฉ ช ซ .....ร ฤ ล (. ..) ว ศ ษ ส ห ฬ อ ฮ
  • สระ ได้แก่ ะ  า  ํา  ุ  ู เ แ โ ใ ไ ํ(นิคหิต) . (พิณทุ)
  • วรรณยุกต์ ได้แก่ ์ (ทัณฑฆาต)
  • ตัวเลขไทย ได้แก่ ๐ ๑ ๒ ๓ ๔ ๕ ๖ ๗ ๘ ๙
  • เครื่องหมายพิเศษ ได้แก่  ๅ ๆ ฯ
  • เครื่องหมายพิเศษทั่วไปได้แก่ ฿ (เครื่องหมายเงินบาท)  e (ยามักการ)  ๏ ฟองมัน  ๛ (โคมูตร) และ ๚ (อังคั่นคู่) เป็นต้น
            รหัสภาษาไทยในตารางเอ็บซีดิกนี้ ใช้วิธีการกำหนด ให้ไม่ซ้ำกับอักษรตัวใดตัวหนึ่งที่มีอยู่แล้วในตารางเอ็บซีดิก โดยเริ่มต้นตั้งแต่ตำแหน่ง ๔๑