ในยุคสารสนเทศ (Information age) นี้ ข้อมูลข่าวสารเป็นสิ่งจำเป็น ที่เราสามารถค้นหา หรือเผยแพร่ได้โดยง่าย ด้วยเทคโนโลยีที่ไร้พรมแดนคือ อินเทอร์เน็ต (Internet) จึงทำให้มนุษย์สามารถติดต่อกันได้ทั่วโลก ไม่ว่าจะอยู่ที่ใด เมื่อเชื่อมต่อเครื่องคอมพิวเตอร์เข้ากับเครือข่ายอินเทอร์เน็ตได้ เราก็สามารถพูดคุย หรือส่งจดหมายอิเล็กทรอนิกส์ ให้แก่บุคคลอื่นได้ด้วยตัวเอง โดยไม่ต้องมีหน่วยงาน เช่น ที่ทำการไปรษณีย์โทรเลข ทำหน้าที่รับส่ง และไม่ต้องอาศัยบุรุษไปรษณีย์ ในการนำส่งจดหมายอีกต่อไป
เมื่อเทคโนโลยีคอมพิวเตอร์เข้ามามีบทบาทสำคัญในการติดต่อสื่อสาร การพิมพ์เอกสาร การค้นหาข้อมูลข่าวสาร การเผยแพร่ข่าวสาร ฯลฯ ดังนั้น คนไทยจึงมุ่งหวัง ที่จะให้คอมพิวเตอร์สามารถทำงานรองรับการใช้งานภาษาไทย โดยรับข้อมูลเข้า และแสดงผลเป็นภาษาไทยได้ รวมทั้งเข้าใจ และโต้ตอบด้วยภาษาไทยได้ ซึ่งจะเป็นประโยชน์ต่อคนไทยอย่างอเนกอนันต์ ทั้งในด้านวิชาการ ธุรกิจ และบันเทิง ด้วยความจำเป็นดังกล่าว นักวิชาการ และนักวิจัยในประเทศไทยจึงต้องทำวิจัย และพัฒนาเทคโนโลยี เพื่อให้มีความเจริญทัดเทียมเทคโนโลยีต่างประเทศ ที่ก้าวหน้าไปอย่างมาก
การประมวลผลภาษาไทยบนคอมพิวเตอร์
เทคโนโลยีที่เรานำมาใช้ในการประมวลผล และการประยุกต์ใช้ภาษาไทยบนคอมพิวเตอร์ ประกอบไปด้วย วิทยาการทางด้านวิศวกรรมคอมพิวเตอร์ (Computer Engineering) ผสมผสานกับเทคโนโลยีทางด้านการประมวลผลภาษาธรรมชาติ (Natural Language Processing) ซึ่งได้แก่ การประมวลผลอักขระ (Character processing) การประมวลผลคำ (Word processing) การประมวลผลข้อความ (Text processing) การประมวลผลภาพ (Image processing) รวมทั้งความรู้ทางภาษาศาสตร์ (Linguistics)
ผู้เชี่ยวชาญและนักวิจัยทั้งจากภาครัฐ และภาคเอกชนมีความสนใจงานวิจัย และพัฒนาโปรแกรมการประมวลผลภาษาไทย บนคอมพิวเตอร์อย่างกว้างขวาง เพื่อให้ผู้ใช้คนไทยสามารถใช้งานคอมพิวเตอร์ด้วยภาษาไทยได้อย่างมีประสิทธิภาพ ในที่นี้จะอธิบายโปรแกรมการประมวลผลบางโปรแกรม เพื่อเป็นความรู้พื้นฐานให้เข้าใจ เรื่องการประยุกต์ใช้ภาษาไทยบนคอมพิวเตอร์ ดังต่อไปนี้
ตัวอย่างโปรแกรมพจนานุกรมที่เรียงลำดับคำไทยตามตัวอักษร
๑. โปรแกรมการเรียงลำดับคำไทย (Thai Sorting)
การเรียงลำดับคำในพจนานุกรม การเรียงลำดับชื่อบุคคลในสมุดรายนามผู้ใช้โทรศัพท์ หรือการเรียงลำดับคำ ให้สามารถค้นหาได้โดยง่าย จำเป็นต้องมีการเรียงตามลำดับตัวอักษร และตามมาตรฐานการเรียงลำดับคำไทย ที่ยึดถือตามพจนานุกรม ฉบับราชบัณฑิตยสถาน พ.ศ. ๒๕๒๕ ประโยชน์ของการเรียงลำดับคือ ช่วยให้การค้นหาทำได้ง่ายขึ้น ทั้งการค้นโดยคอมพิวเตอร์ และการค้นโดยผู้ใช้ ตัวอย่างที่เห็นได้อย่างชัดเจนคือ การค้นหาคำ ในพจนานุกรม หรือการค้นหาฐานข้อมูลชื่อต่างๆ เช่น ชื่อบุคคล ชื่อหน่วยงาน ชื่อแฟ้มเอกสาร เป็นต้น ถ้าได้จัดเรียงไว้ตามลำดับแล้ว ก็จะสามารถประหยัดเวลาในการค้นหาได้
๒. โปรแกรมการสืบค้นคำไทยตามเสียงอ่าน (Thai Soundex)
การค้นหาคำไทยที่มีเสียงพ้อง หรือคำที่สามารถสะกดได้หลายแบบนั้น สามารถแก้ปัญหาได้ โดยการค้นหาคำตามเสียงอ่าน ทั้งนี้ ตามธรรมชาติของผู้ใช้ภาษาโดยทั่วไป จะเคยชินกับเสียงอ่านของคำมากกว่าตัวสะกด นอกจากนั้น เสียง ๑ เสียงสามารถแทนคำได้มากกว่า ๑ คำ เช่น เสียง "ค่า" หมายความถึง ข้า ค่า หรือ ฆ่า ก็ได้ ชื่อเฉพาะทั้งหลาย ก็สามารถสะกดได้หลายแบบ เช่น เพชรรัตน์ (อ่านว่า เพ็ด - ชะ - รัด) อาจสะกดเป็น เพชรัตน์ เพ็ชรัตน์ เพ็ชรรัตน์ เพชรรัช เพชรรัชต์ เพชรรัฐ เพชรรัตต์ เพชรรัตติ์ เพชรรัศม์ ฯลฯ จึงได้มีการคิดวิธีค้นตามเสียงอ่านขึ้น เพื่ออำนวยความสะดวกต่อผู้ใช้ ในสถานการณ์ที่ไม่สามารถสะกดคำได้อย่างถูกต้อง เช่น การค้นหาชื่อในฐานข้อมูลสำมะโนประชากร ในสมุดรายนามผู้ใช้โทรศัพท์ หรือในโปรแกรมตรวจคำผิด เป็นต้น