เล่มที่ 25
การประยุกต์ใช้ภาษาไทยบนคอมพิวเตอร์
สามารถแชร์ได้ผ่าน :

เว็บเพจที่ให้บริการค้นหาเลขหมายโทรศัพท์ของบุคคลหรือห้างร้านตามเสียงอ่าน

โปรแกรมการสืบค้นคำไทยตามเสียงอ่าน

            ตามธรรมชาติของการเรียนภาษาขั้นแรก ภาษาพูดจะถูกฝึกก่อนภาษาเขียน ผู้ใช้ภาษาโดยทั่วไป จึงเคยชินกับเสียงอ่านของคำมากกว่าตัวสะกด รวมทั้งความจริงที่ว่า เสียงหนึ่งเสียงสามารถแทนคำได้มากกว่าหนึ่งคำ เช่น เสียง "ค่า" สามารถหมายความถึง ข้า ค่า หรือ ฆ่าก็ได้ ชื่อเฉพาะทั้งหลาย ก็สามารถสะกดได้หลายแบบ เช่น เพชรรัตน์ (อ่านว่า เพ็ด - ชะ - รัด) อาจจะสะกดเป็น เพชรัตน์ เพ็ชรัตน์ เพ็ชรรัตน์ เพชรรัช เพชรรัชต์ เพชรรัฐ เพชรรัตต์ เพชรรัตติ์ เพชรรัศม์ ฯลฯ จึงได้มีการคิดวิธีค้นตามเสียงอ่านขึ้น เพื่ออำนวยความสะดวกต่อผู้ใช้ในสถานการณ์ที่ไม่สามารถสะกดคำได้อย่างถูกต้อง เช่น ในฐานข้อมูลสำมะโนประชากร ในสมุดโทรศัพท์ หรือในโปรแกรมตรวจคำผิด เป็นต้น

            หลักการก็คือ จะมีโปรแกรมย่อย สำหรับแปลงตัวสะกดให้เป็นเสียงอ่าน โปรแกรมย่อยดังกล่าว จะใช้แปลงคำ หรือชื่อต่างๆ ในฐานข้อมูลให้เป็นเสียงอ่าน เพื่อเก็บไว้เป็นคีย์สำหรับค้นหาต่างหาก ในการใช้งานจริง โปรแกรมจะแปลงคำที่ต้องการค้นให้เป็นเสียงอ่าน แล้วค้นด้วยคีย์ ที่ได้เตรียมไว้แล้วนั้น ก็จะได้เรคคอร์ดต่างๆ ที่เชื่อมโยงกับเสียงอ่านที่ต้องการ วิธีการนี้คิดขึ้นเป็นครั้งแรก โดยชาวอเมริกันชื่อว่า Margaret K. Odell และ Robert C. Russell โดยได้จดสิทธิบัตรไว้เมื่อปี พ.ศ. ๒๔๖๑ และ พ.ศ. ๒๔๖๕ วิธีการนี้เรียกว่า ซาวน์เด็กซ์ (Soundex มาจาก sound + index) ซึ่งได้ใช้เป็นวิธีมาตรฐาน ในการค้นชื่อ ในสำมะโนประชากรของสหรัฐอเมริกา