๔. เพิ่มประสิทธิภาพการทำงาน เมื่อมีการกระจายข้อมูลตามจุดต่างๆ จะส่งผลให้ฐานข้อมูลย่อยแต่ละจุดมีขนาดเล็กลง ซึ่งทำให้เมื่อมีการสอบถามข้อมูล ในแต่ละฐานข้อมูลย่อย การค้นหาข้อมูล ย่อมทำได้รวดเร็วขึ้น นอกจากนี้ ผู้ใช้ก็กระจายอยู่ตามจุดต่างๆ แต่ละจุด จึงสามารถทำงานขนานกันได้เลย ซึ่งไม่เหมือนกับระบบรวมศูนย์ ที่จะต้องส่งทุกๆ คำสั่งไปที่เดียวกันหมด และทำให้ต้องรอลำดับ ในการทำงาน เพราะไม่สามารถทำงานพร้อมๆ กันได้
ระบบฐานข้อมูลแบบกระจาย ประกอบด้วย กลุ่มของระบบฐานข้อมูลย่อย ติดต่อสื่อสารกัน โดยผ่านเครือข่ายสื่อสาร โดยที่แต่ละระบบฐานข้อมูลย่อย สามารถทำงานได้ด้วยตนเอง และยังสามารถให้ผู้ใช้จากจุดอื่นๆ เข้ามาใช้ข้อมูลใน ฐานข้อมูลได้ตามข้อตกลง โดยผู้ใช้จะไม่รู้สึกถึงการกระจายของข้อมูลเลย ทั้งนี้องค์ประกอบหลักของระบบฐานข้อมูลแบบกระจาย ประกอบด้วย ลักษณะที่สำคัญ ๑๒ ประการ ได้แก่
๑. ภาวะอิสระเฉพาะที่ (Local Autonomy) คือ สภาวะที่คำสั่งต่างๆ ในจุด ก สามารถทำงาน และควบคุมได้ โดยจุด ก ไม่ต้องขึ้นอยู่กับคำสั่ง จากจุดอื่น รวมถึงข้อมูลในจุด ก ควรถูกควบคุม จัดการ และเป็นเจ้าของด้วยจุด ก เท่านั้น
๒. ภาวะไม่ขึ้นกับหน่วยงานกลาง (No Reliance on a Central Site) ทุกจุดของระบบฐานข้อมูลย่อย มีความเสมอภาคกัน นั่นคือ ไม่มีจุดใด ที่ทำหน้าที่เป็นศูนย์กลางการทำงาน ในทางตรงข้าม ถ้ามีจุดศูนย์กลาง เมื่อมีการทำงานใดๆ เกิดขึ้น ก็จะต้องส่งผ่านมาที่จุดนี้ก่อน จึงส่งผลให้ จุดนี้กลายเป็นคอขวด (bottleneck) ของการทำงาน และเมื่อจุดศูนย์กลางเกิดการขัดข้อง ก็จะทำให้ทุกจุด ของระบบใช้งานไม่ได้ไปด้วย ซึ่งก่อให้เกิดผลเสีย เป็นอย่างยิ่ง
๓. เพิ่มความน่าเชื่อถือ (Reliability) และ สภาพพร้อมใช้งาน (Availability) ระบบโดยรวมยังคงทำงานอยู่ตลอดเวลา ไม่ว่าจะมีจุดย่อยจุดใดขัดข้องหรือไม่ โดยอาจจะทำงานได้ เฉพาะบางจุดย่อยเท่านั้น และการทำซ้ำข้อมูลในบางจุดย่อยก็ ยังช่วยเสริมสภาพพร้อมใช้งานให้ดีมากขึ้นด้วย
๔. ความไม่ขึ้นกับตำแหน่ง (Location Independence) คือ ภาวะที่ผู้ใช้ไม่จำเป็นต้องรู้ว่า ข้อมูลใดจัดเก็บอยู่ที่จุดใด ผู้ใช้สามารถจะเรียกใช้ข้อมูลได้ เสมือนว่า ข้อมูลทั้งหมดอยู่ที่จุดที่ผู้ใช้กำลังใช้งาน เพื่อให้ง่ายและสะดวกในการใช้งาน
๕. ความไม่ขึ้นกับการแตกกระจาย (Fragmentation Independence) ระบบฐานข้อมูลแบบกระจาย ควรจะมีการแตกกระจายข้อมูล (Data Fragmentation) ซึ่งก็คือ การแตกข้อมูลในตารางความสัมพันธ์ ออกเป็นตารางย่อยๆ กระจายอยู่ตามจุดต่างๆ ตามการใช้งาน การแตกกระจายนี้มี ๒ แบบคือ แนวนอน (horizontal) และแนวตั้ง (vertical) เป็นการแยกข้อมูลตามข้อจำกัดของ แต่ละระเบียน หรือการแยกข้อมูลตามสดมภ์ และ ตามลำดับ การไม่ขึ้นกับการแตกกระจายก็คือ การที่ผู้ใช้สามารถใช้งานได้เสมือนไม่มีการแตก กระจายข้อมูลเลย ซึ่งส่งผลให้การใช้งานง่ายขึ้น
๖. ความไม่ขึ้นกับการทำซ้ำ (Replication Independence) การทำซ้ำข้อมูล (Data Replication) คือ การทำซ้ำข้อมูลของตารางสัมพันธ์ไว้ในหลายๆ จุด ซึ่งจะมีประโยชน์คือ ประสิทธิภาพในการทำงานเพิ่มขึ้น เนื่องจากสามารถทำงานได้ ณ จุดย่อยที่เรียกใช้ได้เลย และเป็นการประหยัดการ ติดต่อสื่อสารระหว่างจุดด้วย นอกจากนี้ ยังเป็นการเพิ่มสภาพความพร้อมในการใช้งานด้วย เมื่อจุดย่อยจุดใดขัดข้อง ข้อมูลชุดเดียวกัน ณ จุดย่อยอื่น ก็ยังสามารถนำมาใช้งานแทนกันได้ ดังนั้น ความไม่ขึ้นกับการทำซ้ำคือ การที่ผู้ใช้งานไม่รู้สึก ถึงการทำซ้ำข้อมูลในการใช้งานข้อมูล ซึ่งส่งผลให้ การใช้งานเป็นไปโดยง่ายยิ่งขึ้น
๗. การประมวลผลข้อคำถามแบบกระจาย (Distributed Query Processing) แบบจำลองข้อมูลเชิงสัมพันธ์ มีความเหมาะสม สำหรับระบบฐานข้อมูลแบบกระจายเป็นอย่างยิ่ง เมื่อพิจารณา ในแง่การประมวลผลข้อคำถาม ด้วยเหตุผล ๒ ประการคือ ภาษาสอบถามของแบบจำลองนี้ เป็นภาษาขั้นสูง ซึ่งทำการดึงข้อมูลจากฐานข้อมูล ครั้งละกลุ่มข้อมูล แต่ถ้าเป็นภาษาสอบถามขั้นต่ำ จะทำงานครั้งละระเบียนข้อมูล เมื่อเป็นการ ทำงานแบบกระจายที่ต้องดึงข้อมูลจากจุดอื่นๆ ซึ่งดึงได้เพียงครั้งละ ๑ ระเบียน ค่าใช้จ่ายในการติดต่อ ก็จะสูงมาก เหตุผลอีกประการหนึ่งคือ แบบจำลองข้อมูลเชิงสัมพันธ์ มีการหาวิธีการที่เหมาะสมที่สุด ในการประมวลผลคำถามแต่ละข้อ ซึ่งทำให้การประมวลผลเป็นไปอย่างมีประสิทธิภาพ ที่สุด
๘. การจัดการรายการเปลี่ยนแปลงแบบ กระจาย (Distributed Transaction Management) เกี่ยวข้องกับ ๒ กระบวนการคือ การควบคุมการกู้ (Recovery Control) ทั้ง ๒ กระบวนการ จะต้องมีการปรับปรุงเพิ่มขึ้น เมื่อนำมาใช้กับระบบฐานข้อมูลแบบกระจาย สำหรับการควบคุมการกู้นั้น วิธีการที่นำมาใช้แก้ปัญหา คือ โพรโทคอลสำหรับการคอมมิตแบบ ๒ ระยะ (Two-phase Commit Protocol) ส่วนเทคนิคในการควบคุมภาวะพร้อมกันที่นิยมใช้กันมากคือ การใช้ตัวปิดกั้น (Locking) ทั้ง ๒ เทคนิคมี พื้นฐานในการทำงานบนระบบฐานข้อมูลแบบ รวมศูนย์ ซึ่งเมื่อนำมาใช้กับระบบฐานข้อมูลแบบ กระจาย ก็ต้องมีการปรับปรุงเทคนิคเพื่อให้สามารถ ทำงานกับระบบใหม่ได้อย่างมีประสิทธิภาพ
๙. ความไม่ขึ้นกับฮาร์ดแวร์ (Hardware Independence) ระบบฐานข้อมูลแบบกระจาย มักจะประกอบไปด้วยฮาร์ดแวร์ ที่แตกต่างกัน ในแต่ละจุดของการทำงาน ซึ่งระบบควรทำงานร่วมกันได้ นั่นคือ ระบบจัดการฐานข้อมูลเดียวกัน ควรที่จะทำงานได้บนฮาร์ดแวร์ที่ต่างกัน และฮาร์ดแวร์ในทุกๆ จุด ควรมีความเสมอภาคกัน ในการทำงาน
๑๐. ความไม่ขึ้นกับระบบปฏิบัติการ (Operating System Independence) ระบบการจัดการฐานข้อมูล ที่นำมาใช้ในฐานข้อมูลแบบกระจาย ควรจะมีความสามารถ ที่จะทำงานบนระบบปฏิบัติการที่แตกต่างกันได้
๑๑. ความไม่ขึ้นกับเครือข่าย (Network Independence) ระบบฐานข้อมูลแบบกระจายที่ดี ควรจะทำงานได้บนฮาร์ดแวร์หลายๆ แบบ และระบบปฏิบัติการหลายๆ แบบ นอกจากนี้ ก็ควรที่จะทำงานได้ บนเครือข่ายสื่อสารหลายๆ แบบด้วย
๑๒. ความไม่ขึ้นกับระบบจัดการฐานข้อมูล (DBMS Independence) ระบบฐานข้อมูลแบบกระจาย จะมีความสมบูรณ์มากขึ้น เมื่อแต่ละจุดทำงาน สามารถใช้ระบบจัดการฐานข้อมูลที่แตกต่างกันได้ โดยอาจจะพัฒนาส่วนต่อประสาน (Interface) ให้สามารถเชื่อมต่อการใช้งานระหว่างระบบ จัดการฐานข้อมูลที่แตกต่างกันได้ ตัวอย่าง เช่น กรณี ระบบจัดการฐานข้อมูลโอราเคิลกับไซเบส ซึ่ง สนับสนุนมาตรฐานเอสคิวแอลเดียวกัน แต่ใช้งาน อยู่ ณ จุดทำงานต่างกัน ระบบฐานข้อมูลแบบ กระจายทั้งสองสามารถทำงานร่วมกันได้ โดยผ่าน ส่วนประสานงานเอสคิวแอล เป็นต้น
อย่างไรก็ตาม การพัฒนาระบบจัดการฐานข้อมูลแบบกระจาย จะต้องมีความซับซ้อนเพิ่มขึ้น ซอฟต์แวร์สำหรับจัดการฐานข้อมูลแบบกระจาย (Distributed Database Management Systems : DDBMS) ควรที่จะมีฟังก์ชันพิเศษเพิ่มขึ้น ดังนี้
๑. ฟังก์ชันในการเข้าถึงข้อมูลในจุดอื่น การ ส่งคำสั่งตอบคำถาม และส่งข้อมูลระหว่างจุดได้โดย ผ่านเครือข่ายสื่อสาร (Communication Network)
๒. ฟังก์ชันในการเก็บรายละเอียดของข้อมูลว่า ข้อมูลใด กระจายอยู่ที่จุดใดบ้าง ทั้งนี้ เพื่อใช้ในการปรับปรุงแก้ไขข้อมูล ให้ถูกต้อง และสอดคล้องกัน
๓. ฟังก์ชันในการทำให้ข้อมูลที่ถูกทำซ้ำ ในจุดต่างๆ มีความถูกต้อง และสอดคล้องกันเสมอ
๔. ฟังก์ชันในการเลือกชุดข้อมูลที่ควรจะใช้ เมื่อข้อมูลชุดนั้น มีการทำซ้ำไว้หลายตำแหน่ง
๕. ฟังก์ชันในการปรับคำสั่งสอบถามที่ ต้องการใช้ข้อมูลจากหลายๆ จุด
๖. ฟังก์ชันในการกู้ (Recovery) ข้อมูลคืน เมื่อจุดใดจุดหนึ่งในระบบขัดข้อง (crash)
สถาปัตยกรรมแบบรับ-ให้บริการ (Client-Server Architecture) พัฒนาขึ้นมา เพื่อใช้กับระบบที่มีคอมพิวเตอร์จำนวนมาก และติดต่อกัน โดยผ่านเครือข่ายสื่อสาร ระบบนี้ได้รับความนิยมเพิ่มมากขึ้น ในการนำมาพัฒนาใช้กับระบบจัดการฐานข้อมูลแบบกระจาย เนื่องจากมีความสามารถ ในการสนับสนุนในการทำงานแบบกระจาย แนวคิด คือ การแบ่งซอฟต์แวร์จัดการฐานข้อมูลออกเป็น ๒ ระดับ คือ ระดับบริการ และระดับให้บริการ เพื่อลดความซับซ้อนของระบบลง บางจุดอาจจะ ทำหน้าที่เป็นผู้รับบริการเพียงอย่างเดียว ในขณะ ที่จุดอื่นอาจทำหน้าที่เป็นผู้ให้บริการ ซึ่งจะมี เฉพาะซอฟต์แวร์ที่ทำหน้าที่เป็นผู้ให้บริการเท่านั้น หรือในบางจุดอาจมีทั้งส่วนให้บริการและรับ บริการอยู่ร่วมกันก็ได้
ระบบฐานข้อมูลแบบกระจาย แบ่งได้เป็นหลายประเภทด้วยกัน ซึ่งขึ้นอยู่กับปัจจัย ที่เรานำมาพิจารณาเป็นเกณฑ์ในการจัดแบ่ง ตัวอย่างหลักเกณฑ์ ในการแบ่งระบบฐานข้อมูลแบบกระจาย ได้แก่
๑. ระดับความเหมือน (Degree of Homogeneity) ของซอฟต์แวร์จัดการฐานข้อมูลแบบกระจาย กล่าวคือ ซอฟต์แวร์นี้ ในทุกๆ ระดับ ผู้ให้บริการเหมือนกันทั้งหมดหรือไม่ และในระดับผู้รับบริการ เหมือนกันทั้งหมดหรือไม่
๒. ระดับภาวะอิสระเฉพาะที่ (Degree of Local Autonomy) ซึ่งพิจารณาว่า ระบบฐานข้อมูลแบบกระจายนั้น สามารถทำงานบางอย่าง ณ จุดทำงานนั้นๆ ได้บ้าง หรือไม่
๓. ระดับความโปร่งใสของการกระจาย (Degree of Distribution Transparency) คือ การที่ผู้ใช้ระบบฐานข้อมูลแบบกระจายได้สัมผัส หรือรับรู้ถึงการแตกกระจาย หรือการทำซ้ำของข้อมูลบ้างหรือไม่