เปิดตัวโมเดลข้อมูลเชิงสัมพันธ์โดย C.F. Codd ในปี 1970 ปัจจุบันเป็นโมเดลข้อมูลที่ใช้กันอย่างแพร่หลายมากที่สุด โมเดลข้อมูลเชิงสัมพันธ์อธิบายโลกว่าเป็น "ชุดของความสัมพันธ์ (หรือตาราง) ที่สัมพันธ์กัน" โมเดลข้อมูลเชิงสัมพันธ์เกี่ยวข้องกับการใช้ตารางข้อมูลที่รวบรวมกลุ่มขององค์ประกอบเป็นความสัมพันธ์ โมเดลเหล่านี้ทำงานตามแนวคิดที่ว่าการตั้งค่าตารางแต่ละรายการจะมีคีย์หลักหรือตัวระบุ ตารางอื่นๆ ใช้ตัวระบุดังกล่าวเพื่อจัดเตรียมลิงก์ข้อมูลและผลลัพธ์ "เชิงสัมพันธ์"
ปัจจุบัน มีระบบจัดการฐานข้อมูลเชิงสัมพันธ์เชิงพาณิชย์ (RDBMS) มากมาย เช่น Oracle, IBM DB2 และ Microsoft SQL Server นอกจากนี้ยังมี RDBMS ฟรีและโอเพ่นซอร์สมากมาย เช่น MySQL, mSQL (mini-SQL) และ Java DB แบบฝัง (Apache Derby) ผู้ดูแลระบบฐานข้อมูลใช้ Structured Query Language (SQL) เพื่อดึงองค์ประกอบข้อมูลจากฐานข้อมูลเชิงสัมพันธ์
ดังที่กล่าวไว้ คีย์หลักเป็นเครื่องมือพื้นฐานในการสร้างและใช้แบบจำลองข้อมูลเชิงสัมพันธ์ ต้องไม่ซ้ำกันสำหรับสมาชิกของชุดข้อมูลแต่ละคน จะต้องมีการเติมสำหรับสมาชิกทั้งหมด ความไม่สอดคล้องกันอาจทำให้เกิดปัญหาในการดึงข้อมูลของนักพัฒนา ปัญหาอื่นๆ เกี่ยวกับการออกแบบฐานข้อมูลเชิงสัมพันธ์รวมถึงการทำซ้ำข้อมูลมากเกินไป ข้อมูลผิดพลาดหรือบางส่วน หรือการเชื่อมโยงหรือการเชื่อมโยงที่ไม่เหมาะสมระหว่างตาราง การดูแลฐานข้อมูลตามปกติส่วนใหญ่เกี่ยวข้องกับการประเมินชุดข้อมูลทั้งหมดในฐานข้อมูลเพื่อให้แน่ใจว่ามีการเติมข้อมูลอย่างสม่ำเสมอและจะตอบสนองต่อ SQL หรือวิธีการดึงข้อมูลอื่นๆ ได้ดี
ตัวอย่างเช่น แถวฐานข้อมูลทั่วไปจะแสดงทูเพิล ซึ่งเป็นชุดข้อมูลที่หมุนรอบอินสแตนซ์หรือออบเจกต์เสมือนเพื่อให้คีย์หลักเป็นตัวระบุที่ไม่ซ้ำกัน ชื่อคอลัมน์ในตารางข้อมูลเชื่อมโยงกับแอตทริบิวต์ ตัวระบุ หรือคุณลักษณะที่ทุกส่วนของชุดข้อมูลมี ข้อตกลงเหล่านี้และอื่นๆ ที่เข้มงวดช่วยให้ผู้ดูแลระบบฐานข้อมูลและนักออกแบบมีมาตรฐานสำหรับการสร้างการตั้งค่าฐานข้อมูลเชิงสัมพันธ์
วัตถุประสงค์การออกแบบฐานข้อมูล
- ขจัดความซ้ำซ้อนของข้อมูล: ข้อมูลชิ้นเดียวกันจะไม่ถูกจัดเก็บไว้มากกว่าหนึ่งแห่ง เนื่องจากข้อมูลที่ซ้ำกันไม่เพียงแต่ทำให้เสียพื้นที่จัดเก็บเท่านั้น แต่ยังนำไปสู่ความไม่สอดคล้องกันได้ง่ายอีกด้วย
- รับรองความถูกต้องและถูกต้องของข้อมูล: คือการบำรุงรักษาและการประกันความถูกต้องและความสม่ำเสมอของข้อมูลตลอดวงจรชีวิตทั้งหมด และเป็นส่วนสำคัญยิ่งต่อการออกแบบ การนำไปใช้งาน และการใช้งานระบบใดๆ ที่จัดเก็บ ประมวลผล หรือดึงข้อมูลหลี่>
โมเดลเชิงสัมพันธ์ได้จัดเตรียมพื้นฐานสำหรับ:
- งานวิจัยเกี่ยวกับทฤษฎีข้อมูล/ความสัมพันธ์/ข้อจำกัด
- วิธีการออกแบบฐานข้อมูลมากมาย
- ภาษาเข้าถึงฐานข้อมูลมาตรฐานที่เรียกว่า ภาษาคิวรีที่มีโครงสร้าง (SQL)
- ระบบจัดการฐานข้อมูลเชิงพาณิชย์ที่ทันสมัยเกือบทั้งหมด
ฐานข้อมูลเชิงสัมพันธ์ไปพร้อมกับการพัฒนา SQL ความเรียบง่ายของ SQL ซึ่งแม้แต่มือใหม่ก็สามารถเรียนรู้ที่จะดำเนินการสืบค้นข้อมูลพื้นฐานในช่วงเวลาสั้นๆ ได้ ซึ่งเป็นสาเหตุส่วนใหญ่ของความนิยมของโมเดลเชิงสัมพันธ์
ตารางสองตารางด้านล่างสัมพันธ์กันผ่านช่องรหัสผลิตภัณฑ์ สองตารางใดๆ สามารถเชื่อมโยงซึ่งกันและกันได้ง่ายๆ โดยการสร้างเขตข้อมูลที่มีร่วมกัน
ตารางที่ 1
Product_code | คำอธิบาย | ราคา |
---|---|---|
A416 | ปากกาสี | ₹ 25.00 |
C923 | กล่องดินสอ | ₹ 45.00 |
ตารางที่ 2
Invoice_code | Invoice_line | Product_code | จำนวน |
---|---|---|---|
3804 | 1 | A416 | 15 |
3804 | 2 | C923 | 24 |
RDM มีสี่ขั้นตอนดังต่อไปนี้ -
- ความสัมพันธ์และคุณลักษณะ − มีการระบุตารางและแอตทริบิวต์ต่างๆ ที่เกี่ยวข้องกับแต่ละตาราง ตารางแสดงถึงเอนทิตี และแอตทริบิวต์แสดงถึงคุณสมบัติของเอนทิตีที่เกี่ยวข้อง
- คีย์หลัก - มีการระบุและกำหนดแอตทริบิวต์หรือชุดของแอตทริบิวต์ที่ช่วยในการระบุระเบียนที่ไม่ซ้ำและเป็นคีย์หลัก
- ความสัมพันธ์ − ความสัมพันธ์ระหว่างตารางต่างๆ ถูกสร้างขึ้นโดยใช้คีย์นอก คีย์ภายนอกคือแอตทริบิวต์ที่เกิดขึ้นในตารางที่เป็นคีย์หลักของตารางอื่น ประเภทของความสัมพันธ์ที่สามารถมีได้ระหว่างความสัมพันธ์ (ตาราง) คือ หนึ่งต่อหนึ่ง หนึ่งถึงหลาย และหลายต่อหลาย
- การทำให้เป็นมาตรฐาน − นี่คือกระบวนการปรับโครงสร้างฐานข้อมูลให้เหมาะสม การทำให้เป็นมาตรฐานช่วยลดความซับซ้อนของการออกแบบฐานข้อมูลเพื่อหลีกเลี่ยงความซ้ำซ้อนและความสับสน รูปแบบปกติที่แตกต่างกันมีดังนี้:
1. แบบฟอร์มปกติครั้งแรก
2. รูปแบบปกติที่สอง
3. รูปแบบปกติที่สาม
4. บอยซ์-คอด ฟอร์มปกติ
5. รูปแบบปกติที่ห้า
โดยการใช้ชุดของกฎ ตารางจะถูกทำให้เป็นมาตรฐานในรูปแบบปกติข้างต้นในรูปแบบก้าวหน้าเชิงเส้น ประสิทธิภาพของการออกแบบจะดีขึ้นเมื่อมีระดับการทำให้เป็นมาตรฐานสูงขึ้น
ข้อดีของฐานข้อมูลเชิงสัมพันธ์
ข้อได้เปรียบหลักของฐานข้อมูลเชิงสัมพันธ์คือช่วยให้ผู้ใช้สามารถจัดหมวดหมู่และจัดเก็บข้อมูลที่สามารถสืบค้นและกรองในภายหลังเพื่อดึงข้อมูลเฉพาะสำหรับรายงานได้อย่างง่ายดาย ฐานข้อมูลเชิงสัมพันธ์ยังขยายได้ง่ายและไม่พึ่งพาองค์กรจริง หลังจากสร้างฐานข้อมูลดั้งเดิมแล้ว คุณสามารถเพิ่มหมวดหมู่ข้อมูลใหม่ได้โดยไม่ต้องแก้ไขแอปพลิเคชันที่มีอยู่ทั้งหมด
ข้อดีอื่นๆ
- แม่นยำ − ข้อมูลจะถูกจัดเก็บเพียงครั้งเดียว ซึ่งจะช่วยขจัดความซ้ำซ้อนของข้อมูล
- ยืดหยุ่น − ข้อความค้นหาที่ซับซ้อนนั้นง่ายต่อการดำเนินการ
- ความร่วมมือ − ผู้ใช้หลายคนสามารถเข้าถึงฐานข้อมูลเดียวกันได้
- เชื่อถือได้ - โมเดลฐานข้อมูลเชิงสัมพันธ์มีความสมบูรณ์และเข้าใจดี
- ปลอดภัย − ข้อมูลในตารางภายในระบบจัดการฐานข้อมูลเชิงสัมพันธ์ (RDBMS) สามารถจำกัดให้อนุญาตการเข้าถึงโดยผู้ใช้บางรายเท่านั้น