Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การขุดข้อมูลเชิงพื้นที่คืออะไร?


ฐานข้อมูลเชิงพื้นที่ช่วยบันทึกข้อมูลที่เกี่ยวข้องกับพื้นที่จำนวนมาก รวมถึงแผนที่ การสำรวจระยะไกลที่ประมวลผลล่วงหน้า หรือบันทึกภาพทางการแพทย์ และข้อมูลการออกแบบชิป VLSI ฐานข้อมูลเชิงพื้นที่มีคุณสมบัติหลายอย่างที่แยกความแตกต่างจากฐานข้อมูลเชิงสัมพันธ์ โดยจะมีข้อมูลเชิงทอพอโลยีและ/หรือระยะทาง ซึ่งโดยปกติแล้วจะจัดโครงสร้างการจัดทำดัชนีเชิงพื้นที่แบบหลายมิติที่มีความซับซ้อน ซึ่งเข้าถึงได้โดยวิธีการเข้าถึงข้อมูลเชิงพื้นที่ และมักต้องใช้การให้เหตุผลเชิงพื้นที่ การคำนวณเชิงเรขาคณิต และเทคนิคการแทนความรู้เชิงพื้นที่

การทำเหมืองข้อมูลเชิงพื้นที่หมายถึงการดึงความรู้ ความสัมพันธ์เชิงพื้นที่ หรือรูปแบบที่น่าสนใจอื่นๆ ที่ไม่ได้จัดเก็บไว้ในฐานข้อมูลเชิงพื้นที่อย่างชัดเจน การขุดดังกล่าวต้องการการรวมการทำเหมืองข้อมูลเข้ากับเทคโนโลยีฐานข้อมูลเชิงพื้นที่ สามารถใช้สำหรับการเรียนรู้บันทึกเชิงพื้นที่ ค้นพบความสัมพันธ์เชิงพื้นที่และความสัมพันธ์ระหว่างบันทึกเชิงพื้นที่และไม่ใช่เชิงพื้นที่ การสร้างฐานความรู้เชิงพื้นที่ จัดระเบียบฐานข้อมูลเชิงพื้นที่ใหม่ และเพิ่มประสิทธิภาพการสืบค้นเชิงพื้นที่

คาดว่าจะมีการใช้งานอย่างกว้างขวางในระบบข้อมูลทางภูมิศาสตร์ การตลาด การสำรวจระยะไกล การสำรวจฐานข้อมูลภาพ การถ่ายภาพทางการแพทย์ การนำทาง การควบคุมการจราจร การศึกษาสิ่งแวดล้อม และพื้นที่อื่นๆ อีกมากมายที่ใช้ข้อมูลเชิงพื้นที่

ความท้าทายหลักในการทำเหมืองข้อมูลเชิงพื้นที่คือการสำรวจเทคนิคการทำเหมืองข้อมูลเชิงพื้นที่อย่างมีประสิทธิภาพ เนื่องจากมีข้อมูลเชิงพื้นที่จำนวนมาก และความยากของประเภทข้อมูลเชิงพื้นที่และวิธีการเข้าถึงเชิงพื้นที่ การวิเคราะห์ข้อมูลเชิงพื้นที่เชิงสถิติเป็นวิธีที่ได้รับความนิยมในการวิเคราะห์ข้อมูลเชิงพื้นที่และการสำรวจข้อมูลทางภูมิศาสตร์

คำว่า geostatistics มักเกี่ยวข้องกับพื้นที่ทางภูมิศาสตร์ที่ต่อเนื่อง ในขณะที่คำว่าสถิติเชิงพื้นที่มักเกี่ยวข้องกับพื้นที่ที่ไม่ต่อเนื่อง ในแบบจำลองทางสถิติที่จัดการบันทึกที่ไม่ใช่เชิงพื้นที่ โดยทั่วไปเราจะพิจารณาความเป็นอิสระทางสถิติจากส่วนต่างๆ ของข้อมูล

ไม่มีการแบ่งแยกดังกล่าวระหว่างระเบียนที่กระจายตามพื้นที่ เพราะจริงๆ แล้ววัตถุเชิงพื้นที่มีความสัมพันธ์กัน หรืออยู่ร่วมกันในเชิงพื้นที่มากขึ้น ในแง่ที่ว่ายิ่งวัตถุทั้งสองอยู่ใกล้กันมากเท่าใด ก็ยิ่งมีแนวโน้มที่วัตถุทั้งสองจะส่ง คุณสมบัติเดียวกัน ตัวอย่างเช่น ทรัพยากรธรรมชาติ สภาพภูมิอากาศ อุณหภูมิ และสถานการณ์ทางเศรษฐกิจมีแนวโน้มที่จะใกล้เคียงกันในภูมิภาคที่อยู่ใกล้เคียงทางภูมิศาสตร์

คุณสมบัติการพึ่งพาอาศัยกันอย่างใกล้ชิดในพื้นที่ใกล้เคียงนำไปสู่แนวคิดของความสัมพันธ์อัตโนมัติเชิงพื้นที่ จากแนวคิดนี้ วิธีการสร้างแบบจำลองทางสถิติเชิงพื้นที่ได้รับการพัฒนาอย่างประสบความสำเร็จ การทำเหมืองข้อมูลเชิงพื้นที่จะสร้างวิธีการวิเคราะห์ทางสถิติเชิงพื้นที่และขยายไปสู่ข้อมูลเชิงพื้นที่จำนวนมาก โดยจะเน้นที่ประสิทธิภาพ ความสามารถในการปรับขนาด ความร่วมมือกับฐานข้อมูลและระบบคลังข้อมูล การโต้ตอบกับผู้ใช้ที่ได้รับการปรับปรุง และการค้นพบความรู้ประเภทใหม่