หน้าแรก
หน้าแรก
การทดสอบ FASMI สามารถแสดงลักษณะของแอปพลิเคชัน OLAP ในวิธีการเฉพาะ โดยไม่ต้องบอกว่าควรดำเนินการอย่างไร เร็ว − กำหนดว่าระบบมีเป้าหมายเพื่อสร้างการตอบสนองส่วนใหญ่ต่อผู้ใช้ภายในเวลาประมาณห้าวินาที โดยการวิเคราะห์ที่เข้าใจได้จะใช้เวลาไม่เกินหนึ่งวินาทีและน้อยมากที่ใช้เวลามากกว่า 20 วินาที การวิจัยอิสร
มีเครื่องมือบนเว็บต่างๆ ดังต่อไปนี้ - เว็บอาร์เบอร์เอสเบส − เครื่องมือนี้มีคุณลักษณะต่างๆ เช่น การเจาะขึ้น ลง ข้าม slice and dice และการรายงานที่มีประสิทธิภาพ ทั้งหมดสำหรับ OLAP นอกจากนี้ยังมีการป้อนข้อมูล เช่น ความสามารถในการเขียนพร้อมกันหลายผู้ใช้เต็มรูปแบบ Arbor Essbase เป็นเพียงผลิตภัณฑ์เซิร์ฟเ
มีเทคนิคการเพิ่มประสิทธิภาพทั่วไปต่อไปนี้สำหรับการคำนวณก้อนข้อมูลอย่างมีประสิทธิภาพซึ่งมีดังต่อไปนี้ − การจัดเรียง การแฮช และการจัดกลุ่ม − การเรียงลำดับ การแฮช และการจัดกลุ่มควรใช้กับแอททริบิวต์มิติเพื่อจัดลำดับใหม่และคลัสเตอร์ทูเพิลที่เกี่ยวข้อง ในการคำนวณคิวบ์ การรวมจะถูกนำไปใช้กับทูเพิล (หรือเ
มีรูปแบบต่าง ๆ ของอัลกอริทึม Apriori ที่คาดการณ์ไว้โดยมีเป้าหมายเพื่อพัฒนาประสิทธิภาพของอัลกอริธึมดั้งเดิมซึ่งมีดังต่อไปนี้ - เทคนิคที่ใช้แฮช (แฮชชุดไอเท็มลงในบัคเก็ตที่เกี่ยวข้อง) − เทคนิคที่ใช้แฮชสามารถใช้เพื่อลดขนาดของชุดรายการ k ของตัวเลือก Ck 1 ตัวอย่างเช่น เมื่อสแกนแต่ละธุรกรรมในฐานข้อมูลเพื่อ
มีข้อกำหนดของการจัดกลุ่มในการทำเหมืองข้อมูลดังต่อไปนี้ - ความสามารถในการปรับขนาด − อัลกอริธึมการทำคลัสเตอร์บางตัวทำงานได้ดีกับชุดข้อมูลขนาดเล็ก รวมถึงออบเจ็กต์ข้อมูลน้อยกว่าร้อยรายการ ฐานข้อมูลขนาดใหญ่สามารถรวมอ็อบเจ็กต์ได้หลายล้านรายการ การทำคลัสเตอร์บนตัวอย่างของชุดข้อมูลขนาดใหญ่ที่กำหนดอาจนำไปสู
อัลกอริธึมการแบ่งพาร์ติชัน k-medoids แบบคลาสสิก เช่น PAM ทำงานอย่างมีประสิทธิภาพสำหรับชุดข้อมูลขนาดเล็ก แต่ไม่สามารถปรับขยายได้ดีสำหรับชุดข้อมูลขนาดใหญ่ สามารถใช้จัดการกับชุดข้อมูลที่สูงกว่า ซึ่งใช้วิธีสุ่มตัวอย่างที่เรียกว่า CLARA (Clustering Large Applications) แนวทางเบื้องหลังของคลาร่ามีดังนี้ ห
Chameleon เป็นอัลกอริธึมการจัดกลุ่มแบบลำดับชั้นที่ใช้การสร้างแบบจำลองแบบไดนามิกเพื่อตัดสินความคล้ายคลึงกันระหว่างคู่ของคลัสเตอร์ มีการเปลี่ยนแปลงโดยอิงจากจุดอ่อนที่สังเกตได้ของอัลกอริธึมการจัดกลุ่มแบบลำดับชั้น 2 แบบ เช่น ROCK และ CURE ROCK และการออกแบบที่เกี่ยวข้องจะเน้นที่การเชื่อมต่อระหว่างคลัสเตอ
วิธีการจัดกลุ่มตามตารางใช้โครงสร้างข้อมูลกริดที่มีความละเอียดหลายระดับ กำหนดปริมาณพื้นที่วัตถุให้เป็นเซลล์จำนวนจำกัดที่สร้างโครงสร้างกริดซึ่งการดำเนินการทั้งหมดสำหรับการจัดกลุ่มจะถูกนำไปใช้ ประโยชน์ของวิธีการคือใช้เวลาประมวลผลที่รวดเร็ว ซึ่งโดยทั่วไปแล้วจะไม่ขึ้นกับจำนวนของออบเจ็กต์ข้อมูล ยังคงขึ้นอ
การทำเหมืองข้อมูลเป็นกระบวนการในการค้นหาความสัมพันธ์ รูปแบบ และแนวโน้มใหม่ที่เป็นประโยชน์ โดยการถ่ายโอนข้อมูลจำนวนมากที่บันทึกไว้ในที่เก็บ โดยใช้เทคโนโลยีการจดจำรูปแบบ รวมทั้งเทคนิคทางสถิติและคณิตศาสตร์ เป็นการวิเคราะห์ชุดข้อมูลที่เป็นข้อเท็จจริงเพื่อค้นหาความสัมพันธ์ที่ไม่สงสัย และเพื่อสรุปบันทึกด้
KDD แสดงถึงการค้นพบความรู้ในฐานข้อมูล กำหนดกระบวนการกว้างๆ ในการค้นหาความรู้ในข้อมูล และเน้นการใช้งานระดับสูงของเทคนิคการทำเหมืองข้อมูลที่แน่นอน เป็นพื้นที่ที่น่าสนใจสำหรับนักวิจัยในหลายสาขา เช่น ปัญญาประดิษฐ์ แมชชีนเลิร์นนิง การจดจำรูปแบบ ฐานข้อมูล สถิติ การได้มาซึ่งความรู้สำหรับระบบมืออาชีพ และการ
KDD แสดงถึงการค้นพบความรู้ในฐานข้อมูล กำหนดกระบวนการกว้างๆ ในการค้นหาความรู้ในข้อมูลและเน้นการใช้งานระดับสูงของเทคนิคการทำเหมืองข้อมูลที่แน่นอน เป็นพื้นที่ที่น่าสนใจสำหรับนักวิจัยในหลายสาขา เช่น ปัญญาประดิษฐ์ แมชชีนเลิร์นนิง การจดจำรูปแบบ ฐานข้อมูล สถิติ การได้มาซึ่งความรู้สำหรับระบบมืออาชีพ และการแ
มีปัญหาการโต้ตอบกับผู้ใช้หลายอย่างที่เกี่ยวข้องกับวิธีการทำเหมืองข้อมูลซึ่งมีดังต่อไปนี้ - การขุดความรู้ประเภทต่างๆ ในฐานข้อมูล − ผู้ใช้แต่ละคนสามารถสนใจความรู้ประเภทต่างๆ ได้ ดังนั้น การทำเหมืองข้อมูลจึงต้องครอบคลุมการวิเคราะห์ข้อมูลและงานค้นหาความรู้ในวงกว้าง ซึ่งเกี่ยวข้องกับการกำหนดลักษณะข้อมูล
การทำเหมืองข้อมูลเป็นรูปแบบหนึ่งของปัญญาประดิษฐ์ที่ใช้แบบจำลองการรับรู้ แบบจำลองการวิเคราะห์ และอัลกอริธึมที่หลากหลายเพื่อจำลองเทคนิคของสมองมนุษย์ การทำเหมืองข้อมูลสนับสนุนเครื่องจักรในการตัดสินใจของมนุษย์และสร้างทางเลือกของมนุษย์ ผู้ใช้เครื่องมือการทำเหมืองข้อมูลจะต้องกำหนดกฎเกณฑ์ของเครื่องจักร กา
การทำเหมืองข้อมูลเป็นกระบวนการในการค้นหาความสัมพันธ์ รูปแบบ และแนวโน้มใหม่ที่เป็นประโยชน์ โดยการถ่ายโอนข้อมูลจำนวนมากที่บันทึกไว้ในที่เก็บ โดยใช้เทคโนโลยีการจดจำรูปแบบ รวมทั้งเทคนิคทางสถิติและคณิตศาสตร์ เป็นการวิเคราะห์ชุดข้อมูลที่เป็นข้อเท็จจริงเพื่อค้นหาความสัมพันธ์ที่ไม่สงสัย และเพื่อสรุปบันทึกด้
การทำเหมืองข้อมูลมีความท้าทายหลายประการ ดังนี้ - ประสิทธิภาพและความสามารถในการปรับขนาดของอัลกอริธึมการทำเหมืองข้อมูล − มันสามารถดึงข้อมูลจากข้อมูลจำนวนมากในฐานข้อมูลได้อย่างมีประสิทธิภาพ อัลกอริธึมการค้นพบความรู้ควรมีประสิทธิภาพและสามารถปรับขนาดได้จนถึงฐานข้อมูลขนาดใหญ่ โดยเฉพาะอย่างยิ่ง เวลาทำงานข
กระบวนการรวมชุดของวัตถุทางกายภาพหรือนามธรรมเข้าในคลาสของวัตถุเดียวกันนั้นเรียกว่าการจัดกลุ่ม คลัสเตอร์คือชุดของออบเจ็กต์ข้อมูลที่เหมือนกันภายในคลัสเตอร์เดียวกันและแตกต่างจากออบเจ็กต์ในคลัสเตอร์อื่น คลัสเตอร์ของออบเจ็กต์ข้อมูลสามารถพิจารณารวมกันเป็นกลุ่มเดียวในหลายแอปพลิเคชัน การวิเคราะห์คลัสเตอร์เป็
มีแอพพลิเคชั่นต่างๆ ของคลัสเตอร์ซึ่งมีดังต่อไปนี้ - ความสามารถในการปรับขนาด − อัลกอริทึมการจัดกลุ่มบางตัวทำงานได้ดีในชุดข้อมูลขนาดเล็ก รวมถึงอ็อบเจ็กต์ข้อมูลน้อยกว่า 200 รายการ อย่างไรก็ตาม ฐานข้อมูลขนาดใหญ่สามารถรวมอ็อบเจ็กต์นับล้านได้ การจัดกลุ่มตัวอย่างของชุดข้อมูลขนาดใหญ่ที่กำหนดอาจนำไปสู่ผลล
มีหลายวิธีในการจัดกลุ่มซึ่งมีดังต่อไปนี้ - วิธีการแบ่งพาร์ติชัน − ให้ฐานข้อมูลของ n อ็อบเจ็กต์หรือข้อมูล tuples วิธีการแบ่งพาร์ติชั่นจะประกอบ k พาร์ติชั่นของข้อมูล โดยที่แต่ละพาร์ติชั่นกำหนดคลัสเตอร์ และ k
HOLAP แสดงถึง Hybrid OLAP มันสามารถจัดการการแลกเปลี่ยนระหว่างความสามารถในการปรับขนาดของ ROLAP และการใช้งานแบบสอบถามของ MOLAP เซิร์ฟเวอร์ OLAP เชิงพาณิชย์บางตัวขึ้นอยู่กับวิธี HOLAP ในกรณีนี้ ผู้ใช้กำหนดว่าส่วนใดของข้อมูลที่จะบันทึกใน MOLAP และส่วนใดใน ROLAP ตัวอย่างเช่น โดยทั่วไป ข้อมูลระดับต่ำจะถูก
ตัวกรองบิตแมปจะมีประโยชน์ก็ต่อเมื่อได้รับการคัดเลือก เครื่องมือเพิ่มประสิทธิภาพการสืบค้นจะตัดสินใจว่าเมื่อใดตัวกรองบิตแมปที่ปรับให้เหมาะสมได้รับการคัดเลือกเพียงพอที่จะเป็นประโยชน์และตัวดำเนินการใดที่ตัวกรองจะถูกใช้ ฟิลด์เครื่องมือเพิ่มประสิทธิภาพตัวกรองบิตแมปที่ปรับให้เหมาะสมในทุกแผนกของการเข้าร่วมส