หน้าแรก
หน้าแรก
ROC ย่อมาจากลักษณะการทำงานของผู้รับ เส้นโค้ง ROC เป็นเครื่องมือภาพที่สะดวกสำหรับการวิเคราะห์แบบจำลองการจำแนกประเภทสองแบบ เส้นโค้ง ROC ปรากฏขึ้นจากทฤษฎีการตรวจจับสัญญาณที่เกิดขึ้นในช่วงสงครามโลกครั้งที่ 2 เพื่อค้นหาภาพเรดาร์ เส้นโค้ง ROC แสดงการแลกเปลี่ยนระหว่างอัตราบวกจริงหรือความไว (สัดส่วนของสิ่ง
ตัวแปรสเกลตามช่วงเวลาเป็นข้อมูลต่อเนื่องของสเกลเชิงเส้นโดยประมาณ ตัวอย่าง เช่น น้ำหนักและส่วนสูง พิกัดละติจูดและลองจิจูด (เช่น เมื่อจัดกลุ่มบ้าน) และอุณหภูมิสภาพอากาศ หน่วยวัดที่ใช้สามารถส่งผลต่อการวิเคราะห์การจัดกลุ่มได้ ตัวอย่างเช่น การเปลี่ยนหน่วยข้อมูลจากเมตรเป็นนิ้วสำหรับความสูง หรือจากกิโลกรั
ตัวแปรไบนารีมีเพียงสองสถานะเช่น 0 หรือ 1 โดยที่ 0 กำหนดว่าไม่มีตัวแปรและ 1 กำหนดว่ามีอยู่ เมื่อพิจารณาจากตัวแปรผู้สูบบุหรี่ที่กำหนดผู้ป่วย ตัวอย่างเช่น 1 แสดงว่าผู้ป่วยสูบบุหรี่ ในขณะที่ 0 แสดงว่าผู้ป่วยไม่สูบบุหรี่ การพิจารณาตัวแปรไบนารีเสมือนว่ามีการปรับขนาดตามช่วงเวลาสามารถนำไปสู่ผลลัพธ์การจัดกลุ
อัลกอริธึม k-means สร้างพารามิเตอร์อินพุต k และแบ่งกลุ่มของอ็อบเจ็กต์ n รายการออกเป็น k คลัสเตอร์ เพื่อให้ความคล้ายคลึงใน intracluster มีขนาดใหญ่ แต่การเปรียบเทียบระหว่างคลัสเตอร์มีค่าต่ำ ความคล้ายคลึงของคลัสเตอร์คำนวณจากค่าเฉลี่ยของวัตถุในกระจุก ซึ่งสามารถมองได้ว่าเป็นเซนทรอยด์หรือจุดศูนย์ถ่วงของคล
ROCK ย่อมาจาก Robust Clustering โดยใช้ลิงก์ เป็นอัลกอริธึมการจัดกลุ่มแบบลำดับชั้นที่วิเคราะห์แนวคิดของลิงก์ (จำนวนเพื่อนบ้านทั่วไปในสองอ็อบเจ็กต์) สำหรับข้อมูลที่มีแอตทริบิวต์หมวดหมู่ แสดงว่าข้อมูลระยะทางดังกล่าวไม่สามารถนำไปสู่คลัสเตอร์คุณภาพสูงเมื่อจัดกลุ่มข้อมูลหมวดหมู่ นอกจากนี้ อัลกอริธึมการทำ
DBSCAN ย่อมาจาก Density-Based Spatial Clustering of Applications with Noise เป็นอัลกอริทึมการจัดกลุ่มตามความหนาแน่น อัลกอริธึมจะเพิ่มพื้นที่ที่มีความหนาแน่นสูงเพียงพอในคลัสเตอร์ และค้นหาคลัสเตอร์ของสถาปัตยกรรมตามอำเภอใจในฐานข้อมูลเชิงพื้นที่ที่มีสัญญาณรบกวน แสดงถึงคลัสเตอร์เป็นกลุ่มสูงสุดของจุดที่เช
การทำคลัสเตอร์เป็นแนวทางการทำเหมืองข้อมูลที่สำคัญสำหรับการค้นพบความรู้ การจัดกลุ่มเป็นวิธีการวิเคราะห์ข้อมูลเชิงสำรวจที่จัดหมวดหมู่ออบเจ็กต์ข้อมูลหลายรายการให้อยู่ในกลุ่มเดียวกัน เช่น คลัสเตอร์ DENCLUE แสดงถึงการทำคลัสเตอร์ตามความหนาแน่น เป็นวิธีการจัดกลุ่มขึ้นอยู่กับกลุ่มของฟังก์ชันการกระจายความหน
STING ย่อมาจาก Statistical Information Grid STING เป็นวิธีการจัดกลุ่มแบบหลายความละเอียดตามตาราง ซึ่งพื้นที่เชิงพื้นที่แบ่งออกเป็นเซลล์สี่เหลี่ยม มีหลายวิธีของเซลล์รูปสี่เหลี่ยมผืนผ้าที่เทียบเท่ากับวิธีการแก้ปัญหาหลายวิธี และเซลล์เหล่านี้สร้างโครงสร้างแบบลำดับชั้น แต่ละเซลล์ในระดับสูงจะแยกออกเป็นหลาย
ในแนวทางที่ไร้เดียงสา มันสามารถขุดชุดไอเท็มที่ใช้บ่อยทั้งชุด จากนั้นจึงลบชุดไอเท็มที่ใช้บ่อยซึ่งเป็นชุดย่อยที่เหมาะสม และให้การสนับสนุนที่คล้ายกันกับชุดไอเท็มที่ใช้บ่อยในปัจจุบัน วิธีนี้สามารถได้มา 2100 −1 ชุดไอเท็มที่ใช้บ่อยเพื่อให้ได้ชุดไอเท็มที่มีความยาว -100 ทั้งหมดก่อนที่จะเริ่มลบชุดไอเท็มซ้ำซ
มีขั้นตอนที่เกี่ยวข้องกับระบบการจัดกลุ่มกฎการเชื่อมโยงดังต่อไปนี้ - ถังเก็บ − คุณลักษณะเชิงปริมาณสามารถมีค่าต่างๆ มากมายที่แสดงถึงโดเมนของพวกเขา สามารถคิดได้ว่าตาราง 2 มิติจะใหญ่แค่ไหนหากสามารถพล็อตอายุและรายได้เป็นแกน โดยที่ค่าอายุที่เป็นไปได้ทุกค่าจะถูกสร้างขึ้นในตำแหน่งเฉพาะบนแกนเดียว และเช่นเดี
ขั้นตอนการทำเหมืองข้อมูลสามารถเปิดเผยกฎหลายพันข้อจากชุดข้อมูลที่กำหนด ซึ่งส่วนใหญ่จบลงด้วยความเป็นอิสระหรือสร้างความยุ่งยากให้กับผู้ใช้ ผู้ใช้จะเข้าใจได้ดีที่สุดว่า ทิศทาง ของการขุดสามารถนำไปสู่รูปแบบที่น่าสนใจและ รูปแบบ ของรูปแบบหรือกฎเกณฑ์ที่พวกเขาต้องการค้นพบได้ ดังนั้น ฮิวริสติกที่ดีคือการให้ผู
การทำเหมืองข้อมูลเป็นกระบวนการในการค้นหาความสัมพันธ์ รูปแบบ และแนวโน้มใหม่ที่เป็นประโยชน์ โดยการถ่ายโอนข้อมูลจำนวนมากที่บันทึกไว้ในที่เก็บ โดยใช้เทคโนโลยีการจดจำรูปแบบ รวมทั้งเทคนิคทางสถิติและคณิตศาสตร์ เป็นการวิเคราะห์ชุดข้อมูลที่เป็นข้อเท็จจริงเพื่อค้นหาความสัมพันธ์ที่ไม่สงสัย และเพื่อสรุปบันทึกด้
ข้อจำกัดของกฎสามารถจำแนกได้เป็นห้าองค์ประกอบดังต่อไปนี้ - แอนติโมโนโทนิก − องค์ประกอบแรกของข้อจำกัดคือ antimonotonic พิจารณาข้อจำกัดของกฎ “ผลรวม (I.price) ≤ 100” พิจารณาว่ากำลังใช้เฟรมเวิร์ก Apriori ซึ่งทุกครั้งที่ทำซ้ำ k จะวิเคราะห์ชุดรายการของขนาด k หากผลรวมต้นทุนของไอเท็มในชุดไอเท็มมีค่าไม่น้อยก
การจัดประเภทเป็นวิธีการทำเหมืองข้อมูลที่กำหนดองค์ประกอบให้กับชุดข้อมูลเพื่อช่วยในการคาดการณ์และการวิเคราะห์ที่มีประสิทธิภาพมากขึ้น โดยทั่วไปการจัดประเภทจะใช้เมื่อมีคลาสเป้าหมายสองคลาสที่เรียกว่าการจำแนกไบนารี เมื่อสามารถทำนายได้สูงกว่าสองคลาส โดยเฉพาะอย่างยิ่งในปัญหาการรู้จำรูปแบบ นี่หมายถึงการจำแน
การเหนี่ยวนำแผนผังการตัดสินใจคือการเรียนรู้แผนผังการตัดสินใจจาก tupple การฝึกอบรมที่มีป้ายกำกับในชั้นเรียน แผนผังการตัดสินใจเป็นโครงสร้างแบบต้นไม้ที่มีลักษณะเหมือนไดอะแกรมตามลำดับ โดยที่โหนดภายใน (โหนดที่ไม่ใช่โหนด) ทุกโหนดจะระบุถึงการทดสอบแอตทริบิวต์ แต่ละสาขาจะกำหนดผลลัพธ์ของการทดสอบ และโหนดปลายสุ
การวัดการเลือกแอตทริบิวต์เป็นแบบฮิวริสติกสำหรับการเลือกการทดสอบการแยกที่ ดีที่สุด แยกพาร์ติชั่นข้อมูล D ที่กำหนดของ tupple การฝึกที่ติดป้ายกำกับคลาสออกเป็นคลาสเดียว หากสามารถแบ่ง D เป็นพาร์ติชั่นขนาดเล็กลงตามผลลัพธ์ของเกณฑ์การแยก ทุกพาร์ติชั่นควรจะบริสุทธิ์ (เช่น ทูเพิลบางตัวที่อยู่ในพาร์ติชั่นที่ก
ตัวแยกประเภทแบบเบย์เป็นตัวแยกประเภททางสถิติ พวกเขาสามารถทำนายความน่าจะเป็นของการเป็นสมาชิกชั้นเรียน รวมถึงความน่าจะเป็นที่กลุ่มตัวอย่างที่กำหนดเป็นของชั้นเรียนเฉพาะ ตัวแยกประเภทแบบเบย์ยังแสดงประสิทธิภาพและความเร็วขนาดใหญ่เมื่อสามารถฐานข้อมูลสูงได้ เมื่อกำหนดคลาสแล้ว ระบบควรอนุมานกฎที่ควบคุมการจัดปร
Backpropagation กำหนดขั้นตอนทั้งหมดที่ครอบคลุมทั้งการคำนวณการไล่ระดับสีและความจำเป็นในการโคตรเกรเดียนต์สุ่ม ในทางเทคนิคแล้ว Backpropagation จะใช้ในการคำนวณความลาดชันของข้อผิดพลาดของเครือข่ายตามน้ำหนักที่ปรับเปลี่ยนได้ของเครือข่าย ลักษณะของ Backpropagation คือวิธีการแบบวนซ้ำ แบบเรียกซ้ำ และมีประสิทธ
คลังข้อมูลเป็นแนวทางที่สามารถรวบรวมและจัดการข้อมูลจากหลายแหล่งเพื่อสนับสนุนธุรกิจที่มีความเข้าใจอย่างลึกซึ้งทางธุรกิจ คลังข้อมูลถูกสร้างขึ้นโดยเฉพาะสำหรับเป้าหมายของการตัดสินใจในการจัดการการสนับสนุน คลังข้อมูลกำหนดฐานข้อมูลที่ดูแลแยกต่างหากจากฐานข้อมูลการดำเนินงานของบริษัท ระบบคลังข้อมูลช่วยให้สามา
การสำรวจที่ขับเคลื่อนด้วยการค้นพบเป็นวิธีการสำรวจลูกบาศก์ ในการสำรวจที่ขับเคลื่อนด้วยการค้นพบ การวัดล่วงหน้าซึ่งระบุข้อยกเว้นของข้อมูลจะใช้เพื่อเป็นแนวทางให้ผู้ใช้ในกระบวนการวิเคราะห์ข้อมูล ในทุกระดับของการรวม โดยอ้างถึงมาตรการเหล่านี้เป็นตัวบ่งชี้ข้อยกเว้น ตามสัญชาตญาณ ข้อยกเว้นคือค่าเซลล์คิวบ์ข้อ