Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

โมเดลการทำเหมืองข้อมูลมีกี่ประเภท?


การทำเหมืองข้อมูลเป็นกระบวนการในการค้นหาความสัมพันธ์ รูปแบบ และแนวโน้มใหม่ที่เป็นประโยชน์ โดยการถ่ายโอนข้อมูลจำนวนมากที่บันทึกไว้ในที่เก็บ โดยใช้เทคโนโลยีการจดจำรูปแบบ รวมทั้งเทคนิคทางสถิติและคณิตศาสตร์ เป็นการวิเคราะห์ชุดข้อมูลที่เป็นข้อเท็จจริงเพื่อค้นหาความสัมพันธ์ที่ไม่สงสัย และเพื่อสรุปบันทึกด้วยวิธีใหม่ที่มีทั้งเหตุผลและเป็นประโยชน์ต่อเจ้าของข้อมูล

เทคนิคการทำเหมืองข้อมูลสามารถใช้เพื่อสร้างแบบจำลอง 3 ประเภทสำหรับงาน 3 ประเภท เช่น การทำโปรไฟล์เชิงพรรณนา การทำโปรไฟล์แบบกำหนดทิศทาง และการคาดการณ์

โปรไฟล์เชิงพรรณนา − แบบจำลองเชิงพรรณนากำหนดสิ่งที่อยู่ในบันทึก ผลลัพธ์คือแผนภูมิหรือตัวเลขหรือกราฟิกหลายรายการที่กำหนดสิ่งที่เกิดขึ้น การทดสอบสมมติฐานทำให้แบบจำลองเชิงพรรณนา ในอีกแง่หนึ่ง ทั้งการทำโปรไฟล์โดยตรงและการคาดคะเนมีวัตถุประสงค์ในใจเมื่อสร้างแบบจำลอง

ในโมเดลการทำโปรไฟล์ โฟกัสจะมาจากกรอบเวลาที่ใกล้เคียงกับอินพุต ในรูปแบบการคาดการณ์ โฟกัสจะมาจากกรอบเวลาถัดไป การทำนายกำหนดการค้นพบการออกแบบในข้อมูลจากช่วงเวลาหนึ่งที่สามารถกำหนดผลลัพธ์ในช่วงเวลาถัดไป เหตุผลในการทำให้ความแตกต่างระหว่างการทำโปรไฟล์และการคาดคะเนที่เข้มข้นขึ้นคือ มีความเกี่ยวข้องกับวิธีการสร้างแบบจำลอง โดยเฉพาะการวิเคราะห์เวลาในการก่อตัวของชุดแบบจำลอง

การจัดทำโปรไฟล์โดยตรง − การทำโปรไฟล์เป็นวิธีที่คุ้นเคยสำหรับปัญหามากมาย ไม่จำเป็นต้องเกี่ยวข้องกับการวิเคราะห์ข้อมูลที่ซับซ้อน ตัวอย่างเช่น แบบสำรวจเป็นวิธีหนึ่งที่ใช้กันทั่วไปในการสร้างโปรไฟล์ลูกค้า แบบสำรวจเผยให้เห็นว่าลูกค้าและผู้มีแนวโน้มจะเป็นเช่นไร หรืออย่างน้อยก็เป็นวิธีที่ผู้ตอบแบบสำรวจตอบคำถาม

โปรไฟล์มักขึ้นอยู่กับตัวแปรทางประชากร เช่น ที่ตั้งทางภูมิศาสตร์ เพศ และอายุ เนื่องจากโฆษณาขายตามตัวแปรเดียวกันนี้ โปรไฟล์ประชากรจึงสามารถเปลี่ยนเป็นกลยุทธ์สื่อได้โดยตรง

การทำนาย − การทำโปรไฟล์ใช้ข้อมูลจากอดีตเพื่ออธิบายสิ่งที่เกิดขึ้นในอดีต การทำนายก้าวไปอีกขั้นหนึ่ง การทำนายใช้ข้อมูลจากอดีตเพื่อทำนายสิ่งที่น่าจะเกิดขึ้นในอนาคต นี่คือการใช้ข้อมูลแบบไดนามิก

แม้ว่าความสัมพันธ์ระหว่างยอดคงเหลือในการจัดเก็บที่ต่ำกับการเป็นเจ้าของซีดีจะไม่เป็นประโยชน์ต่อโปรไฟล์ของผู้ถือซีดี แต่การมียอดคงเหลือในการจัดเก็บที่สูงนั้นมีแนวโน้ม (เมื่อใช้ร่วมกับตัวบ่งชี้อื่นๆ) เป็นตัวทำนายการซื้อซีดีในอนาคต

กำลังสร้างแบบจำลองการคาดการณ์ต้องใช้เวลาระหว่างอินพุตของโมเดลหรือตัวทำนายและเอาต์พุตของโมเดล ซึ่งเป็นสิ่งที่ต้องคาดการณ์ หากไม่รองรับพาร์ติชั่นนี้ โมเดลจะไม่ทำงาน