Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

ทำไมเราถึงต้องการ KDD?


เทคนิคดั้งเดิมในการเปลี่ยนข้อมูลให้เป็นความรู้ขึ้นอยู่กับการวิเคราะห์และการตีความโดยเจ้าหน้าที่ ตัวอย่างเช่น ในอุตสาหกรรมการดูแลสุขภาพ ผู้เชี่ยวชาญจะคุ้นเคยในการวิเคราะห์แนวโน้มในปัจจุบันและการเปลี่ยนแปลงข้อมูลด้านการดูแลสุขภาพอย่างเป็นระบบทุกไตรมาส

ผู้เชี่ยวชาญสนับสนุนรายงานที่มีรายละเอียดการวิเคราะห์ไปยังองค์กรด้านการดูแลสุขภาพที่ให้การสนับสนุน รายงานนี้จะกลายเป็นพื้นฐานสำหรับการตัดสินใจและการวางแผนในอนาคตสำหรับการจัดการด้านการดูแลสุขภาพ มีการใช้งานหลายประเภท รวมถึงนักธรณีวิทยาของดาวเคราะห์ที่ลอดผ่านภาพถ่ายของดาวเคราะห์และดาวเคราะห์น้อยที่ตรวจจับได้จากระยะไกล กำหนดตำแหน่งและจัดหมวดหมู่วัตถุทางธรณีวิทยาที่น่าสนใจเช่นหลุมอุกกาบาตอย่างระมัดระวัง

รูปแบบการตรวจสอบชุดข้อมูลด้วยตนเองนี้ช้า ราคาสูง และเป็นส่วนตัวสูง เนื่องจากปริมาณข้อมูลมีปริมาณมาก การวิเคราะห์ข้อมูลด้วยตนเองประเภทนี้จึงกลายเป็นสิ่งที่ทำไม่ได้อย่างสมบูรณ์ในหลายโดเมน

ในธุรกิจ พื้นที่แอปพลิเคชัน KDD หลักประกอบด้วยการตลาด การเงิน (โดยเฉพาะการลงทุน) การตรวจจับการฉ้อโกง การผลิต โทรคมนาคม และตัวแทนเว็บ

การตลาด − ในด้านการตลาด แอปพลิเคชันพื้นฐานคือระบบการตลาดฐานข้อมูล ซึ่งวิเคราะห์ฐานข้อมูลลูกค้าเพื่อจำแนกกลุ่มลูกค้าหลายกลุ่มและคาดการณ์พฤติกรรมของพวกเขา

การลงทุน − หลายบริษัทใช้การขุดข้อมูลเพื่อการลงทุน แต่ส่วนใหญ่ไม่ได้เป็นตัวแทนของระบบของตน ข้อยกเว้นประการหนึ่งคือ LBS Capital Management ระบบใช้ระบบระดับมืออาชีพ โครงข่ายประสาท และอัลกอริธึมทางพันธุกรรมเพื่อจัดการพอร์ตโฟลิโอรวม 600 ล้านดอลลาร์ นับตั้งแต่เริ่มดำเนินการในปี 2536 ระบบได้แสดงผลงานเหนือกว่าตลาดหุ้นในวงกว้าง

การตรวจจับการฉ้อโกง − ระบบ HNC Falcon และ Nestor PRISM ใช้สำหรับตรวจสอบการฉ้อโกงบัตรเครดิต ดูแลบัญชีกว่าล้านบัญชี ระบบ FAIS จาก U.S. Treasury Financial Crimes Enforcement Network สามารถระบุธุรกรรมทางการเงินที่สามารถระบุกิจกรรมการฟอกเงินได้

การผลิต − ระบบการแก้ไขปัญหาของ CASSIOPEE ซึ่งพัฒนาขึ้นโดยเป็นส่วนหนึ่งของการร่วมทุนระหว่าง General Electric และ SNECMA สายการบินหลักๆ ของยุโรป 3 สายการบินใช้เพื่อวินิจฉัยและคาดการณ์ปัญหาของเครื่องบินโบอิ้ง 737

โทรคมนาคม − เครื่องวิเคราะห์ลำดับการเตือนภัยโทรคมนาคม (TASA) ได้รับการพัฒนาร่วมกับผู้ผลิตอุปกรณ์โทรคมนาคมและเครือข่ายโทรศัพท์สามเครือข่าย (Mannila, Toivonen และ Verkamo 1995) ระบบใช้โครงสร้างพื้นฐานใหม่เพื่อค้นหาตอนของการเตือนภัยที่เกิดขึ้นบ่อยครั้งจากสตรีมการเตือนและแสดงเป็นกฎ

มีกฎจำนวนมากที่ค้นพบซึ่งสามารถสำรวจได้ด้วยเครื่องมือดึงข้อมูลที่ยืดหยุ่นซึ่งมีการโต้ตอบและการทำซ้ำ ในวิธีนี้ TASA จะจัดเตรียมอุปกรณ์ตัดแต่งกิ่ง จัดกลุ่ม และจัดลำดับอุปกรณ์เพื่อปรับแต่งผลลัพธ์ของการค้นหากฎโดยใช้กำลังเดรัจฉานขั้นพื้นฐาน

การล้างข้อมูล − ระบบ MERGE-PURGE ใช้สำหรับระบุการเรียกร้องสวัสดิการที่ซ้ำกัน (Hernandez and Stolfo 1995) มีการใช้อย่างมากกับข้อมูลจากกรมสวัสดิการแห่งรัฐวอชิงตัน