Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การทำเหมืองข้อมูล Weka คืออะไร?


Weka คือชุดของอัลกอริธึมการเรียนรู้ของเครื่องสำหรับบริการขุดข้อมูล อัลกอริทึมสามารถใช้โดยตรงกับชุดข้อมูลหรือจากโปรแกรม Java ของคุณเอง ประกอบด้วยเครื่องมือสำหรับการประมวลผลข้อมูลล่วงหน้า การจัดประเภท การถดถอย การจัดกลุ่ม กฎการเชื่อมโยง และการแสดงภาพ นอกจากนี้ยังใช้ได้กับการสร้างแผนการเรียนรู้ของเครื่องใหม่ด้วย

วิธีหนึ่งในการใช้ Weka คือการใช้วิธีการเรียนรู้กับชุดข้อมูลและวิเคราะห์ผลลัพธ์เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับบันทึก อย่างที่สองคือต้องใช้โมเดลที่เรียนรู้เพื่อคาดการณ์อินสแตนซ์ใหม่

ประการที่สามคือการใช้ผู้เรียนหลายคนและเปรียบเทียบผลการปฏิบัติงานของพวกเขาเพื่อเลือกหนึ่งรายการสำหรับการทำนาย ในอินเทอร์เฟซ Weka แบบโต้ตอบ มันสามารถเลือกวิธีการเรียนรู้ที่จำเป็นจากเมนู หลายวิธีมีพารามิเตอร์ที่ปรับได้ ซึ่งสามารถสร้างผ่านแผ่นคุณสมบัติหรือตัวแก้ไขอ็อบเจ็กต์ โครงสร้างการคำนวณทั่วไปใช้เพื่อคำนวณประสิทธิภาพของตัวแยกประเภททั้งหมด

แสดงวิธีใช้ตัวกรองต่างๆ แสดงรายการอัลกอริทึมการกรอง และอธิบายพารามิเตอร์ Weka ยังรวมถึงการปรับใช้อัลกอริทึมสำหรับกฎการเชื่อมโยงการเรียนรู้ การจัดกลุ่มข้อมูลที่ไม่ได้ระบุค่าของคลาส และการเลือกแอตทริบิวต์ที่เกี่ยวข้องในข้อมูล

วิธีที่ง่ายที่สุดในการใช้ Weka คือการใช้อินเทอร์เฟซผู้ใช้แบบกราฟิกที่เรียกว่า Explorer ซึ่งช่วยให้สามารถเข้าถึงสิ่งอำนวยความสะดวกบางอย่างโดยใช้การเลือกเมนูและการกรอกแบบฟอร์ม ตัวอย่างเช่น สามารถอ่านได้อย่างรวดเร็วในชุดข้อมูลจากเอกสาร ARFF (หรือสเปรดชีต) และสร้างแผนผังการตัดสินใจจากข้อมูลนั้น

อินเทอร์เฟซของ Explorer ช่วยให้เรานำเสนอตัวเลือกต่างๆ เป็นเมนู บังคับให้เราทำงานตามลำดับที่เหมาะสม โดยทำให้ตัวเลือกเป็นสีเทาจนกว่าจะเหมาะสม และแสดงตัวเลือกต่างๆ เป็นแบบฟอร์มที่ต้องกรอก คำแนะนำเครื่องมือที่เป็นประโยชน์จะปรากฏขึ้นเมื่อเมาส์เลื่อนผ่านองค์ประกอบต่างๆ บนหน้าจอเพื่อทำความเข้าใจกับสิ่งที่ทำ ค่าเริ่มต้นที่สมเหตุสมผลระบุว่าสามารถได้ผลลัพธ์โดยใช้ความพยายามขั้นต่ำ แต่จะต้องคิดว่ามันคืออะไรเพื่อทำความเข้าใจว่าผลลัพธ์นั้นหมายถึงอะไร

อินเทอร์เฟซของ Knowledge Flow ช่วยให้เราสร้างโครงสร้างสำหรับการประมวลผลข้อมูลแบบสตรีมได้ ข้อจำกัดของอินเทอร์เฟซ Explorer คือมันมีผลกับทุกอย่างในหน่วยความจำหลักเมื่อสามารถเปิดชุดข้อมูลได้ และโหลดทั้งหมดเข้าไปโดยตรง

ซึ่งหมายความว่า Explorer สามารถใช้สำหรับปัญหาขนาดเล็กถึงขนาดกลาง อย่างไรก็ตาม Weka มีอัลกอริธึมส่วนเพิ่มบางส่วนที่สามารถใช้ในการประมวลผลชุดข้อมูลขนาดใหญ่ อินเทอร์เฟซของ Knowledge Flow ช่วยให้เราลากกล่องที่กำหนดอัลกอริทึมการเรียนรู้และแหล่งข้อมูลไปรอบๆ หน้าจอ แล้วเชื่อมต่อเข้ากับการกำหนดค่าที่ต้องการได้

ช่วยให้เราสามารถกำหนดสตรีมข้อมูลโดยเชื่อมต่อส่วนประกอบที่กำหนดแหล่งข้อมูล เครื่องมือประมวลผลล่วงหน้า อัลกอริธึมการเรียนรู้ วิธีการคำนวณ และโมดูลการแสดงภาพ หากตัวกรองและอัลกอริธึมการเรียนรู้เพียงพอสำหรับการเรียนรู้ที่เพิ่มขึ้น ข้อมูลจะถูกโหลดและประมวลผลเพิ่มเติม