หน้าแรก
หน้าแรก
การเรียนรู้กฎการเชื่อมโยงเป็นเทคนิคการเรียนรู้แบบไม่มีผู้ดูแลที่ทดสอบการพึ่งพาองค์ประกอบข้อมูลหนึ่งกับองค์ประกอบข้อมูลอื่นและออกแบบอย่างเหมาะสมเพื่อให้มีความคุ้มค่ามากขึ้น จะพยายามค้นหาความสัมพันธ์หรือความสัมพันธ์ที่น่าสนใจระหว่างตัวแปรของชุดข้อมูล ขึ้นอยู่กับกฎเกณฑ์ต่างๆ เพื่อค้นหาความสัมพันธ์ที่น่
การทำเหมืองข้อมูลเป็นขั้นตอนของการค้นหาความสัมพันธ์ รูปแบบ และแนวโน้มใหม่ที่เป็นประโยชน์ โดยการถ่ายโอนผ่านระเบียนจำนวนมากที่บันทึกไว้ในที่เก็บ โดยใช้เทคโนโลยีการจดจำรูปแบบ รวมทั้งเทคนิคทางสถิติและตัวเลข เป็นการวิเคราะห์ชุดข้อมูลที่เป็นข้อเท็จจริงเพื่อค้นหาความสัมพันธ์ที่ไม่สงสัย และเพื่อสรุปบันทึกด้
ETL ย่อมาจาก Extract, transform และ Load เป็นกระบวนการที่องค์กรที่ขับเคลื่อนด้วยข้อมูลใช้เพื่อรวบรวมข้อมูลจากแหล่งต่างๆ แล้วนำมารวมกันเพื่อสนับสนุนการค้นพบ การรายงาน การวิเคราะห์ และการตัดสินใจ แหล่งข้อมูลอาจแตกต่างกันในรูปแบบ รูปแบบ ปริมาณ และความน่าเชื่อถือ ดังนั้นข้อมูลที่จำเป็นต้องได้รับการประม
ELT ย่อมาจาก Extract, Load และ Transform เป็นกระบวนการรวมข้อมูลสำหรับการถ่ายโอนข้อมูลดิบจากเซิร์ฟเวอร์ต้นทางไปยังระบบข้อมูล (เช่น คลังข้อมูลหรือ Data Lake) บนเซิร์ฟเวอร์เป้าหมาย จากนั้นจึงปรับข้อมูลให้เหมาะสมสำหรับการใช้งานปลายทาง ขั้นตอนการแยกและโหลดสามารถแยกได้จากขั้นตอนการเปลี่ยนแปลง การแยกเฟสโห
ETL ETL ย่อมาจาก Extract, transform และ Load เป็นกระบวนการที่องค์กรที่ขับเคลื่อนด้วยข้อมูลใช้เพื่อรวบรวมข้อมูลจากแหล่งต่างๆ แล้วนำมารวมกันเพื่อสนับสนุนการค้นพบ การรายงาน การวิเคราะห์ และการตัดสินใจ การคิดว่าการสร้างคลังข้อมูลเป็นเพียงการดึงข้อมูลจากหลายแหล่งและโหลดลงในฐานข้อมูลของคลังข้อมูล กระบวน
Business Intelligence คือชุดของขั้นตอน กลไก และเทคโนโลยีที่ปรับเปลี่ยนข้อมูลดิบให้เป็นข้อมูลสำคัญที่ขับเคลื่อนบริการทางธุรกิจที่คุ้มค่า เป็นชุดของซอฟต์แวร์และบริการเพื่อแก้ไขข้อมูลให้เป็นข่าวกรองและการรับรู้ที่นำไปปฏิบัติได้ BI มีผลกระทบอย่างชัดเจนต่อวิธีการขององค์กร การตัดสินใจทางธุรกิจเชิงกลยุทธ์แ
การทำเหมืองข้อมูลเชิงพรรณนา โดยทั่วไปแล้วการขุดแบบพรรณนาจะใช้เพื่อให้มีความสัมพันธ์ ตารางข้าม ความถี่ ฯลฯ วิธีการเหล่านี้ใช้เพื่อตัดสินความสม่ำเสมอของข้อมูลและเพื่อแสดงรูปแบบ โดยมุ่งเน้นไปที่การสรุปและการแปลงบันทึกเป็นข้อมูลที่สำคัญสำหรับการรายงานและการตรวจสอบ การขุดพรรณนา อธิบาย ข้อมูล เมื่อบันทึ
การขุดข้อมูลเชิงพื้นที่ การทำเหมืองข้อมูลเชิงพื้นที่คือการประยุกต์ใช้การทำเหมืองข้อมูลกับแบบจำลองเชิงพื้นที่ ในการขุดข้อมูลเชิงพื้นที่ นักวิเคราะห์ใช้บันทึกทางภูมิศาสตร์หรือเชิงพื้นที่เพื่อสร้างข่าวกรองธุรกิจหรือผลลัพธ์หลายรายการ สิ่งนี้จำเป็นต้องใช้เทคนิคและทรัพยากรเฉพาะเพื่อให้ได้ข้อมูลทางภูมิศาส
คำอธิบายแนวคิด คำอธิบายแนวคิดคือประเภทของการทำเหมืองข้อมูลขั้นสุดท้าย มันกำหนดชุดของข้อมูลรวมถึงผู้ซื้อบ่อย ผู้สมัครระดับบัณฑิตศึกษา ฯลฯ โดยจะอธิบายลักษณะและการเปรียบเทียบของข้อมูล มันยังเป็นที่รู้จักกันในนามคำอธิบายคลาสเมื่อแนวคิดที่จะอธิบายถูกกำหนดให้เป็นคลาสของวัตถุ คำอธิบายเหล่านี้สามารถกำหนดได
การเรียนรู้กฎการเชื่อมโยงเป็นวิธีการเรียนรู้แบบไม่มีผู้ดูแลที่ทดสอบการพึ่งพาองค์ประกอบข้อมูลหนึ่งกับองค์ประกอบข้อมูลอื่นและสร้างอย่างเหมาะสมเพื่อให้มีประสิทธิภาพมากขึ้น พยายามค้นหาความสัมพันธ์หรือความสัมพันธ์ที่น่าสนใจระหว่างตัวแปรของชุดข้อมูล การค้นหาความสัมพันธ์ที่น่าสนใจระหว่างตัวแปรในฐานข้อมูลขึ
การทำคลัสเตอร์แบบรวมกลุ่มคือวิธีการทำคลัสเตอร์จากล่างขึ้นบน โดยที่คลัสเตอร์มีคลัสเตอร์ย่อย ซึ่งจะมีคลัสเตอร์ย่อย เป็นต้น โดยสามารถเริ่มต้นด้วยการวางแต่ละอ็อบเจ็กต์ในคลัสเตอร์แล้วผสมคลัสเตอร์อะตอมเหล่านี้เป็นกลุ่มที่สูงขึ้นและสูงขึ้นเรื่อยๆ จนกว่าอ็อบเจ็กต์ทั้งหมดจะ ในแต่ละคลัสเตอร์หรือจนกว่าจะมีเงื่
ข้อมูลทั่วไปสรุปข้อมูลโดยแทนที่ค่าที่ค่อนข้างต่ำ (รวมถึงค่าตัวเลขสำหรับอายุแอตทริบิวต์) ด้วยแนวคิดระดับสูง (รวมถึงอายุน้อย วัยกลางคน และอาวุโส) ดังนั้นจึงเป็นกระบวนการที่สรุปชุดข้อมูลที่เกี่ยวข้องกับงานจำนวนมากในฐานข้อมูลจากระดับแนวคิดที่ค่อนข้างต่ำไปจนถึงระดับแนวคิดที่สูงขึ้น ต่อไปนี้คือสองวิธีในก
การเลือกปฏิบัติทางชนชั้นถูกกำหนดให้เป็นชนชั้น มันเป็นอคติหรือการเลือกปฏิบัติตามชนชั้นทางสังคม เกี่ยวข้องกับทัศนคติ พฤติกรรม ระบบนโยบาย และการปฏิบัติของแต่ละบุคคล ซึ่งกำหนดขึ้นเพื่อประโยชน์ของชนชั้นสูงในระดับที่เป็นชนชั้นล่าง การแบ่งแยกเชื้อชาติสามารถกำหนดอคติส่วนบุคคลต่อชนชั้นล่างและลัทธิชนชั้นในสถ
เป็นแนวทางทางสถิติสำหรับการประมวลผลข้อมูลล่วงหน้าเพื่อกรองแอตทริบิวต์ที่ไม่เกี่ยวข้องหรือจัดอันดับแอตทริบิวต์ที่เกี่ยวข้อง การวัดผลการวิเคราะห์ความเกี่ยวข้องของแอตทริบิวต์สามารถใช้เพื่อรับรู้คุณลักษณะที่ไม่เกี่ยวข้องซึ่งสามารถไม่ได้รับอนุญาตจากกระบวนการคำอธิบายแนวคิด การรวมขั้นตอนก่อนการประมวลผลนี้เ
ระบบฐานข้อมูลเชิงสัมพันธ์รองรับห้าฟังก์ชันการรวมในตัว เช่น count(), sum(), avg(), max() และ min() ฟังก์ชันรวมเหล่านี้สามารถใช้เป็นมาตรการพื้นฐานในการทำเหมืองข้อมูลเชิงพรรณนาของข้อมูลหลายมิติ มีการวัดทางสถิติเชิงพรรณนา 2 แบบ เช่น การวัดแนวโน้มจากส่วนกลาง และการวัดการกระจายข้อมูลที่สามารถใช้ได้อย่างมี
มีอัลกอริธึมพาร์ทิชันสองประเภทดังต่อไปนี้ - การจัดกลุ่ม K หมายถึง − K-means clustering เป็นอัลกอริธึมการแบ่งส่วนที่ใช้บ่อยที่สุด K-means จะกำหนดข้อมูลใหม่ในชุดข้อมูลให้กับกลุ่มใหม่ที่สร้างขึ้นเพียงกลุ่มเดียว บันทึกหรือจุดข้อมูลถูกกำหนดให้กับคลัสเตอร์ที่ใกล้ที่สุดโดยใช้การวัดระยะทางหรือความคล้ายคลึง
การเรียนรู้แบบไม่มีผู้ดูแลคือเมื่อสามารถจัดเตรียมชุดข้อมูลที่ไม่มีป้ายกำกับ ซึ่งจำเป็นสำหรับการวิเคราะห์และค้นหารูปแบบภายใน ตัวอย่าง ได้แก่ การลดขนาดและการจัดกลุ่ม การฝึกอบรมได้รับการสนับสนุนสำหรับเครื่องที่มีกลุ่มของข้อมูลที่ไม่ได้ติดฉลาก จำแนก หรือจัดหมวดหมู่ และอัลกอริธึมที่จำเป็นในการอำนวยความสะ
วิธีการจัดกลุ่มตามตารางใช้โครงสร้างข้อมูลกริดที่มีความละเอียดหลายระดับ โดยจะวัดปริมาณพื้นที่วัตถุเป็นจำนวนจำกัดของเซลล์ที่สร้างโครงสร้างกริดซึ่งการดำเนินการทั้งหมดสำหรับการจัดกลุ่มจะถูกนำไปใช้ ประโยชน์ของวิธีนี้คือเวลาในการประมวลผลที่รวดเร็ว ซึ่งโดยทั่วไปแล้วจะไม่ขึ้นกับจำนวนของออบเจ็กต์ข้อมูล ยังคง
อัลกอริธึมวิวัฒนาการคือซอฟต์แวร์คอมพิวเตอร์ที่ใช้ AI เชิงวิวัฒนาการ ซึ่งแก้ปัญหาโดยใช้กระบวนการที่เลียนแบบพฤติกรรมของสิ่งมีชีวิต ด้วยเหตุนี้ จึงจำเป็นต้องมีกลไกที่เกี่ยวข้องกับวิวัฒนาการทางชีววิทยา รวมถึงการสืบพันธุ์ การกลายพันธุ์ และการรวมตัวใหม่ ตัวอย่างของเครื่องมือแยกและแปลงข้อมูลคือชุดเครื่องม
มีองค์ประกอบต่าง ๆ ของ MBR ซึ่งมีดังนี้ - การเลือกชุดการฝึก − ชุดฝึกอบรมประกอบด้วยข่าว 49,652 เรื่อง ซึ่งสนับสนุนโดยบริการดึงข่าวสำหรับเป้าหมายนี้ เรื่องราวเหล่านี้ปรากฏจากข่าวประมาณ 3 เดือนและจากแหล่งต่างๆ เกือบ 100 แหล่ง แต่ละเรื่องมีคำโดยเฉลี่ย 2,700 คำและมีแปดรหัสที่สร้างขึ้น ชุดฝึกอบรมไม่ได้ถูก