หน้าแรก
หน้าแรก
คลังข้อมูลเป็นเทคนิคที่ใช้เป็นหลักในการรวบรวมและจัดการข้อมูลจากแหล่งต่าง ๆ เพื่อให้ธุรกิจมีความเข้าใจอย่างลึกซึ้งทางธุรกิจที่มีความหมาย คลังข้อมูลได้รับการออกแบบมาโดยเฉพาะเพื่อรองรับการตัดสินใจของฝ่ายบริหาร กล่าวอย่างง่าย ๆ คลังข้อมูลกำหนดฐานข้อมูลที่ได้รับการดูแลอย่างเป็นอิสระจากฐานข้อมูลการดำเนิน
ฐานข้อมูลปฏิบัติการ Operational Database เป็นแหล่งข้อมูลสำหรับคลังข้อมูล ประกอบด้วยข้อมูลรายละเอียดที่ใช้ในการดำเนินธุรกิจตามปกติ โดยทั่วไปข้อมูลจะเปลี่ยนแปลงเมื่อมีการสร้างการอัปเดตและสะท้อนถึงมูลค่าล่าสุดของธุรกรรมขั้นสุดท้าย เรียกอีกอย่างว่า OLTP (ฐานข้อมูลการประมวลผลธุรกรรมออนไลน์) ซึ่งใช้เพื่อ
คลังข้อมูลเป็นเทคนิคที่ใช้เป็นหลักในการรวบรวมและจัดการข้อมูลจากแหล่งต่าง ๆ เพื่อให้ธุรกิจมีความเข้าใจอย่างลึกซึ้งทางธุรกิจที่มีความหมาย คลังข้อมูลได้รับการออกแบบมาโดยเฉพาะเพื่อรองรับการตัดสินใจของฝ่ายบริหาร กล่าวอย่างง่าย ๆ คลังข้อมูลหมายถึงฐานข้อมูลที่ได้รับการดูแลแยกจากฐานข้อมูลการปฏิบัติงานขององ
องค์ประกอบหลักของคลังข้อมูลมีดังนี้ - แหล่งข้อมูล − แหล่งข้อมูลกำหนดที่เก็บอิเล็กทรอนิกส์ของเร็กคอร์ดที่มีข้อมูลที่น่าสนใจสำหรับการใช้การบริหารหรือการวิเคราะห์ เมนเฟรมของฐานข้อมูล (เช่น IBM DB2, ISAM, Adabas, Teradata เป็นต้น) ฐานข้อมูลไคลเอนต์-เซิร์ฟเวอร์ (เช่น Teradata, IBM DB2, ฐานข้อมูล Oracle,
คลังข้อมูลเป็นเทคนิคที่ใช้เป็นหลักในการรวบรวมและจัดการข้อมูลจากแหล่งต่าง ๆ เพื่อให้ธุรกิจมีความเข้าใจอย่างลึกซึ้งทางธุรกิจที่มีความหมาย คลังข้อมูลได้รับการออกแบบมาโดยเฉพาะเพื่อรองรับการตัดสินใจของฝ่ายบริหาร กล่าวอย่างง่าย ๆ คลังข้อมูลกำหนดฐานข้อมูลที่ได้รับการดูแลอย่างเป็นอิสระจากฐานข้อมูลการดำเนิน
คลังข้อมูลสามารถสร้างได้โดยใช้สามวิธี - วิธีการจากบนลงล่าง วิธีการจากล่างขึ้นบน การผสมผสานของทั้งสองวิธี แนวทางจากบนลงล่างเริ่มต้นด้วยการออกแบบและการวางแผนที่สมบูรณ์ ซึ่งมีประโยชน์ในกรณีที่เทคโนโลยีมีความซับซ้อนและคุ้นเคย และปัญหาทางธุรกิจที่ต้องแก้ไขมีความชัดเจนและเข้าใจเป็นอย่างดี วิธ
คลังข้อมูลมักจะมีสถาปัตยกรรม (ระดับ) สามระดับที่เกี่ยวข้องกับ - ระดับล่าง เป็นเซิร์ฟเวอร์ฐานข้อมูลคลังสินค้าที่ค่อนข้างเป็นระบบฐานข้อมูลเชิงสัมพันธ์เสมอ เครื่องมือและยูทิลิตี้แบ็คเอนด์ใช้เพื่อป้อนบันทึกในระดับล่างสุดจากฐานข้อมูลการปฏิบัติงานหรือแหล่งภายนอกอื่นๆ (รวมถึงข้อมูลโปรไฟล์ผู้ใช้ที่รองรับ
คลังข้อมูลเป็นเทคนิคที่ใช้เป็นหลักในการรวบรวมและจัดการข้อมูลจากแหล่งต่าง ๆ เพื่อให้ธุรกิจมีความเข้าใจอย่างลึกซึ้งทางธุรกิจที่มีความหมาย คลังข้อมูลได้รับการออกแบบมาโดยเฉพาะเพื่อรองรับการตัดสินใจของฝ่ายบริหาร กล่าวอย่างง่าย ๆ คลังข้อมูลหมายถึงฐานข้อมูลที่ได้รับการดูแลแยกจากฐานข้อมูลการปฏิบัติงานขององ
การรวมข้อมูลเป็นขั้นตอนของการรวมข้อมูลจากแหล่งที่แตกต่างกันหลายแห่ง ขณะใช้การรวมข้อมูล ควรทำงานบนความซ้ำซ้อนของข้อมูล ความไม่สอดคล้อง ความซ้ำซ้อน ฯลฯ ในการทำเหมืองข้อมูล การรวมข้อมูลเป็นเทคนิคก่อนการประมวลผลข้อมูลที่มีการผสานข้อมูลจากแหล่งข้อมูลที่แตกต่างกันจำนวนมากเป็นข้อมูลที่สอดคล้องกันเพื่อรักษา
ในการแปลงข้อมูล ข้อมูลจะถูกแปลงหรือรวมเป็นรูปแบบที่เหมาะสมสำหรับการขุด การแปลงข้อมูลอาจเกี่ยวข้องกับสิ่งต่อไปนี้ - ปรับให้เรียบ − มันสามารถทำงานเพื่อขจัดเสียงรบกวนจากข้อมูล วิธีการดังกล่าวประกอบด้วย Binning การถดถอยและการจัดกลุ่ม การรวม − ในการสรุปรวม โดยที่การดำเนินการสรุปหรือการรวมกลุ่มถูกนำไปใช
การขุดข้อมูลถูกนำไปใช้กับข้อมูลที่เลือกในฐานข้อมูลจำนวนมาก เมื่อการวิเคราะห์ข้อมูลและการขุดเสร็จสิ้นกับข้อมูลจำนวนมาก การประมวลผลจะใช้เวลานานมาก ซึ่งทำให้ไม่สามารถปฏิบัติได้และเป็นไปไม่ได้ สามารถลดเวลาในการประมวลผลสำหรับการวิเคราะห์ข้อมูล เทคนิคการลดข้อมูลจะใช้เพื่อให้ได้การแสดงชุดข้อมูลที่ลดลงซึ่งม
การเลือกชุดย่อยของแอตทริบิวต์จะลดขนาดชุดข้อมูลโดยกำจัดแอตทริบิวต์ (หรือมิติข้อมูล) ที่ไม่เกี่ยวข้องหรือซ้ำซ้อน การเลือกชุดย่อยของแอตทริบิวต์มีจุดมุ่งหมายเพื่อค้นหาชุดแอตทริบิวต์ขั้นต่ำ เพื่อให้การกระจายความน่าจะเป็นที่เป็นผลลัพธ์ของคลาสข้อมูลนั้นใกล้เคียงกับการแจกแจงดั้งเดิมที่เข้าถึงได้โดยใช้แอตทริ
ในการลดมิติข้อมูล การเข้ารหัสหรือการแปลงข้อมูลจะถูกนำไปใช้เพื่อให้ได้ข้อมูลที่ลดลงหรือ บีบอัด ของข้อมูลดั้งเดิม หากข้อมูลเดิมสามารถสร้างขึ้นใหม่จากข้อมูลที่บีบอัดได้โดยไม่มีข้อมูลผิดพลาด การลดข้อมูลจะเรียกว่าการสูญเสียข้อมูล หากข้อมูลที่สร้างขึ้นใหม่เป็นเพียงการประมาณจากข้อมูลเดิม การลดข้อมูลจะเรียก
ในการลดจำนวนข้อมูล ปริมาณข้อมูลจะลดลงโดยการเลือกรูปแบบการแสดงข้อมูลทางเลือกที่เล็กกว่า เทคนิคเหล่านี้อาจเป็นแบบพาราเมตริกหรือไม่มีพารามิเตอร์ก็ได้ สำหรับเมธอดพาราเมตริก ตัวแบบใช้ในการประมาณข้อมูล ดังนั้นจึงต้องเก็บเฉพาะพารามิเตอร์ข้อมูล แทนที่จะเป็นข้อมูลจริง เช่น โมเดลบันทึกเชิงเส้น เมธอดที่ไม่ใช่พ
การวิเคราะห์องค์ประกอบหลักเป็นอัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลซึ่งใช้สำหรับการลดมิติในการเรียนรู้ของเครื่อง เป็นกระบวนการทางสถิติที่เปลี่ยนการสังเกตคุณลักษณะที่มีความสัมพันธ์กันเป็นชุดของคุณลักษณะที่ไม่สัมพันธ์กันเชิงเส้นโดยสนับสนุนข้อมูลมุมฉาก คุณลักษณะที่เปลี่ยนแปลงใหม่เหล่านี้เรียกว่าส่วนประก
การลดขนาด ในการลดมิติข้อมูล การเข้ารหัสหรือการแปลงข้อมูลใช้เพื่อเข้าถึงการแสดงข้อมูลที่ลดลงหรือ บีบอัด ของข้อมูลต้นฉบับ หากข้อมูลเดิมสามารถสร้างขึ้นใหม่จากข้อมูลที่บีบอัดได้โดยไม่สูญเสียข้อมูล การลดข้อมูลจะเรียกว่าไม่สูญเสียข้อมูล หากข้อมูลที่สร้างขึ้นใหม่เป็นเพียงการประมาณจากข้อมูลเดิม การลดข้อมูล
เทคนิคการแยกข้อมูลสามารถใช้เพื่อลดจำนวนค่าสำหรับแอตทริบิวต์ต่อเนื่องที่กำหนดโดยการแบ่งช่วงของแอตทริบิวต์เป็นช่วง ป้ายกำกับช่วงเวลาสามารถใช้เพื่อกู้คืนค่าข้อมูลจริงได้ มันสามารถกู้คืนค่าแอตทริบิวต์ต่อเนื่องได้หลายค่าโดยมีป้ายช่วงเวลาจำนวนน้อย ดังนั้นจึงลดและทำให้ข้อมูลเดิมง่ายขึ้น สิ่งนี้นำไปสู่การแ
การกำหนดลำดับชั้นแนวคิดสำหรับแอตทริบิวต์ที่เป็นตัวเลขนั้นซับซ้อนและลำบาก เนื่องจากช่วงข้อมูลที่ใช้ได้หลากหลายและการอัพเดทค่าข้อมูลบ่อยครั้ง มีวิธีการต่างๆ ในการสร้างลำดับชั้นแนวคิดสำหรับข้อมูลตัวเลขดังนี้ − ถังเก็บ − Binning เป็นเทคนิคการแยกจากบนลงล่างตามจำนวนถังขยะที่กำหนดไว้ วิธีการเหล่านี้ยังใช้
ในบทความนี้ เราจะเข้าใจความแตกต่างระหว่างการให้เหตุผลล่วงหน้าและการให้เหตุผลแบบย้อนหลังใน AI - การให้เหตุผลล่วงหน้า เป็นงานที่ขับเคลื่อนด้วยข้อมูล เริ่มต้นด้วยข้อมูลใหม่ เป้าหมายคือการหาข้อสรุปที่จะตามมา ใช้วิธีการฉวยโอกาส มันไหลจากจุดเริ่มต้นไปสู่ผลที่ตามมา เครื่องมืออนุมานจะค้นหา
การทำเหมืองข้อมูลเป็นกระบวนการในการค้นหาความสัมพันธ์ รูปแบบ และแนวโน้มใหม่ที่เป็นประโยชน์ โดยการถ่ายโอนข้อมูลจำนวนมากที่บันทึกไว้ในที่เก็บ โดยใช้เทคโนโลยีการจดจำรูปแบบ รวมทั้งเทคนิคทางสถิติและคณิตศาสตร์ เป็นการวิเคราะห์ชุดข้อมูลที่เป็นข้อเท็จจริงเพื่อค้นหาความสัมพันธ์ที่ไม่สงสัย และเพื่อสรุปบันทึกด้