หน้าแรก
หน้าแรก
การทำเหมืองข้อมูลเป็นกระบวนการในการค้นหาความสัมพันธ์ รูปแบบ และแนวโน้มใหม่ที่เป็นประโยชน์ โดยการถ่ายโอนข้อมูลจำนวนมากที่บันทึกไว้ในที่เก็บ โดยใช้เทคโนโลยีการจดจำรูปแบบ รวมทั้งเทคนิคทางสถิติและคณิตศาสตร์ เป็นการวิเคราะห์ชุดข้อมูลที่เป็นข้อเท็จจริงเพื่อค้นหาความสัมพันธ์ที่ไม่สงสัย และเพื่อสรุปบันทึกด้
ระยะทางเป็นวิธีที่ MBR คำนวณความคล้ายคลึงกัน สำหรับการวัดระยะทางจริง ระยะทางจากจุด A ไปยังจุด B ซึ่งระบุด้วย d(A,B) มีคุณลักษณะสี่ประการดังต่อไปนี้ − ชัดเจน − ระยะห่างระหว่างจุดสองจุดถูกกำหนดอย่างต่อเนื่องและเป็นจำนวนจริงไม่ติดลบ d (A,B) ≥ 0 ตัวตน − ระยะทางจากจุดหนึ่งไปยังจุดหนึ่งเป็นศูนย์อย่า
การทำเหมืองข้อมูลยังกำหนดเป็นการค้นพบความรู้ในข้อมูลเป็นเทคนิคในการรับรู้ความผิดปกติ ความสัมพันธ์ แนวโน้ม หรือรูปแบบระหว่างข้อมูลนับล้าน (โดยเฉพาะข้อมูลที่มีโครงสร้าง) เพื่อรวบรวมข้อมูลเชิงลึกที่อาจเป็นประโยชน์สำหรับการตัดสินใจทางธุรกิจ และอาจพลาดในระหว่างแบบดั้งเดิม การวิเคราะห์. วัตถุประสงค์ของการ
การกรองการทำงานร่วมกันเป็นการใช้เหตุผลตามหน่วยความจำที่แตกต่างกันโดยเฉพาะอย่างยิ่งที่เหมาะสมอย่างยิ่งกับการประยุกต์ใช้การสนับสนุนคำแนะนำส่วนบุคคล ระบบการกรองการทำงานร่วมกันเริ่มต้นด้วยประวัติความชอบของบุคคล ฟังก์ชันระยะทางตัดสินความคล้ายคลึงกันขึ้นอยู่กับความชอบของคนที่ชอบสิ่งเดียวกันอยู่ใกล้กัน นอ
การทำเหมืองข้อมูลเป็นขั้นตอนของการเลือก สำรวจ และจำลองข้อมูลปริมาณมากเพื่อค้นหาความสม่ำเสมอหรือความสัมพันธ์ที่ไม่เคยทราบมาก่อนเพื่อให้ได้ผลลัพธ์ที่ชัดเจนและเป็นประโยชน์สำหรับเจ้าของฐานข้อมูล การทำเหมืองข้อมูลเป็นสาขาสหวิทยาการ ซึ่งเป็นการรวมกลุ่มของสาขาวิชาต่างๆ เช่น ระบบฐานข้อมูล สถิติ การเรียนรู้
การเรียนรู้กฎการเชื่อมโยงเป็นวิธีการเรียนรู้แบบไม่มีผู้ดูแลที่ทดสอบการพึ่งพาองค์ประกอบข้อมูลหนึ่งกับองค์ประกอบข้อมูลอื่นและสร้างอย่างเหมาะสมเพื่อให้มีประสิทธิภาพมากขึ้น พยายามค้นหาความสัมพันธ์หรือความสัมพันธ์ที่น่าสนใจระหว่างตัวแปรของชุดข้อมูล การค้นหาความสัมพันธ์ที่น่าสนใจระหว่างตัวแปรในฐานข้อมูลขึ
KDD แสดงถึงการค้นพบความรู้ในฐานข้อมูล กำหนดกระบวนการกว้างๆ ในการค้นหาความรู้ในข้อมูลและเน้นการใช้งานระดับสูงของเทคนิคการทำเหมืองข้อมูลที่แน่นอน เป็นพื้นที่ที่น่าสนใจสำหรับนักวิจัยในหลายสาขา เช่น ปัญญาประดิษฐ์ แมชชีนเลิร์นนิง การจดจำรูปแบบ ฐานข้อมูล สถิติ การได้มาซึ่งความรู้สำหรับระบบมืออาชีพ และการแ
การวิเคราะห์ตะกร้าตลาดไม่ได้แสดงถึงแต่ละวิธีและแสดงถึงชุดของปัญหาทางธุรกิจที่เกี่ยวข้องกับการทำความเข้าใจข้อมูลธุรกรรม ณ จุดขาย ข้อมูลตะกร้าสินค้าในตลาดคือข้อมูลธุรกรรมที่แสดงถึงหน่วยงานพื้นฐานที่แตกต่างกันสามรายการ เช่น ผู้ใช้ คำสั่งซื้อ (เรียกอีกอย่างว่าการซื้อหรือตะกร้า หรือในเอกสารวิชาการ ชุดราย
กระเป๋าเงิน Bitcoin เป็นกระเป๋าเงินดิจิทัลประเภทหนึ่งที่สามารถส่งและรับ Bitcoins ได้ นี่เปรียบได้กับกระเป๋าเงินจริง อย่างไรก็ตาม แทนที่จะบันทึกสกุลเงินจริง กระเป๋าเงินจะบันทึกข้อมูลการเข้ารหัสที่สามารถเข้าถึงที่อยู่ Bitcoin และส่งธุรกรรมได้ มีกระเป๋าเงิน Bitcoin หลายใบที่สามารถใช้กับเงินดิจิตอลได้หล
Orange เป็นออบเจ็กต์หลักของ C++ และไลบรารีรูทีนที่มีวิธีการขนาดใหญ่ของการเรียนรู้ด้วยเครื่องมาตรฐานและไม่เป็นมาตรฐานและอัลกอริธึมการขุดข้อมูล เป็นการแสดงข้อมูลแบบโอเพนซอร์ส การทำเหมืองข้อมูล และเครื่องมือการเรียนรู้ของเครื่อง ใน Orange เป็นการตั้งค่าที่เขียนสคริปต์ได้สำหรับการสร้างต้นแบบอย่างรวดเร็
การถดถอยกำหนดประเภทของวิธีการเรียนรู้ของเครื่องภายใต้การดูแลที่สามารถใช้เพื่อคาดการณ์แอตทริบิวต์ที่มีมูลค่าต่อเนื่องได้ การถดถอยช่วยให้องค์กรธุรกิจบางแห่งสามารถสำรวจความสัมพันธ์ของตัวแปรเป้าหมายและตัวทำนาย เป็นเครื่องมือสำคัญในการสำรวจข้อมูลที่สามารถใช้สำหรับการคาดการณ์ทางการเงินและการสร้างแบบจำลองอ
การถดถอยกำหนดประเภทของวิธีการเรียนรู้ของเครื่องภายใต้การดูแลที่สามารถใช้เพื่อคาดการณ์แอตทริบิวต์ที่มีมูลค่าต่อเนื่องได้ การถดถอยช่วยให้องค์กรธุรกิจบางแห่งสามารถสำรวจความสัมพันธ์ของตัวแปรเป้าหมายและตัวทำนาย เป็นเครื่องมือสำคัญในการสำรวจข้อมูลที่สามารถใช้สำหรับการคาดการณ์ทางการเงินและการสร้างแบบจำลองอ
การถดถอย การถดถอยกำหนดประเภทของวิธีการเรียนรู้ของเครื่องภายใต้การดูแล ซึ่งสามารถใช้เพื่อคาดการณ์แอตทริบิวต์ที่มีค่าต่อเนื่องใดๆ การถดถอยช่วยให้องค์กรธุรกิจบางแห่งสามารถสำรวจความสัมพันธ์ของตัวแปรเป้าหมายและตัวทำนาย เป็นเครื่องมือสำคัญในการสำรวจข้อมูลที่สามารถใช้สำหรับการคาดการณ์ทางการเงินและการสร้างแ
CART เป็นอัลกอริธึมแผนผังการตัดสินใจที่มีชื่อเสียงซึ่งผลิตโดย Leo Breiman, Jerome Friedman, Richard Olshen และ Charles Stone ในปี 1984 CART แสดงถึงต้นไม้การจำแนกและการถดถอย อัลกอริธึม CART ปรับปรุงไบนารีทรีและแบ่งต่อเมื่อพิจารณาการแยกใหม่ซึ่งช่วยเพิ่มความบริสุทธิ์ มีทรีย่อยที่ง่ายกว่า ซึ่งแต่ละอันก
C5 เป็นเวอร์ชันปัจจุบันของอัลกอริธึมทรีการตัดสินใจที่ J. Ross Quinlan นักวิจัยชาวออสเตรเลียได้พัฒนาและปรับแต่งมาหลายปีแล้ว ID3 เวอร์ชันก่อนหน้าซึ่งก่อตั้งขึ้นในปี 1986 มีอิทธิพลในด้านการเรียนรู้ของเครื่อง และมีการใช้รุ่นต่อจากนี้ในบริการขุดข้อมูลเชิงพาณิชย์หลายแห่ง ต้นไม้ที่เพิ่มขึ้นโดย C5 จะเหมือน
โครงข่ายประสาทฟีดฟอร์เวิร์ดช่วยให้สัญญาณเดินทางได้เพียงแนวทางเดียวเท่านั้น จากอินพุตไปยังเอาต์พุต ไม่มีการป้อนกลับ (วนซ้ำ) เช่น ผลลัพธ์ของบางเลเยอร์ไม่ส่งผลต่อเลเยอร์เดียวกันนั้น เครือข่ายฟีดฟอร์เวิร์ดมักจะเป็นเครือข่ายธรรมดาที่เชื่อมโยงอินพุตกับเอาต์พุต สามารถใช้ในการจดจำรูปแบบได้ องค์กรประเภทนี้จะ
โครงข่ายประสาทเทียมคือลำดับของอัลกอริทึมที่พยายามระบุความสัมพันธ์พื้นฐานในชุดข้อมูลผ่านกระบวนการที่เลียนแบบวิธีการทำงานของสมองมนุษย์ ในแนวทางนี้ โครงข่ายประสาทเทียมเป็นตัวแทนของระบบเซลล์ประสาท เช่น สารอินทรีย์หรือเทียม โครงข่ายประสาทเป็นวิธีการวิเคราะห์ที่จำลองตามขั้นตอน (สมมุติฐาน) ของการเรียนรู้ใ
ความสามารถของมนุษย์ในการให้เหตุผลจากประสบการณ์โดยพิจารณาจากความสามารถในการระบุตัวอย่างที่เหมาะสมจากก่อนหน้านี้ แพทย์ที่วินิจฉัยการติดเชื้อ นักวิเคราะห์อ้างว่าตั้งค่าสถานะทรัพย์สินประกันที่ฉ้อฉล และนักล่าเห็ดชี้มอเรลส์กำลังปฏิบัติตามขั้นตอนเดียวกัน แต่ละคนรับรู้กรณีเดียวกันจากประสบการณ์แล้วใช้ความรู
กริดคือวิธีที่มีประสิทธิภาพในการจัดระเบียบชุดข้อมูล โดยมีขนาดเล็กที่สุด แนวคิดคือการแบ่งค่าที่ใช้ได้ของแต่ละแอตทริบิวต์ออกเป็นช่วงต่อเนื่องกันหลายช่วง ทำให้เกิดชุดของเซลล์กริด แต่ละอ็อบเจ็กต์จะลดลงในเซลล์กริดซึ่งมีช่วงแอตทริบิวต์ที่เท่ากันซึ่งรวมค่าของออบเจกต์ด้วย สามารถสร้างออบเจ็กต์ลงในเซลล์กริดไ
กระบวนการรวมชุดของวัตถุทางกายภาพหรือนามธรรมเข้าในคลาสของวัตถุเดียวกันนั้นเรียกว่าการจัดกลุ่ม คลัสเตอร์คือชุดของออบเจ็กต์ข้อมูลที่เหมือนกันภายในคลัสเตอร์เดียวกันและแตกต่างจากออบเจ็กต์ในคลัสเตอร์อื่น คลัสเตอร์ของออบเจ็กต์ข้อมูลสามารถพิจารณารวมกันเป็นกลุ่มเดียวในหลายแอปพลิเคชัน การวิเคราะห์คลัสเตอร์เป็