การทำเหมืองข้อมูลบนเว็บกำหนดกระบวนการของการใช้เทคนิคการทำเหมืองข้อมูลเพื่อดึงแนวโน้มรูปแบบที่เป็นประโยชน์และข้อมูลโดยทั่วไปด้วยความช่วยเหลือของเว็บโดยจัดการกับมันจากบันทึกและบริการบนเว็บ บันทึกของเซิร์ฟเวอร์ และไฮเปอร์ลิงก์ การขุดเว็บมีจุดมุ่งหมายเพื่อค้นหาการออกแบบในข้อมูลเว็บโดยการจัดกลุ่มและวิเคราะห์ข้อมูลเพื่อรับข้อมูลเชิงลึกที่สำคัญ
การทำเหมืองข้อมูลบนเว็บสามารถมองได้อย่างกว้างขวางว่าเป็นการนำวิธีการทำเหมืองข้อมูลมาปรับใช้กับเว็บ ในขณะที่การทำเหมืองข้อมูลจะแสดงเป็นการใช้อัลกอริทึมเพื่อค้นหารูปแบบในข้อมูลที่มีโครงสร้างเป็นส่วนใหญ่ซึ่งได้รับการแก้ไขในกระบวนการค้นหาความรู้
การขุดเว็บมีหลากหลายแอพพลิเคชั่นดังนี้ −
-
การขุดเว็บใช้เพื่อค้นพบวิธีที่ผู้ใช้สำรวจเว็บไซต์ และผลลัพธ์สามารถช่วยในการปรับปรุงการออกแบบเว็บไซต์และทำให้มองเห็นได้บนเว็บมากขึ้น
-
ในการจัดการลูกค้าสัมพันธ์ (CRM) การทำเหมืองเว็บคือการรวมข้อมูลที่รวบรวมโดยวิธีการและเทคนิคการทำเหมืองข้อมูลแบบดั้งเดิมด้วยข้อมูลที่รวบรวมผ่านเวิลด์ไวด์เว็บ การทำเหมืองข้อมูลเว็บสามารถเรียนรู้พฤติกรรมของผู้ใช้ คำนวณประสิทธิภาพของเว็บไซต์เฉพาะ และให้ปริมาณความสำเร็จของแคมเปญการตลาด
-
ความนิยมของภาพดิจิทัลเพิ่มขึ้นอย่างรวดเร็วเนื่องจากการเพิ่มประสิทธิภาพของเทคโนโลยีการถ่ายภาพดิจิทัลและความพร้อมใช้งานที่สะดวกสบายซึ่งได้รับการสนับสนุนจากเว็บ อย่างไรก็ตาม วิธีค้นหารูปภาพที่ลูกค้าต้องการจากเว็บนั้นไม่ใช่เรื่องเล็กน้อย เหตุผลหลักคือ โดยทั่วไปแล้ว รูปภาพบนเว็บจะไม่ใส่คำอธิบายประกอบโดยใช้ตัวอธิบายเชิงความหมาย ใช้เพื่อดึงภาพเว็บจากอินเทอร์เน็ต ใช้การขุดเว็บ
-
การขุดเว็บใช้สำหรับการแยกข้อความหลัก คำหลักมีประโยชน์สำหรับวัตถุประสงค์หลายประการ เช่น การสรุป การจัดทำดัชนี การติดฉลาก การจัดหมวดหมู่ การจัดกลุ่ม การนำเสนอ การสแกน และการค้นหา งานของการแยกข้อความคีย์อัตโนมัติคือการเลือกข้อความสำคัญจากภายในข้อความของเอกสารที่กำหนด การแยกข้อความคีย์อัตโนมัติทำให้เป็นไปได้ในการสร้างข้อความสำคัญสำหรับไฟล์จำนวนมากที่ไม่ได้มีการกำหนดคีย์เวิร์ดด้วยตนเอง
-
การขุดเว็บใช้สำหรับการวิเคราะห์เครือข่ายโซเชียล เครือข่ายโซเชียลคือการศึกษาหน่วยงานทางสังคม (บุคคลในองค์กรหรือที่รู้จักในชื่อนักแสดง) ตลอดจนความเชื่อมโยงและความสัมพันธ์ของพวกเขา
-
การวิเคราะห์เครือข่ายโซเชียลมีประโยชน์สำหรับเว็บ เนื่องจากเว็บเป็นสังคมเสมือนจริงอย่างมาก และดังนั้นจึงเป็นเว็บโซเชียลเสมือน ซึ่งทุกหน้าสามารถถือเป็นนักแสดงทางสังคมและทุกไฮเปอร์ลิงก์เป็นความสัมพันธ์ ผลลัพธ์จำนวนมากจากโซเชียลเน็ตเวิร์กสามารถปรับเปลี่ยนและขยายเพื่อใช้ในบริบทของเว็บได้ แนวคิดจากการวิเคราะห์เครือข่ายสังคมออนไลน์เป็นเครื่องมือที่นำไปสู่ความสำเร็จของเครื่องมือค้นหาเว็บ