Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การขุดการใช้เว็บคืออะไร?


การขุดการใช้เว็บใช้เพื่อดึงข้อมูลที่เป็นประโยชน์ ข้อมูล ความรู้จากข้อมูลบล็อก และช่วยในการระบุการออกแบบการเข้าถึงของผู้ใช้สำหรับหน้าเว็บ

ในการขุด การจัดการทรัพยากรบนเว็บ บุคคลนั้นกำลังคิดเกี่ยวกับข้อมูลคำขอของผู้เยี่ยมชมเว็บไซต์ที่ประกอบเป็นบันทึกของเว็บเซิร์ฟเวอร์ แม้ว่าเนื้อหาและกลไกของชุดของหน้าเว็บจะเป็นไปตามความตั้งใจของผู้เขียนหน้าเว็บ คำขอเดียวจะแสดงให้เห็นว่าผู้ใช้ดูหน้าเว็บเหล่านี้อย่างไร การขุดการใช้เว็บสามารถเปิดเผยความสัมพันธ์ที่ผู้ออกแบบเพจไม่ได้แนะนำ

เว็บเซิร์ฟเวอร์โดยทั่วไปจะลงทะเบียนรายการบันทึก (เว็บ) หรือรายการบันทึกของเว็บ สำหรับการเข้าถึงหน้าเว็บแต่ละครั้ง ประกอบด้วย URL ที่ร้องขอ ที่อยู่ IP ที่ใช้นำคำขอ และการประทับเวลา

สำหรับเซิร์ฟเวอร์อีคอมเมิร์ซบนเว็บ จะมีการรวบรวมข้อมูลบันทึกการเข้าใช้เว็บจำนวนมาก มีเว็บไซต์ที่มีชื่อเสียงสามารถลงทะเบียนบันทึก Weblog ได้หลายพันเมกะไบต์ในแต่ละวัน ฐานข้อมูลเว็บล็อกสนับสนุนข้อมูลที่สมบูรณ์เกี่ยวกับไดนามิกของเว็บ ดังนั้นจึงจำเป็นต้องสร้างวิธีการขุด Weblog ที่ซับซ้อน

ในการพัฒนาวิธีการทำเหมืองข้อมูลการใช้งานเว็บ สามารถพิจารณาได้ดังนี้ ประการแรก แม้ว่าจะเป็นการกระตุ้นและกระตุ้นให้เกิดการประยุกต์ใช้การวิเคราะห์ไฟล์ Weblog หลายๆ แอพพลิเคชั่น จำเป็นอย่างยิ่งที่จะต้องเข้าใจว่าความสำเร็จของแอปพลิเคชันดังกล่าวขึ้นอยู่กับความรู้ที่แท้จริงและเชื่อถือได้มากเพียงใดที่สามารถพบได้จากบันทึกดิบขนาดใหญ่

ประการที่สอง ด้วย URL, เวลา, ที่อยู่ IP และข้อมูลเนื้อหาหน้าเว็บที่มีอยู่ สามารถสร้างมุมมองหลายมิติบนฐานข้อมูล Weblog และการวิเคราะห์ OLAP แบบหลายมิติสามารถนำไปใช้เพื่อค้นหาผู้ใช้ N อันดับแรก หน้าเว็บที่เข้าถึง N อันดับแรก ส่วนใหญ่ ช่วงเวลาที่เข้าถึงโดยทั่วไป ฯลฯ ซึ่งจะช่วยค้นหาผู้มีโอกาสเป็นลูกค้า ผู้ใช้ ตลาด ฯลฯ

ประการที่สาม การทำเหมืองข้อมูลสามารถนำไปใช้กับระเบียน Weblog เพื่อค้นหารูปแบบการเชื่อมโยง รูปแบบตามลำดับ และแนวโน้มของการเข้าถึงเว็บ สำหรับการทำเหมืองข้อมูลรูปแบบการเข้าถึงเว็บ จำเป็นต้องใช้มาตรการเพิ่มเติมเพื่อให้ได้ข้อมูลการข้ามผ่านของผู้ใช้มากขึ้น เพื่อทำให้การวิเคราะห์ Weblog ถูกต้องง่ายขึ้น

ข้อมูลเพิ่มเติมดังกล่าวอาจรวมถึงลำดับการท่องเว็บโดยผู้ใช้ในบัฟเฟอร์เซิร์ฟเวอร์อินเทอร์เน็ต ด้วยความต้องการเอกสารเว็บบล็อกดังกล่าว การศึกษาจึงมุ่งไปที่การวิเคราะห์การใช้งานระบบ ปรับปรุงการออกแบบระบบโดยการแคชเว็บ การดึงข้อมูลหน้าเว็บล่วงหน้า และการแลกเปลี่ยนหน้าเว็บ ทำความเข้าใจคุณลักษณะของการเข้าชมเว็บ และเข้าใจปฏิกิริยาและแรงจูงใจของลูกค้า

ตัวอย่างเช่น การศึกษาบางชิ้นได้เสนอไซต์ที่ปรับเปลี่ยนได้ - เว็บไซต์ที่ปรับปรุงตนเองโดยการทำความเข้าใจจากรูปแบบการเข้าถึงของผู้ใช้ การวิเคราะห์เว็บบล็อกยังช่วยสร้างบริการเว็บที่กำหนดเองสำหรับผู้ใช้คนเดียวได้