Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การวิเคราะห์แนวโน้มคืออะไร?


การวิเคราะห์แนวโน้มกำหนดเทคนิคในการดึงแบบจำลองพฤติกรรมในอนุกรมเวลาที่สามารถซ่อนเสียงเล็กน้อยหรือทั้งหมดได้ วิธีการวิเคราะห์แนวโน้มมักใช้ในการตรวจหาการระบาดและการเพิ่มขึ้นหรือลดลงของการปรากฏตัวของโรคโดยไม่คาดคิด การเฝ้าติดตามแนวโน้มของโรค การประเมินประสิทธิผลของแผนงานและนโยบายการควบคุมโรค และการประเมินความสำเร็จของแผนงานและนโยบายด้านการดูแลสุขภาพ ฯลฯ

สามารถใช้เทคนิคต่างๆ เพื่อตรวจหาแนวโน้มในชุดรายการได้ การปรับให้เรียบเป็นแนวทางที่ใช้ในการลบพฤติกรรมที่ไม่เป็นระบบที่พบในอนุกรมเวลา การปรับให้เรียบมักจะอยู่ในรูปแบบของการหาค่าเฉลี่ยเคลื่อนที่ของค่าแอตทริบิวต์ โดยให้กรอบเวลาในช่วงเวลาหนึ่งๆ

ใช้ค่าเฉลี่ยท้องถิ่นของค่าแอตทริบิวต์ทั้งหมดแทนค่าเฉพาะที่พบในจุดนี้ ค่ามัธยฐานซึ่งตรงข้ามกับค่าเฉลี่ยมักใช้เนื่องจากมีความไวต่อค่าผิดปกติน้อยกว่า การปรับให้เรียบสามารถกรองสัญญาณรบกวนและสิ่งผิดปกติได้ สามารถใช้ทำนายค่าในอนาคตได้ เนื่องจากข้อมูลที่ได้จะปรับให้พอดีกับฟังก์ชันที่ทราบได้ง่ายขึ้น (เชิงเส้น ลอการิทึม เลขชี้กำลัง ฯลฯ)

การตรวจจับรูปแบบตามฤดูกาลในข้อมูลอนุกรมเวลานั้นยากกว่า วิธีหนึ่งคือการค้นหาความสัมพันธ์ระหว่างแอตทริบิวต์ในช่วงเวลาที่มีการกระจายเท่าๆ กัน ตัวอย่างเช่น อาจพบความสัมพันธ์ระหว่างทุกๆ ค่าที่สิบสอง (ในข้อมูลยอดขายรายเดือน) ความแตกต่างของเวลาระหว่างรายการที่เกี่ยวข้องเรียกว่าล่าช้า

สามารถสร้างฟังก์ชัน Autocorrelation เพื่อกำหนดความสัมพันธ์ระหว่างค่าข้อมูลในช่วงเวลาแล็กต่างๆ คอร์เรโลแกรมแสดงค่าความสัมพันธ์อัตโนมัติแบบกราฟิกสำหรับค่าความล่าช้าหลายค่า

ความแปรปรวนร่วมจะวัดว่าตัวแปรทั้งสองเปลี่ยนแปลงร่วมกันอย่างไร สามารถใช้เป็นพื้นฐานในการพิจารณาความสัมพันธ์ระหว่างอนุกรมเวลาสองครั้งหรือแนวโน้มตามฤดูกาลในอนุกรมเวลาเดียว สัมประสิทธิ์สหสัมพันธ์อัตโนมัติ rk วัดความสัมพันธ์ระหว่างค่าอนุกรมเวลาในระยะทางที่กำหนด lag k ห่างกัน

มีการใช้วิธีการหลายอย่างสำหรับความสัมพันธ์อัตโนมัติ ค่าบวกบ่งชี้ว่าตัวแปรทั้งสองเพิ่มขึ้นพร้อมกัน ในขณะที่ค่าลบระบุว่าเมื่อตัวแปรหนึ่งเพิ่มขึ้น อีกตัวแปรหนึ่งจะลดลง

ค่าที่ใกล้ศูนย์บ่งชี้ว่ามีความสัมพันธ์กันเล็กน้อยระหว่างตัวแปรทั้งสอง สูตรทั่วไปในการคำนวณสหสัมพันธ์คือสัมประสิทธิ์สหสัมพันธ์ r ซึ่งบางครั้งเรียกว่า r ของเพียร์สัน

กำหนดอนุกรมเวลาสองชุดคือ X และ Y โดยมีค่าเฉลี่ย X'และ Y' แต่ละรายการมีองค์ประกอบ n รายการ สูตรสำหรับ r คือ

$$\mathrm{\frac{\sum(x_i-X')(y_i-Y')}{\sqrt{\sum(x_i-X)^2(y_i-Y')^2}}}$$

มันใช้สิ่งนี้เพื่อค้นหาสัมประสิทธิ์สหสัมพันธ์กับแล็กของ k, rk บนอนุกรมเวลา X=(x1 ,x2 ,…xn ) ตรงไปตรงมา ซีรี่ย์ครั้งแรกคือ X′=(x1 ,x2 ,…xn−k ) ในขณะที่อนุกรมเวลาที่สองคือ X''=(xk+1 ,xk+1 ,…xn )