Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

ฟังก์ชันสถิติทางคณิตศาสตร์ใน Python


โมดูลสถิติของไลบรารี Python ประกอบด้วยฟังก์ชันในการคำนวณสูตรทางสถิติโดยใช้ประเภทข้อมูลที่เป็นตัวเลข รวมถึงประเภทเศษส่วนและทศนิยม

คำสั่งนำเข้าต่อไปนี้จำเป็นต้องใช้ฟังก์ชันที่อธิบายไว้ในบทความนี้

>>> from statistics import *

ฟังก์ชันต่อไปนี้จะคำนวณแนวโน้มศูนย์กลางของข้อมูลตัวอย่าง

หมายถึง() − ฟังก์ชันนี้คำนวณค่าเฉลี่ยเลขคณิตของข้อมูลในรูปแบบของลำดับหรือตัววนซ้ำ

>>> from statistics import mean
>>> numbers = [12,34,21,7,56]
>>> mean(numbers)
26

ข้อมูลตัวอย่างอาจมีวัตถุทศนิยมหรือวัตถุเศษส่วน

>>> from decimal import Decimal
>>> numbers = [12,34,21,Decimal('7'),56]
>>> mean(numbers)
Decimal('26')
>>> from fractions import Fraction
>>> numbers = [12,20.55,Fraction(4,5),21,56]
>>> mean(numbers)
22.07

harmonic_mean() − ค่าเฉลี่ยฮาร์มอนิกคำนวณโดยการหาค่าเฉลี่ยเลขคณิตของส่วนกลับขององค์ประกอบในข้อมูลตัวอย่าง แล้วนำส่วนกลับของค่าเฉลี่ยเลขคณิตมาแทนตัวมันเอง

ตัวอย่าง =[1,2,3,4,5]

ส่วนกลับ =[1/1, 1/2, 1/3, 1/4, 1/5] =2.28333333333

ค่าเฉลี่ย =2.28333333333/5 =0 45666666666666667

ค่าเฉลี่ยฮาร์มอนิก =1 / 4566666666666667 =2.189784218663093

>>> harmonic_mean([1,2,3,4,5])
2.18978102189781

ค่ามัธยฐาน() − ค่ามัธยฐานคือค่ากลางของข้อมูลตัวอย่าง ข้อมูลจะถูกจัดเรียงโดยอัตโนมัติในลำดับจากน้อยไปมากเพื่อค้นหาค่ามัธยฐาน หากจำนวนองค์ประกอบเป็นเลขคี่ ค่ามัธยฐานจะเป็นค่ากลาง หากการนับเป็นเลขคี่ ค่าเฉลี่ยของตัวเลขสองตัวที่อยู่ตรงกลางสุดจะเป็นค่ามัธยฐาน

>>> median([2,5,4,8,6])
5
>>> median([11,33,66,55,88,22])
44.0

โหมด() − ฟังก์ชันนี้ส่งคืนค่าทั่วไปที่สุดในตัวอย่าง สามารถใช้ฟังก์ชันนี้กับข้อมูลที่เป็นตัวเลขหรือไม่ใช่ตัวเลขได้

>>> mode((4,7,8,4,9,7,12,4,8))
4
>>> mode(['cc','aa','dd','cc','ff','cc'])
'cc'

ฟังก์ชันต่อไปนี้จะจัดการกับการวัดการกระจายขององค์ประกอบในตัวอย่างจากค่าส่วนกลาง

ความแปรปรวน() − ฟังก์ชันนี้สะท้อนถึงความแปรปรวนหรือการกระจายของข้อมูลในตัวอย่าง ความแปรปรวนสูงหมายความว่าข้อมูลกระจัดกระจาย ความแปรปรวนที่น้อยกว่าแสดงว่าข้อมูลมีการจัดกลุ่มอย่างใกล้ชิด

ต่อไปนี้เป็นขั้นตอนในการหาความแปรปรวน

  • หาค่าเฉลี่ยเลขคณิตขององค์ประกอบทั้งหมดในตัวอย่าง
  • หากำลังสองของผลต่างระหว่างค่าเฉลี่ยกับแต่ละองค์ประกอบแล้วบวกกำลังสอง
  • หารผลรวมด้วย n-1 ถ้าขนาดกลุ่มตัวอย่างเป็น n เพื่อให้ได้ค่าความแปรปรวน

ในทางคณิตศาสตร์ ขั้นตอนข้างต้นแสดงโดยสูตรต่อไปนี้ −

$$s^2 =\frac{1}{n-1}\displaystyle\displaystyle\sum\limits_{i=1}^n(x_{i}-\overline{x})^2$$


โชคดีที่ฟังก์ชัน Variance() จะคำนวณสูตรข้างต้นให้คุณ

>>> num = [4, 9, 2, 11, 5, 22, 90, 32, 56, 70]
>>> variance(num)
981.2111111111111

stdev() − ฟังก์ชันนี้จะคืนค่าส่วนเบี่ยงเบนมาตรฐานของข้อมูลในตัวอย่าง ส่วนเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวน

>>> num = [4, 9, 2, 11, 5, 22, 90, 32, 56, 70]
>>> stdev(num)
31.324289474960338