โมดูลสถิติของไลบรารี Python ประกอบด้วยฟังก์ชันในการคำนวณสูตรทางสถิติโดยใช้ประเภทข้อมูลที่เป็นตัวเลข รวมถึงประเภทเศษส่วนและทศนิยม
คำสั่งนำเข้าต่อไปนี้จำเป็นต้องใช้ฟังก์ชันที่อธิบายไว้ในบทความนี้
>>> from statistics import *
ฟังก์ชันต่อไปนี้จะคำนวณแนวโน้มศูนย์กลางของข้อมูลตัวอย่าง
หมายถึง() − ฟังก์ชันนี้คำนวณค่าเฉลี่ยเลขคณิตของข้อมูลในรูปแบบของลำดับหรือตัววนซ้ำ
>>> from statistics import mean >>> numbers = [12,34,21,7,56] >>> mean(numbers) 26
ข้อมูลตัวอย่างอาจมีวัตถุทศนิยมหรือวัตถุเศษส่วน
>>> from decimal import Decimal >>> numbers = [12,34,21,Decimal('7'),56] >>> mean(numbers) Decimal('26') >>> from fractions import Fraction >>> numbers = [12,20.55,Fraction(4,5),21,56] >>> mean(numbers) 22.07
harmonic_mean() − ค่าเฉลี่ยฮาร์มอนิกคำนวณโดยการหาค่าเฉลี่ยเลขคณิตของส่วนกลับขององค์ประกอบในข้อมูลตัวอย่าง แล้วนำส่วนกลับของค่าเฉลี่ยเลขคณิตมาแทนตัวมันเอง
ตัวอย่าง =[1,2,3,4,5]
ส่วนกลับ =[1/1, 1/2, 1/3, 1/4, 1/5] =2.28333333333
ค่าเฉลี่ย =2.28333333333/5 =0 45666666666666667
ค่าเฉลี่ยฮาร์มอนิก =1 / 4566666666666667 =2.189784218663093
>>> harmonic_mean([1,2,3,4,5]) 2.18978102189781
ค่ามัธยฐาน() − ค่ามัธยฐานคือค่ากลางของข้อมูลตัวอย่าง ข้อมูลจะถูกจัดเรียงโดยอัตโนมัติในลำดับจากน้อยไปมากเพื่อค้นหาค่ามัธยฐาน หากจำนวนองค์ประกอบเป็นเลขคี่ ค่ามัธยฐานจะเป็นค่ากลาง หากการนับเป็นเลขคี่ ค่าเฉลี่ยของตัวเลขสองตัวที่อยู่ตรงกลางสุดจะเป็นค่ามัธยฐาน
>>> median([2,5,4,8,6]) 5 >>> median([11,33,66,55,88,22]) 44.0
โหมด() − ฟังก์ชันนี้ส่งคืนค่าทั่วไปที่สุดในตัวอย่าง สามารถใช้ฟังก์ชันนี้กับข้อมูลที่เป็นตัวเลขหรือไม่ใช่ตัวเลขได้
>>> mode((4,7,8,4,9,7,12,4,8)) 4 >>> mode(['cc','aa','dd','cc','ff','cc']) 'cc'
ฟังก์ชันต่อไปนี้จะจัดการกับการวัดการกระจายขององค์ประกอบในตัวอย่างจากค่าส่วนกลาง
ความแปรปรวน() − ฟังก์ชันนี้สะท้อนถึงความแปรปรวนหรือการกระจายของข้อมูลในตัวอย่าง ความแปรปรวนสูงหมายความว่าข้อมูลกระจัดกระจาย ความแปรปรวนที่น้อยกว่าแสดงว่าข้อมูลมีการจัดกลุ่มอย่างใกล้ชิด
ต่อไปนี้เป็นขั้นตอนในการหาความแปรปรวน
- หาค่าเฉลี่ยเลขคณิตขององค์ประกอบทั้งหมดในตัวอย่าง
- หากำลังสองของผลต่างระหว่างค่าเฉลี่ยกับแต่ละองค์ประกอบแล้วบวกกำลังสอง
- หารผลรวมด้วย n-1 ถ้าขนาดกลุ่มตัวอย่างเป็น n เพื่อให้ได้ค่าความแปรปรวน
ในทางคณิตศาสตร์ ขั้นตอนข้างต้นแสดงโดยสูตรต่อไปนี้ −
$$s^2 =\frac{1}{n-1}\displaystyle\displaystyle\sum\limits_{i=1}^n(x_{i}-\overline{x})^2$$
โชคดีที่ฟังก์ชัน Variance() จะคำนวณสูตรข้างต้นให้คุณ
>>> num = [4, 9, 2, 11, 5, 22, 90, 32, 56, 70] >>> variance(num) 981.2111111111111
stdev() − ฟังก์ชันนี้จะคืนค่าส่วนเบี่ยงเบนมาตรฐานของข้อมูลในตัวอย่าง ส่วนเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวน
>>> num = [4, 9, 2, 11, 5, 22, 90, 32, 56, 70] >>> stdev(num) 31.324289474960338