Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

จะค้นหาสรุปสถิติของกรอบข้อมูล R พร้อมสถิติเชิงพรรณนาทั้งหมดได้อย่างไร


เมื่อเราพบข้อมูลสรุปทางสถิติของกรอบข้อมูล R เราจะได้รับเฉพาะค่าต่ำสุด ควอไทล์แรก ค่ามัธยฐาน ค่าเฉลี่ย ควอร์ไทล์ที่สาม และค่าสูงสุด แต่ในเชิงพรรณนา ยังมีการวัดที่เป็นประโยชน์อื่นๆ อีกมากมาย เช่น ความแปรปรวน ส่วนเบี่ยงเบนมาตรฐาน ความเบ้ ความโด่ง เป็นต้น ดังนั้น เราจึงสามารถใช้ฟังก์ชัน basicStats ของแพ็คเกจ fBasics เพื่อจุดประสงค์นี้ได้

กำลังโหลดแพ็คเกจ fBasics -

library(fBasics)

พิจารณาข้อมูล mtcars ในฐาน R -

ตัวอย่าง

data(mtcars)head(mtcars,20)

ผลลัพธ์

 mpg cyl disp hp drat wt qsec vs am gear carbMazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1Hornet 4 ไดรฟ์ 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1Hornet Sportabout 18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2Valiant 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1Duster 360 14.3 8 360.0 245 3.21 3.570 15.84 0 0 3 4Merc 240D 24.4 4 146.7 62 3.69 3.190 20.00 1 0 4 2Merc 230 22.8 4 140.8 95 3.92 3.150 22.90 1 0 4 2Merc 280 19.2 6 167.6 123 3.92 3.440 18.30 1 0 4 4Merc 280C 17.8 6 167.6 123 3.92 3.440 18.90 1 0 4 4Merc 450SE 16.4 8 275.8 180 3.07 4.070 17.40 0 0 3 3เมอร์ซี 450SL 17.3 8 275.8 180 3.07 3.730 17.60 0 0 3 3Merc 450SLC 15.2 8 275.8 180 3.07 3.780 18.00 0 0 3 3 Cadillac Fleetwood 10.4 8 472.0 205 2.93 5.250 17.98 0 0 3 4Lincoln Continental 10.4 8 460.0 215 3.00 5.424 17.82 0 0 3 4Chrysler Imperial 14.7 8 440.0 230 3.23 5.345 17.42 0 0 3 4Fiat 128 32.4 4 78.7 66 4.08 2.200 19.47 1 1 4 1Honda Civic 30.4 4 75.7 52 4.93 1.615 18.52 1 1 4 2Toyota Corolla 33.9 4 71.1 65 4.22 1.835 19.90 1 1 4 1

การหาบทสรุปทางสถิติของชุดข้อมูล mtcars -

>basicStats(mtcars)
<ก่อนหน้า> mpg cyl disp hp dratnobs 32.000000 32.000000 32.000000 32.000000 32.000000NAs 0.000000 0.000000 0.000000 0.000000 0.000000 ขั้นต่ำ 10.400000 4.000000 71.100000 52.000000 2.760000 สูงสุด 33.9000000 8.000000 472.000000 335.000000 4.930000 1.0000008000000 8.000000 3.000000 ไทล์ 230.721875 146.687500 3.596563Median 19,200000 6,000000 196,300000 123,000000 3.695000Sum 642,900000 198,000000 7383,100000 4694,000000 115.090000SE Mean 1,065424 0,315709 21,909473 12,120317 0,094519 LCLMean 17,917679 5,543607 186,037211 121,967950 3,403790 UCLMean 22,263571 6,831393 275,406539 171,407050 3.789335Variance 36.324103 3.189516 15,360.799829 4700.866935 0.285881Stdev 6,026948 1,785922 123,938694 68,562868 0.534679Skewness 0.610655 -0.174612 0.381657 0.726024 0.265904เคอร์โทซิส -0.372766 -1.762120 -1.2207212 -0.135551 -0.714701


<ก่อนหน้า> wt qsec เทียบกับ am gea r carbnobs 32.000000 32.000000 32.000000 32.000000 32.000000 32.000000NAs 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 ขั้นต่ำ 1.513000 14.500000 0.000000 0.000000 3.000000 1.000000 สูงสุด 5.424000 22.900000 1.000000 1.000000 5.000000 8.500 00 1.000000 ไทล์ 18.900000 1.000000 1.000000 4.000000 4.000000Mean 3,217250 17,848750 0,437500 0,406250 3,687500 2.812500Median 3,325000 17,710000 0,000000 0,000000 4,000000 2.000000Sum 102,952000 571,160000 14,000000 13,000000 118,000000 90.000000SE Mean 0,172968 0,315890 0,089098 0,088210 0,130427 0.285530LCL Mean 2,864478 17,204488 0,255783 0,226345 3,421493 2.230158UCL Mean 3,570022 18,493012 0,619217 0,586155 3,953507 3,394842 ความแปรปรวน 0.957379 3.193166 0.254032 0.248992 0.544355 2.608871Stdev 0.978457 1.786943 0.504016 0.498991 0.737804 1.615200 ความเบ้ 0.423146 0.369045 0.240258 0.364016 0.528854 1.050874Kurtosis -0.022711 0.335114 -2.001938 -1.924741 -1.069751 1.257043

มาดูตัวอย่างเพิ่มเติมอีก 2 ตัวอย่างโดยใช้ข้อมูลต้นไม้และข้อมูลแรงดันในฐาน R

ตัวอย่างข้อมูลต้นไม้ −

ตัวอย่าง

data(trees)head(trees,20)

ผลลัพธ์

 เส้นรอบวง ส่วนสูง ระดับเสียง 1 8.3 70 10.32 8.6 65 10.33 8.8 63 10.24 10.5 72 16.45 10.7 81 18.86 10.8 83 19.77 11.0 66 15.68 11.0 75 18.29 11.1 80 22.610 11.2 75 19.911 11.3 79 24.212 11.4 76 21.013 11.4 76 21.414 11.7 69 21. 19.116 12.9 74 22.217 12.9 85 33.818 13.3 86 27.419 13.7 71 25.720 13.8 64 24.9


>basicStats(trees)Girth Height Volumenobs 31.000000 31.000000 31.000000 NAs 0.000000 0.000000 0.000000 ขั้นต่ำ 8.300000 63.000000 10.200000 สูงสุด 20.600000 87.000000 77.000000 1. ควอร์ไทล์ 11.050000 72.000000 19.400000 3.Quartile 15.250000 80.000000 37.000000 ค่ามัธยฐาน 3076000000 สื่อ SE ค่าเฉลี่ย 0.563626 1.144411 2.952324LCL ค่าเฉลี่ย 12.097309 73.662800 24.141517 UCL ค่าเฉลี่ย 14.399466 78.337200 36.200418 ความแปรปรวน 9.847914 40.600000 270.202796 Stdev 3.138139 6.371813 16.437846 ความเบ้ 0.501056 -0.356877 1.01090.768 เคิร์ต 

ตัวอย่างข้อมูลแรงดัน −

ตัวอย่าง

ข้อมูล(ความดัน)หัว(ความดัน,20)

ผลลัพธ์

 ความดันอุณหภูมิ1 0 0.00022 20 0.00123 40 0.00604 60 0.03005 80 0.09006 100 0.27007 120 0.75008 140 1.85009 160 4.200010 180 8.800011 200 17.300012 220 32.100013 240 57.000014 260 96.000015 280 157.000016 300 247.000017 320 376.000018 34000 558.00pre19 


สถิติพื้นฐาน (ความดัน) ความดันอุณหภูมิ nobs 19.000000 19.000000NAs 0.000000 0.000000 ขั้นต่ำ 0.000000 0.000200 สูงสุด 360.000000 806.0000001 ควอร์ไทล์ 90.000000 0.1800003 ควอร์ไทล์ 270.000000 126.500000 ค่าเฉลี่ย 180.000000 124.336705 ค่ามัธยฐาน 180.000000 8.800000Sum 3420.000000 2362.397400SE ค่าเฉลี่ย 25.819889 51.531945LCL ค่าเฉลี่ย 125.754426 16.072107UCL ค่าเฉลี่ย 234.245574 232.601304 ความแปรปรวน 12666.666667 50455.285428 Stdev 112.5470.00>