Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

ตารางฉุกเฉินใน Python


ตารางฉุกเฉินคือตารางที่แสดงการแจกแจงของตัวแปรหนึ่งตัวในแถวและอีกตัวแปรหนึ่งในคอลัมน์ ใช้เพื่อศึกษาความสัมพันธ์ระหว่างตัวแปรทั้งสอง เป็นตารางแบบหลายทางที่อธิบายชุดข้อมูลซึ่งการสังเกตแต่ละรายการอยู่ในหมวดหมู่เดียวสำหรับตัวแปรหลายตัวแต่ละตัว นอกจากนี้ยังเป็นการนับจำนวนระหว่างตัวแปรตามหมวดหมู่ตั้งแต่สองตัวขึ้นไป ตารางฉุกเฉินเรียกอีกอย่างว่าตารางไขว้หรือตารางสองทาง ซึ่งใช้ในสถิติเพื่อสรุปความสัมพันธ์ระหว่างตัวแปรตามหมวดหมู่ต่างๆ

สัมประสิทธิ์ฉุกเฉินคือสัมประสิทธิ์ของการเชื่อมโยงซึ่งบอกว่าตัวแปรหรือชุดข้อมูลสองตัวเป็นอิสระหรือขึ้นอยู่กับแต่ละตัวแปร หรือเรียกอีกอย่างว่าสัมประสิทธิ์ของเพียร์สัน

ตัวอย่าง

ในตัวอย่างด้านล่าง เราจะนำชุดข้อมูลดอกไอริสมาวิเคราะห์ ชุดข้อมูลนี้ประกอบด้วยตัวอย่าง 50 ตัวอย่างจากแต่ละสายพันธุ์ของม่านตาทั้งสาม (Iris setosa, Iris virginica และ Iris versicolor) แต่ละตัวอย่างวัดคุณลักษณะสี่ประการ:ความยาวและความกว้างของกลีบเลี้ยงและกลีบดอก มีหน่วยเป็นเซนติเมตร เราจะสร้างแบบจำลองฉุกเฉินสำหรับคุณลักษณะเหล่านี้ ซึ่งท้ายที่สุดแล้วจะใช้ในการแยกแยะสายพันธุ์ออกจากกันและกัน

การอ่านชุดข้อมูล

ตัวอย่าง

นำเข้า numpy เป็น npimport pandas เป็น pddatainput =pd.read_csv("iris.csv")print (datainput.head(5))

การเรียกใช้โค้ดด้านบนทำให้เราได้ผลลัพธ์ดังต่อไปนี้:

SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Species0 5.1 3.5 1.4 0.2 Iris-setosa1 4.9 3.0 1.4 0.2 Iris-setosa2 4.7 3.2 1.3 0.2 Iris-setosa3 4.6 3.1 1.5 0.2 Iris-setosa4 5.0 3.6 1.4 0.2 Iris-setosa

สถิติทั่วไปของข้อมูล

ต่อไป เรารวบรวมสถิติทั่วไปของข้อมูลโดยใช้คำอธิบาย () ไอทีให้แนวคิดเกี่ยวกับค่าเฉลี่ยและควอร์ไทล์ต่างๆ ของวิธีการกระจายข้อมูล

ตัวอย่าง

นำเข้า numpy เป็น npimport pandas เป็น pddatainput =pd.read_csv("iris.csv")print(datainput.describe())

การเรียกใช้โค้ดด้านบนทำให้เราได้ผลลัพธ์ดังต่อไปนี้:

SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCmcount 150.000000 150.000000 150.000000 150.000000mean 5.843333 3.054000 3.758667 1.198667std 0.828066 0.433594 1.764420 0.763161 min 4.300000 2.000000 1.000000 0.100000025% 600000002.000000000.000.000.000.000.000.000.000.000.000.000.000.00 

ประเภทข้อมูล

ต่อไปเราจะสังเกตประเภทข้อมูลต่างๆ ของคอลัมน์ใน dataframe

ตัวอย่าง

นำเข้า numpy เป็น npimport pandas เป็น pddatainput =pd.read_csv("iris.csv")print(datainput.dtypes)

การเรียกใช้โค้ดด้านบนทำให้เราได้ผลลัพธ์ดังต่อไปนี้:

SepalLengthCm float64SepalWidthCm float64PetalLengthCm float64PetalWidthCm float64Species objectdtype:object

การสร้างตารางฉุกเฉิน

ตอนนี้เราสร้างตารางฉุกเฉินสำหรับคอลัมน์ที่แสดงความกว้างของกลีบดอกไม้แต่ละชนิด สำหรับสิ่งนี้ เราใช้ฟังก์ชันครอสแท็บที่มีอยู่ในแพนด้า และตั้งชื่อคอลัมน์พ่วงเหล่านี้เป็นอินพุต

ตัวอย่าง

นำเข้า numpy เป็น npimport pandas เป็น pddatainput =pd.read_csv("iris.csv") width_species =pd.crosstab(datainput['PetalWidthCm'],datainput['Species'],margins =False)print(width_species)

การเรียกใช้โค้ดด้านบนทำให้เราได้ผลลัพธ์ดังต่อไปนี้:

สายพันธุ์ Iris-setosa Iris-versicolor Iris-virginicaPetalWidthCm0.1 6 0 00.2 28 0 00.3 7 0 01.0 0 7 01.1 0 3 01.2 0 5 01.8 0 1 111.9 0 0 52.0 0 0 62.1 0 0 62.5 0 0 3 

ตารางฉุกเฉินหลายตัวแปร

ในกรณีนี้ เราใช้มากกว่าสองคอลัมน์เพื่อสร้างตารางฉุกเฉิน ในที่นี้เราใช้ทั้งความยาวกลีบและความกว้างของกลีบดอกไม้แต่ละชนิด

นำเข้า numpy เป็น npimport pandas เป็น pddatainput =pd.read_csv("iris.csv")length_width_species =pd.crosstab([datainput.PetalLengthCm, datainput.PetalWidthCm],datainput.Species, margins =False_) พิมพ์ (ความยาว) /pre> 

การเรียกใช้โค้ดด้านบนทำให้เราได้ผลลัพธ์ดังต่อไปนี้:

สายพันธุ์ Iris-setosa Iris-versicolor Iris-virginicaPetalLengthCm PetalWidthCm1.0 0.2 1 0 01.1 0.1 1 0 01.2 0.2 2 0 01.3 0.2 4 0 00.3 2 0 0... ... ... ...6.4 2.0 0 0 16.6 2.1 0 0 16.7 2.0 0 0 12.2 0 0 16.9 2.3 0 0 1