ตารางฉุกเฉินคือตารางที่แสดงการแจกแจงของตัวแปรหนึ่งตัวในแถวและอีกตัวแปรหนึ่งในคอลัมน์ ใช้เพื่อศึกษาความสัมพันธ์ระหว่างตัวแปรทั้งสอง เป็นตารางแบบหลายทางที่อธิบายชุดข้อมูลซึ่งการสังเกตแต่ละรายการอยู่ในหมวดหมู่เดียวสำหรับตัวแปรหลายตัวแต่ละตัว นอกจากนี้ยังเป็นการนับจำนวนระหว่างตัวแปรตามหมวดหมู่ตั้งแต่สองตัวขึ้นไป ตารางฉุกเฉินเรียกอีกอย่างว่าตารางไขว้หรือตารางสองทาง ซึ่งใช้ในสถิติเพื่อสรุปความสัมพันธ์ระหว่างตัวแปรตามหมวดหมู่ต่างๆ
สัมประสิทธิ์ฉุกเฉินคือสัมประสิทธิ์ของการเชื่อมโยงซึ่งบอกว่าตัวแปรหรือชุดข้อมูลสองตัวเป็นอิสระหรือขึ้นอยู่กับแต่ละตัวแปร หรือเรียกอีกอย่างว่าสัมประสิทธิ์ของเพียร์สัน
ตัวอย่าง
ในตัวอย่างด้านล่าง เราจะนำชุดข้อมูลดอกไอริสมาวิเคราะห์ ชุดข้อมูลนี้ประกอบด้วยตัวอย่าง 50 ตัวอย่างจากแต่ละสายพันธุ์ของม่านตาทั้งสาม (Iris setosa, Iris virginica และ Iris versicolor) แต่ละตัวอย่างวัดคุณลักษณะสี่ประการ:ความยาวและความกว้างของกลีบเลี้ยงและกลีบดอก มีหน่วยเป็นเซนติเมตร เราจะสร้างแบบจำลองฉุกเฉินสำหรับคุณลักษณะเหล่านี้ ซึ่งท้ายที่สุดแล้วจะใช้ในการแยกแยะสายพันธุ์ออกจากกันและกัน
การอ่านชุดข้อมูล
ตัวอย่าง
นำเข้า numpy เป็น npimport pandas เป็น pddatainput =pd.read_csv("iris.csv")print (datainput.head(5))
การเรียกใช้โค้ดด้านบนทำให้เราได้ผลลัพธ์ดังต่อไปนี้:
SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Species0 5.1 3.5 1.4 0.2 Iris-setosa1 4.9 3.0 1.4 0.2 Iris-setosa2 4.7 3.2 1.3 0.2 Iris-setosa3 4.6 3.1 1.5 0.2 Iris-setosa4 5.0 3.6 1.4 0.2 Iris-setosa
สถิติทั่วไปของข้อมูล
ต่อไป เรารวบรวมสถิติทั่วไปของข้อมูลโดยใช้คำอธิบาย () ไอทีให้แนวคิดเกี่ยวกับค่าเฉลี่ยและควอร์ไทล์ต่างๆ ของวิธีการกระจายข้อมูล
ตัวอย่าง
นำเข้า numpy เป็น npimport pandas เป็น pddatainput =pd.read_csv("iris.csv")print(datainput.describe())
การเรียกใช้โค้ดด้านบนทำให้เราได้ผลลัพธ์ดังต่อไปนี้:
SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCmcount 150.000000 150.000000 150.000000 150.000000mean 5.843333 3.054000 3.758667 1.198667std 0.828066 0.433594 1.764420 0.763161 min 4.300000 2.000000 1.000000 0.100000025% 600000002.000000000.000.000.000.000.000.000.000.000.000.000.000.00ประเภทข้อมูล
ต่อไปเราจะสังเกตประเภทข้อมูลต่างๆ ของคอลัมน์ใน dataframe
ตัวอย่าง
นำเข้า numpy เป็น npimport pandas เป็น pddatainput =pd.read_csv("iris.csv")print(datainput.dtypes)การเรียกใช้โค้ดด้านบนทำให้เราได้ผลลัพธ์ดังต่อไปนี้:
SepalLengthCm float64SepalWidthCm float64PetalLengthCm float64PetalWidthCm float64Species objectdtype:objectการสร้างตารางฉุกเฉิน
ตอนนี้เราสร้างตารางฉุกเฉินสำหรับคอลัมน์ที่แสดงความกว้างของกลีบดอกไม้แต่ละชนิด สำหรับสิ่งนี้ เราใช้ฟังก์ชันครอสแท็บที่มีอยู่ในแพนด้า และตั้งชื่อคอลัมน์พ่วงเหล่านี้เป็นอินพุต
ตัวอย่าง
นำเข้า numpy เป็น npimport pandas เป็น pddatainput =pd.read_csv("iris.csv") width_species =pd.crosstab(datainput['PetalWidthCm'],datainput['Species'],margins =False)print(width_species)การเรียกใช้โค้ดด้านบนทำให้เราได้ผลลัพธ์ดังต่อไปนี้:
สายพันธุ์ Iris-setosa Iris-versicolor Iris-virginicaPetalWidthCm0.1 6 0 00.2 28 0 00.3 7 0 01.0 0 7 01.1 0 3 01.2 0 5 01.8 0 1 111.9 0 0 52.0 0 0 62.1 0 0 62.5 0 0 3ก่อน>ตารางฉุกเฉินหลายตัวแปร
ในกรณีนี้ เราใช้มากกว่าสองคอลัมน์เพื่อสร้างตารางฉุกเฉิน ในที่นี้เราใช้ทั้งความยาวกลีบและความกว้างของกลีบดอกไม้แต่ละชนิด
นำเข้า numpy เป็น npimport pandas เป็น pddatainput =pd.read_csv("iris.csv")length_width_species =pd.crosstab([datainput.PetalLengthCm, datainput.PetalWidthCm],datainput.Species, margins =False_) พิมพ์ (ความยาว) /pre>การเรียกใช้โค้ดด้านบนทำให้เราได้ผลลัพธ์ดังต่อไปนี้:
สายพันธุ์ Iris-setosa Iris-versicolor Iris-virginicaPetalLengthCm PetalWidthCm1.0 0.2 1 0 01.1 0.1 1 0 01.2 0.2 2 0 01.3 0.2 4 0 00.3 2 0 0... ... ... ...6.4 2.0 0 0 16.6 2.1 0 0 16.7 2.0 0 0 12.2 0 0 16.9 2.3 0 0 1