Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

สามารถสร้าง dataframe โดยใช้พจนานุกรมของ Series ใน Python ได้อย่างไร


Dataframe คือโครงสร้างข้อมูลสองมิติ โดยที่ข้อมูลจะถูกจัดเก็บในรูปแบบตาราง ในรูปแบบของแถวและคอลัมน์

สามารถมองเห็นเป็นตารางข้อมูล SQL หรือการแสดงแผ่นงาน Excel สามารถสร้างได้โดยใช้ตัวสร้างต่อไปนี้ -

pd.Dataframe(data, index, columns, dtype, copy)

ให้เราเข้าใจว่าสามารถสร้าง dataframe ได้อย่างไรโดยใช้พจนานุกรมของ Series

  • ซีรีส์เป็นโครงสร้างข้อมูลแบบมิติเดียวที่มีอยู่ในไลบรารี "แพนด้า"

  • ป้ายแกนเรียกรวมกันว่าดัชนี

  • โครงสร้างชุดข้อมูลสามารถจัดเก็บข้อมูลประเภทใดก็ได้ เช่น จำนวนเต็ม ทุ่น สตริง ออบเจ็กต์หลาม และอื่นๆ

เรามาดูตัวอย่างกัน −

ตัวอย่าง

import pandas as pd
my_data = {'ab' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
'mn' : pd.Series([56, 78, 13, 13], index=['a', 'b', 'c', 'd'])}
my_df = pd.DataFrame(my_data)
print("The dataframe created from dictionary of series : ")
print(my_df)

ผลลัพธ์

The dataframe created from dictionary f series :
   ab   mn
a  1.0  56
b  2.0  78
c  3.0  13
d  NaN  13

คำอธิบาย

  • ไลบรารีที่จำเป็นจะถูกนำเข้า และให้ชื่อแทนเพื่อความสะดวกในการใช้งาน

  • ค่าพจนานุกรมที่ประกอบด้วยคีย์และค่าจะถูกสร้างขึ้น โดยที่ค่านั้นเป็นโครงสร้างข้อมูลแบบอนุกรม

  • พจนานุกรมของซีรีส์นี้จะถูกส่งต่อในภายหลังเป็นพารามิเตอร์ไปยังฟังก์ชัน 'Dataframe' ที่มีอยู่ในไลบรารี 'pandas'

  • ดาต้าเฟรมถูกสร้างขึ้นโดยส่งพจนานุกรมของซีรีส์เป็นพารามิเตอร์ไป

  • พิมพ์ดาต้าเฟรมบนคอนโซล

หมายเหตุ − คำว่า 'NaN' หมายถึง 'ไม่ใช่ตัวเลข' ซึ่งหมายความว่าค่า [row,col] เฉพาะไม่มีรายการที่ถูกต้อง