หน้าแรก
หน้าแรก
Dataframe คือโครงสร้างข้อมูลสองมิติ โดยที่ข้อมูลจะถูกจัดเก็บในรูปแบบตาราง ในรูปแบบของแถวและคอลัมน์ สามารถแสดงเป็นตารางข้อมูล SQL หรือการแสดงแผ่นงาน Excel ได้ สามารถสร้างได้โดยใช้ตัวสร้างต่อไปนี้ - pd.Dataframe(data, index, columns, dtype, copy) data, index, columns, dtype และ copy ไม่ใช่ค่าบังคับ
Dataframe คือโครงสร้างข้อมูลสองมิติ โดยที่ข้อมูลจะถูกจัดเก็บในรูปแบบตาราง ในรูปแบบของแถวและคอลัมน์ สามารถมองเห็นเป็นตารางข้อมูล SQL หรือการแสดงแผ่นงาน Excel สามารถสร้างได้โดยใช้ตัวสร้างต่อไปนี้ - pd.Dataframe(data, index, columns, dtype, copy) คุณสามารถเพิ่มคอลัมน์ใหม่ลงใน dataframe ได้หลายวิธี ใ
Dataframe คือโครงสร้างข้อมูลสองมิติ โดยที่ข้อมูลจะถูกจัดเก็บในรูปแบบตาราง ในรูปแบบของแถวและคอลัมน์ สามารถมองเห็นเป็นตารางข้อมูล SQL หรือการแสดงแผ่นงาน Excel สามารถสร้างได้โดยใช้ตัวสร้างต่อไปนี้ - pd.Dataframe(data, index, columns, dtype, copy) ให้เราเข้าใจว่าสามารถสร้าง dataframe ได้อย่างไรโดยใช้พ
Dataframe คือโครงสร้างข้อมูลสองมิติ โดยที่ข้อมูลจะถูกจัดเก็บในรูปแบบตาราง ในรูปแบบของแถวและคอลัมน์ สามารถมองเห็นเป็นตารางข้อมูล SQL หรือการแสดงแผ่นงาน Excel คอลัมน์ใน dataframe สามารถลบได้โดยใช้วิธีการต่างๆ เราจะเห็นตัวดำเนินการ del ที่ใช้ชื่อของคอลัมน์ที่ต้องการลบเป็นพารามิเตอร์แล้วลบออก - ตัวอย่
การแสดงข้อมูลเป็นภาพเป็นขั้นตอนที่สำคัญ เนื่องจากช่วยให้เข้าใจสิ่งที่เกิดขึ้นในข้อมูลโดยไม่ต้องดูตัวเลขจริงๆ และทำการคำนวณที่ซับซ้อน ช่วยในการสื่อสารข้อมูลเชิงลึกเชิงปริมาณไปยังผู้ชมอย่างมีประสิทธิภาพ Seaborn เป็นห้องสมุดที่ช่วยในการแสดงข้อมูล มันมาพร้อมกับธีมที่ปรับแต่งเองและอินเทอร์เฟซระดับสูง ใ
Dataframe คือโครงสร้างข้อมูลสองมิติ โดยที่ข้อมูลจะถูกจัดเก็บในรูปแบบตาราง ในรูปแบบของแถวและคอลัมน์ สามารถมองเห็นเป็นตารางข้อมูล SQL หรือการแสดงแผ่นงาน Excel คอลัมน์ใน dataframe สามารถลบได้โดยใช้วิธีการต่างๆ เราจะเห็นฟังก์ชันป๊อปที่ใช้ชื่อคอลัมน์ที่ต้องการลบเป็นพารามิเตอร์แล้วลบทิ้ง ตัวอย่าง import
บางครั้ง อาจจำเป็นต้องได้รับผลรวมของคอลัมน์เฉพาะ นี่คือจุดที่สามารถใช้ฟังก์ชัน sum ได้ คอลัมน์ที่ต้องคำนวณผลรวมสามารถส่งผ่านเป็นค่าไปยังฟังก์ชันผลรวมได้ ดัชนีของคอลัมน์ยังสามารถส่งต่อเพื่อหาผลรวมได้ ให้เราดูการสาธิตของสิ่งเดียวกัน - ตัวอย่าง import pandas as pd my_data = {'Name':pd.Series(
Dataframe เป็นโครงสร้างข้อมูลสองมิติ โดยที่ข้อมูลจะถูกจัดเก็บในรูปแบบตาราง ในรูปแบบของแถวและคอลัมน์ สามารถแสดงเป็นตารางข้อมูล SQL หรือการแสดงแผ่นงาน Excel ได้ สามารถสร้างได้โดยใช้ตัวสร้างต่อไปนี้ - pd.Dataframe(data, index, columns, dtype, copy) ก่อนหน้านี้เราได้เห็นวิธีการที่คอลัมน์ใหม่ถูกสร้างขึ
บางครั้ง อาจจำเป็นต้องได้รับค่าเฉลี่ยของคอลัมน์เฉพาะ หรือค่ากลางของคอลัมน์ทั้งหมดที่มีค่าตัวเลข นี่คือจุดที่สามารถใช้ฟังก์ชัน mean() ได้ คำว่า ค่าเฉลี่ย หมายถึงการหาผลรวมของค่าทั้งหมดและหารด้วยจำนวนค่าทั้งหมดในชุดข้อมูล ให้เราดูการสาธิตของสิ่งเดียวกัน - ตัวอย่าง import pandas as pd my_data = {'
โดยทั่วไปการประมวลผลข้อมูลล่วงหน้าหมายถึงงานในการรวบรวมข้อมูลทั้งหมด (ซึ่งรวบรวมจากแหล่งข้อมูลต่างๆ หรือทรัพยากรเดียว) ในรูปแบบทั่วไปหรือเป็นชุดข้อมูลเดียวกัน (ขึ้นอยู่กับประเภทของข้อมูล) เนื่องจากข้อมูลในโลกแห่งความเป็นจริงไม่เคยอยู่ในอุดมคติ จึงมีความเป็นไปได้ที่ข้อมูลจะไม่มีเซลล์ ข้อผิดพลาด ค่าผิ
การประมวลผลข้อมูลล่วงหน้าโดยทั่วไปหมายถึงงานในการรวบรวมข้อมูลทั้งหมด (ซึ่งรวบรวมจากแหล่งข้อมูลต่างๆ หรือทรัพยากรเดียว) ให้อยู่ในรูปแบบทั่วไปหรือเป็นชุดข้อมูลเดียวกัน (ขึ้นอยู่กับประเภทของข้อมูล) เนื่องจากข้อมูลในโลกแห่งความเป็นจริงไม่เคยอยู่ในอุดมคติ จึงมีความเป็นไปได้ที่ข้อมูลนั้นจะไม่มีเซลล์ ข้อผ
Scikit-learn หรือที่เรียกกันทั่วไปว่า sklearn เป็นไลบรารี่ใน Python ที่ใช้สำหรับวัตถุประสงค์ในการใช้อัลกอริธึมการเรียนรู้ของเครื่อง เป็นห้องสมุดโอเพ่นซอร์สจึงสามารถใช้งานได้ฟรี ไลบรารีนี้สร้างขึ้นบนไลบรารี Numpy, SciPy และ Matplotlib วิธีการ กำลังสองเดินขบวน ใช้เพื่อค้นหารูปทรงในภาพ ใช้ฟังก์ชัน fin
NumPy หมายถึง ตัวเลข Python เป็นไลบรารีที่มีอ็อบเจ็กต์อาร์เรย์หลายมิติและหลายวิธีที่ช่วยในการประมวลผลอาร์เรย์ NumPy สามารถใช้เพื่อดำเนินการกับอาร์เรย์ได้หลากหลาย ใช้ร่วมกับแพ็คเกจเช่น SciPy, Matplotlib เป็นต้น NumPy+Matplotlib สามารถเข้าใจได้ว่าเป็นทางเลือกแทน MatLab เป็นแพ็คเกจโอเพ่นซอร์ส ซึ่งหมายค
โครงสร้างการตัดสินใจเป็นหน่วยการสร้างพื้นฐานของอัลกอริธึมฟอเรสต์แบบสุ่ม ถือว่าเป็นหนึ่งในอัลกอริธึมที่ได้รับความนิยมมากที่สุดในการเรียนรู้ของเครื่องและใช้เพื่อวัตถุประสงค์ในการจัดหมวดหมู่ เป็นที่นิยมอย่างมากเพราะเข้าใจง่าย การตัดสินใจที่กำหนดโดยแผนผังการตัดสินใจสามารถใช้เพื่ออธิบายว่าทำไมจึงมีการคา
บางครั้ง อาจจำเป็นต้องได้รับค่าเฉลี่ยของคอลัมน์เฉพาะที่เป็นตัวเลขในลักษณะที่เป็นตัวเลข นี่คือจุดที่สามารถใช้ฟังก์ชัน ค่าเฉลี่ย ได้ คอลัมน์ที่ต้องการคำนวณค่าเฉลี่ยสามารถจัดทำดัชนีไปยังดาต้าเฟรม และสามารถเรียกใช้ฟังก์ชันค่าเฉลี่ยได้โดยใช้ตัวดำเนินการจุด นอกจากนี้ยังสามารถส่งผ่านดัชนีของคอลัมน์เพื่อค
ส่วนเบี่ยงเบนมาตรฐานจะบอกถึงวิธีการกระจายค่าในชุดข้อมูล และยังบอกด้วยว่าค่าในชุดข้อมูลอยู่ห่างจากค่าเฉลี่ยเลขคณิตของคอลัมน์ในชุดข้อมูลมากเพียงใด บางครั้ง อาจจำเป็นต้องได้รับค่าเบี่ยงเบนมาตรฐานของคอลัมน์เฉพาะที่เป็นตัวเลข นี่คือจุดที่สามารถใช้ฟังก์ชัน std() ได้ คอลัมน์ที่ต้องการคำนวณค่าเฉลี่ยสามารถจ
สามารถรับข้อมูลจำนวนมากเกี่ยวกับข้อมูลได้โดยใช้ฟังก์ชันต่างๆ แต่ถ้าเราต้องการรับข้อมูลทั้งหมดเกี่ยวกับข้อมูล สามารถใช้ฟังก์ชัน อธิบาย ได้ ฟังก์ชันนี้จะให้ข้อมูล เช่น จำนวน ค่าเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน เปอร์เซ็นไทล์ที่ 25 เปอร์เซ็นไทล์ที่ 50 และเปอร์เซ็นไทล์ที่ 75 ตัวอย่าง import pandas as pd my_da
บางครั้งอาจจำเป็นต้องใช้ฟังก์ชันบางอย่างตามแกนของดาต้าเฟรม สามารถระบุแกนได้ มิฉะนั้น แกนเริ่มต้นจะถือเป็นคอลัมน์ที่ชาญฉลาด โดยที่ทุกคอลัมน์ถือเป็นอาร์เรย์ หากระบุแกน การดำเนินการจะดำเนินการตามแถวกับข้อมูล ฟังก์ชัน ใช้ สามารถใช้ร่วมกับตัวดำเนินการจุดบนดาต้าเฟรม เรามาดูตัวอย่างกัน − ตัวอย่าง import
บางครั้งอาจจำเป็นต้องใช้ฟังก์ชันบางอย่างกับองค์ประกอบของดาต้าเฟรม ฟังก์ชันทั้งหมดไม่สามารถกำหนดเวกเตอร์ได้ นี่คือที่มาของฟังก์ชัน applymap สิ่งนี้ใช้ค่าเดียวเป็นอินพุตและส่งกลับค่าเดียวเป็นเอาต์พุต ตัวอย่าง import pandas as pd import numpy as np my_df = pd.DataFrame(np.random.randn(5,5),columns=[
ข้อมูลก่อนการประมวลผลหมายถึงการล้างข้อมูล การลบข้อมูลที่ไม่ถูกต้อง สัญญาณรบกวน การแทนที่ข้อมูลด้วยค่าที่เกี่ยวข้อง และอื่นๆ ไม่ได้หมายถึงข้อมูลข้อความเสมอไป มันอาจเป็นภาพหรือการประมวลผลวิดีโอเช่นกัน เป็นขั้นตอนสำคัญในไปป์ไลน์แมชชีนเลิร์นนิง การประมวลผลข้อมูลล่วงหน้าโดยทั่วไปหมายถึงงานในการรวบรวมข้