วันนี้เรียน บทที่ 5 ซึ่งจะพูดถึง การ covert ข้อมูล การสรุปข้อมูลพื้นฐาน และการเลือกข้อมูล ใน pandasรูปแบบ การ covert วันเวลา
pd.to_datetime("2020-02-16")
สามารถใส่เป็น list ได้ คือ pd.to_datetime(["2020-02-16","2001-03-18"])
ถ้าต้องการตรวจสอบว่าใส่วันที่ผิดหรือไม่ให้ใช้
pd.to_datetime(["2020-02-16","abc"],errors="coerce") มันจะไม่ error
การ convert ตัวเลขให้ ใช้ to_numeric
การสรุปข้อมูลพื้นฐาน เช่น
df.describe(include="all")
df.info
df["START*"].value_counts() ทำให้รู้ unique data
การเลือกข้อมูล df.iloc[0:5,0:4]
ถ้าต้องการระบุชื่อ column ให้ใช้ df.loc["START*"] คือใส่ชื่อ column ที่ต้องการเลือก
ข้อสังเกต ถ้าเราเลือก column เดียว type จะเปลี่ยนจาก dataframe เป็น series ??
key short cut : run command ให้กด control + enter (ใน mac)
อีกอย่าง ถ้าต้องเก็บข้อมูลที่ทดลอง key ให้ save จะได้ file นามสกุล .ipynb ทำให้ไม่ต้องเสียเวลามาพิมพ์ใหม่