Python : Machine Learning [4]
วันนี้เรียน บทที่ 6,7 สอนเกี่ยวกับ การกรองข้อมูล การเรียงข้อมูล การเพิ่มcolumn กรองข้อมูล คือการกำหนด condition ใน loc แล้วเลือกว่าจะให้แสดง column ใดบ้าง ส่วน reset_index() เมื่อต้องการให้เรียงจาก 0 df1=df.loc[df["MILES*"] >10,["MILES*"]].head(n=5).reset_index() มีการใช้ isin ด้วย ดูรูปข้างล่าง ถ้ามี 2 condition ก็ให้ใช้เครื่องหมาย & มาเชื่อม
การเรียงข้อมูล ใช้ sort_values df.sort_values(by=["START*","MILES*"],ascending=[True,False]).head(n=5)
การเพิ่ม column ต้องใช้ numpy มาช่วย ประมาณนี้ import numpy as np df["my_cat"] = np.where(df["MILES*"]>5,"Long","Short") df.head(n=3)
ตอนแรกดูง่ายๆ หลังๆเริ่มสับสน 


Create Date : 16 สิงหาคม 2563 |
Last Update : 16 สิงหาคม 2563 15:05:43 น. |
|
0 comments
|
Counter : 775 Pageviews. |
 |
|
|
| |