Python : Machine Learning [5]
เมื่อวานเรียนบทที่ 8 สอนเรื่อง Grouping Data
โดยใช้หลัก Split Apply Combine SAC งงส่ะ 2

res=df.groupby("START*")["MILES*"].agg(["mean"]).head(20)
ทำ grouping ด้วย column START* แล้วนำค่า MILES* มาคำนวณค่าเฉลี่ย และให้แสดงผลเพียง 20 บรรทัด

res.reset_index(inplace=True)
res.columns=["START_CITY","AVG_DIST"]

กำหนดชื่อ column ใหม่ ให้เข้าใจง่ายขึ้น แต่ต้อง reset_index ก่อนนะ งงๆ เหมือนกัน

res=df.groupby(["START*","STOP*"])["MILES*"].agg(["mean","max","min"]).head(20)
เพิ่มการคำนวณหาค่า max min จาก column MILES*

res=df.groupby(["START*"]).agg({"MILES*":["mean"],"START_DATE*":["min","max"]}).head(20)
ถ้าเราต้องการคำนวณค่า คนละcolumnกัน ต้องใช้ datetype แบบ dictionary {} แล้วกำหนดเป็นคู่ๆไป

df["START_DATE*"]=pd.to_datetime(df["START_DATE*"],format="%m/%d/%Y %H:%M")
START_DATE* ต้องแปลงให้เป็น datetime ก่อน ถึงจะคำนวณได้ ถ้าทำแล้วเกิด ERROR ให้ดูข้อมูล Uber.csv ที่ให้มาว่ามีบรรทัดได้ที่รูปแบบไม่ถูกต้อง ??

ทดลองก็ประมาณรูปข้างล่างครับ




ข้างล่างแสดงการ convert datetime





Create Date : 20 สิงหาคม 2563
Last Update : 20 สิงหาคม 2563 21:30:22 น.
Counter : 384 Pageviews.

0 comments
Lamborghini Sian ที่ถูกผลิตด้วย LEGO กว่า 4 แสนชิ้น หนักราว ๆ 2.2 ตัน : ข่าวต่างประเทศ Pooh Station TH
(9 มิ.ย. 2564 12:54:30 น.)
เอาละผมว่าเจ้า MG 5 2021 ใกล้จะคลอดเต็มที่แล้วละครับผม Pooh Station TH
(18 พ.ค. 2564 15:25:19 น.)
อัพเดตออกมาเรื่อย ๆ กับเจ้า Honda Vezel (Honda HR-V ในไทย ) Pooh Station TH
(2 พ.ค. 2564 16:15:33 น.)
เผยหน้าตากันแล้วกับ All-New Honda Civic (GEN 11) สำหรับประเทศสหรัฐอเมริกา มิติตัวถังใหญ่ขึ้นทุกมิติ ความสปอร์ตก็ลดลงหน่อย Pooh Station TH
(29 เม.ย. 2564 13:26:55 น.)
ชื่อ :
Comment :
 *ใช้ code html ตกแต่งข้อความได้เฉพาะสมาชิก
 

J-learning.BlogGang.com

wink99_th
Location :
พิษณุโลก  Thailand

[ดู Profile ทั้งหมด]
 ผู้ติดตามบล็อก : 8 คน [?]

บทความทั้งหมด