Sufficiency Economy
Group Blog
 
All blogs
 

pyTorch

แป๊ะไว้ว่างๆ จะมาฝึก 




 

Create Date : 28 มีนาคม 2567    
Last Update : 28 มีนาคม 2567 14:54:32 น.
Counter : 71 Pageviews.  
(โหวต blog นี้) 

Youtube การใช้ Tkinter python

แป๊บไว้ สำหรับว่างๆ จะมาฝึก




 

Create Date : 14 มีนาคม 2567    
Last Update : 14 มีนาคม 2567 15:02:22 น.
Counter : 130 Pageviews.  
(โหวต blog นี้) 

Python : Machine Learning [6]

เรียนบทที่ 9 และ 10
เราสามารถ หาข้อมูล dataset มาทดสอบได้จากที่ web : kaggle และสามารถเขียน python วิเคราะห์ ข้อมูลได้ด้วย ... คงต้องไปลองเล่นดูหลังจบ course นี้ก่อน

ที่เหลือก็สอนการใช้ function พื้นฐานของ numpy ได้แก่
1. array สร้างarray ซึ่งมีข้อดีกว่าที่อยู่ใน python เพราะนำข้อมูลมาบวกกันได้เลย แต่ใน python จะเป็นการต่อข้อมูลแทน ให้ดูรูปข้างล่างจะเข้าใจ

2. arrange สร้าง array แบบตัวเลข อัตโนมัติ 
c = np.arange(10) แต่ถ้าให้มีการเพิ่มแบบ step ก็ให้เขียนแบบนี้ 
c = np.arange(0,20,2) เพิ่มทีละ 2 แต่ห้ามเกิน 20

3. การนำ array ของ numpy มา reshape ทำให้ได้ข้อมูล array หลายมิติ  เพราะส่วนใหญ่เราจะเห็นแค่ 2 มิติ แต่ดูงงๆ 1

4. สร้างarray มีค่าเป็นศูนย์ np.zeros(5) 
5. สร้างarray มีค่าเป็นหนึ่ง np.ones(5)
6. สร้าง identity matrix np.eye(5)

หมายเหตุ เพิ่งรู้วิธีจัดการ cell แบบ markdown เพื่อใช้อธิบาย โดยใช้ tag html ธรรมดาเลย อ่านจากที่ link นี้ครับ กดเลย




 

Create Date : 07 กันยายน 2563    
Last Update : 7 กันยายน 2563 20:44:31 น.
Counter : 1163 Pageviews.  

Python : Machine Learning [5]

เมื่อวานเรียนบทที่ 8 สอนเรื่อง Grouping Data
โดยใช้หลัก Split Apply Combine SAC งงส่ะ 2

res=df.groupby("START*")["MILES*"].agg(["mean"]).head(20)
ทำ grouping ด้วย column START* แล้วนำค่า MILES* มาคำนวณค่าเฉลี่ย และให้แสดงผลเพียง 20 บรรทัด

res.reset_index(inplace=True)
res.columns=["START_CITY","AVG_DIST"]

กำหนดชื่อ column ใหม่ ให้เข้าใจง่ายขึ้น แต่ต้อง reset_index ก่อนนะ งงๆ เหมือนกัน

res=df.groupby(["START*","STOP*"])["MILES*"].agg(["mean","max","min"]).head(20)
เพิ่มการคำนวณหาค่า max min จาก column MILES*

res=df.groupby(["START*"]).agg({"MILES*":["mean"],"START_DATE*":["min","max"]}).head(20)
ถ้าเราต้องการคำนวณค่า คนละcolumnกัน ต้องใช้ datetype แบบ dictionary {} แล้วกำหนดเป็นคู่ๆไป

df["START_DATE*"]=pd.to_datetime(df["START_DATE*"],format="%m/%d/%Y %H:%M")
START_DATE* ต้องแปลงให้เป็น datetime ก่อน ถึงจะคำนวณได้ ถ้าทำแล้วเกิด ERROR ให้ดูข้อมูล Uber.csv ที่ให้มาว่ามีบรรทัดได้ที่รูปแบบไม่ถูกต้อง ??

ทดลองก็ประมาณรูปข้างล่างครับ




ข้างล่างแสดงการ convert datetime





 

Create Date : 20 สิงหาคม 2563    
Last Update : 20 สิงหาคม 2563 21:30:22 น.
Counter : 928 Pageviews.  

Python : Machine Learning [4]

วันนี้เรียน บทที่ 6,7 สอนเกี่ยวกับ การกรองข้อมูล การเรียงข้อมูล การเพิ่มcolumn
กรองข้อมูล คือการกำหนด condition ใน loc แล้วเลือกว่าจะให้แสดง column ใดบ้าง
ส่วน reset_index() เมื่อต้องการให้เรียงจาก 0 
df1=df.loc[df["MILES*"] >10,["MILES*"]].head(n=5).reset_index()
มีการใช้ isin ด้วย ดูรูปข้างล่าง
ถ้ามี 2 condition ก็ให้ใช้เครื่องหมาย & มาเชื่อม

การเรียงข้อมูล
ใช้ sort_values
df.sort_values(by=["START*","MILES*"],ascending=[True,False]).head(n=5)

การเพิ่ม column
ต้องใช้ numpy มาช่วย ประมาณนี้
import numpy as np
df["my_cat"] = np.where(df["MILES*"]>5,"Long","Short")
df.head(n=3)

ตอนแรกดูง่ายๆ หลังๆเริ่มสับสน 2





 




 

Create Date : 16 สิงหาคม 2563    
Last Update : 16 สิงหาคม 2563 15:05:43 น.
Counter : 618 Pageviews.  

1  2  3  4  5  6  7  

wink99_th
Location :
พิษณุโลก Thailand

[Profile ทั้งหมด]

ฝากข้อความหลังไมค์
Rss Feed
Smember
ผู้ติดตามบล็อก : 8 คน [?]




New Comments
Friends' blogs
[Add wink99_th's blog to your web]
Links
 

 Pantip.com | PantipMarket.com | Pantown.com | © 2004 BlogGang.com allrights reserved.