การใช้งานโปรแกรม Weka ใช้ในการวิเคราะห์ข้อมูลด้วยเทคนิคเหมืองข้อมูล

การใช้งานโปรแกรม weka

          ในบทความนี้จะสอนการใช้งานโปรแกรมวิเคราะห์ข้อมูลนั้นก็คือโปรแกรม weka ก่อนอื่นมาทำความรู้จักกับโปรแกรม weka กันก่อนนะครับ

โปรแกรม Weka คืออะไร

โปรแกรม Weka เป็นโปรแกรมที่ใช้ในการวิเคราะห์ข้อมูลด้วยเทคนิคเหมืองข้อมูล เทคนิคเหมืองข้อมูลคือกระบวนการวิเคราะห์ข้อมูลจากข้อมูลจำนวนมากเพื่อหาความสัมพันธ์ รูปแบบและแยกประเภทของข้อมูล และ weka นั้นยังได้รวบรวมเทคนิคในการวิเคราะห์ข้อมูลหลายๆ เทคนิคเข้าไว้ด้วยกัน แถมยังสามารถวิเคราะห์ข้อมูลเหล่านี้ได้ง่ายๆ ผ่านทางหน้าจอ GUI (Graphic User Interface) ของWeka ! อีกด้วย ซึ่งนับว่าทำให้ผู้ใช้สามารถทำงานได้อย่างสะดวกสบายมากขึ้น

ข้อดีของโปรแกรม Weka

  1. เป็นซอฟต์แวร์เสรีที่สามารถดาวน์โหลดได้ฟรี
  2.  สามารถทางานได้ทุกระบบปฏิบัติการ
  3. เชื่อมต่อ SQL Database โดยใช้ Java Database Connectivity
  4.  มีการเตรียมข้อมูลและเทคนิคในการสร้างแบบจาลองที่ครอบคลุม
  5.  มีลักษณะที่ง่ายต่อการใช้งานเนื่องจากใช้
  6.  สนับสนุนเกี่ยวกับการทาเหมืองข้อมูล (Data Mining)
  7. การเตรียมข้อมูล (Data Preprocessing)
  8. การทาเหมืองข้อมูลด้วยเทคนิคการจาแนกข้อมูล (Classification)
  9. การทาเหมืองข้อมูลด้วยเทคนิคการจัดกลุ่ม (Clustering)
  10. การทาเหมืองข้อมูลด้วยเทคนิคการวิเคราะห์ความสัมพันธ์ (Associating)
  11. เทคนิคการคัดเลือกข้อมูล (Selecting Attributes)
  12. เทคนิคการนาเสนอข้อมูลด้วยรูปภาพ (Visualization)

หน้าต่างของโปรแกรม WEKA



1.ส่วนบนสุดจะเป็นแท็บ (tab) ซึ่งมีด้วยกันทั้งหมด 6 แท็บวางเรียงกันอยู่ทางด้านบน ซึ่งแท็บต่างๆ เหล่านี้จะเป็นเมนูให้ผู้ใช้สามารถใช้งานเทคนิคต่างๆของ Weka ได้นั่นเอง
2.ส่วนที่อยู่ตรงกลางซึ่งจะเปลี่ยนไปตามการกดแท็บต่างๆ ส่วนนี้เป็นส่วนของการเลือก option ต่างๆใน การวิเคราะห์ข้อมูล และส่วนการแสดงผลลัพธ์หลังจากทำการวิเคราะห์ข้อมูลเสร็จแล้ว
3.ส่วนที่อยู่ด้านล่างสุด จะเป็นส่วนที่บอกสถานะ ของการทำงานในแต่ละขั้นตอน

 การทำงานของแท็บเมนู ทั้ง6แท็บ


Preprocess เป็นส่วนที่ใช้ในการเลือกไฟล์ข้อมูลสำหรับเป็นอินพุท (input) เพื่อทำการ วิเคราะห์ข้อมูล
Classify เป็นส่วนที่ใช้ในการวิเคราะห์ข้อมูลด้วยวิธีการจำแนกข้อมูล (classification) หรือทำนายข้อมูล (prediction) ซึ่งจะมีวิธีการต่างๆให้เลือกมากมาย
Cluster เป็นส่วนที่ใช้ในการวิเคราะห์ข้อมูลด้วยวิธีการจัดกลุ่มข้อมูล (clustering) โดย จะจัดกลุ่มข้อมูลที่มีลักษณะคล้ายๆ กันหรือมีความสัมพันธ์กันเข้าไว้ด้วยกัน
Associate เป็นส่วนที่ใช้ในการวิเคราะห์ข้อมูลด้วยวิธีการหาความสัมพันธ์ของข้อมูล
Select attributes เป็นส่วนที่คล้ายๆ กับส่วน Preprocess แต่จะเน้นที่การหาว่าตัวแปรไหนที่ สำคัญและไม่สำคัญในชุดข้อมูลบ้าง ซึ่งตัวแปรที่ไม่สำคัญนี้จะถูกกำจัดทิ้งไป ก่อนที่จะวิเคราะห์ข้อมูลด้วยวิธีต่างๆ
Visualize เป็นส่วนของการ plot จุดข้อมูลในรูปแบบ 2 มิติ
ขั้นตอนการใช้งานเบื้องต้นของ โปรแกรม weka

ตารางข้อมูลที่ใช้ในการทดสอบวิเคราะห์

ซึ่งตัวอย่างนี้เป็นการทำนายพยากรณ์อากาศ ก่อนการแข่งขันกีฬา ซึ่งการพยากรณ์อากาศเป็นสิ่งสำคัญเพราะการแข่งขันกีฬาบางประเภทต้องการอาศัย สภาพอากาศที่เหมาะสมอีกด้วย

ขั้นตอนการใช้งานในการวิเคราะห์ข้อมูล

1. คลิก open file เพื่อทำการเลือกไฟล์ input ที่จะทำการใช้ในการทดสอบ ในการทดสอบครั้งนี้ใช้ไฟล์ที่เป็นนามสกุล .csv แล้วทำการคลิกปุ่ม open

 

หน้าต่างนี้จะแสดงผลข้อมูลที่ input ว่ามี attribute อะไรบ้าง

 

2. คลิกที่แท็บ Classify หน้าตาของ workspace จะเปลี่ยนไปเป็นส่วนของแท็บ Classify แล้วคลิกที่ ปุ่ม Choose จะมีลิสต์ (list) แสดงเทคนิคต่างๆ ของการ Classify ให้คลิกเลือกที่เมนู trees หลังจากนั้นให้ เลือกที่เทคนิคการจำแนกข้อมูลด้วย J48 โดยคลิกที่เมนูJ48 หลังจากนั้นคลิกที่ปุ่ม Start Weka จะ ทำงานและแสดงผลลัพธ์การทำงาน

 

หน้าต่างแสดงผลเมื่อเลือกเทคนิคการจำแนกข้อมูลด้วย J48 เสร็จแล้ว

3.หลังจากนั้นจะเห็นส่วนของ Classifier output ทางด้านขวาจะเปลี่ยนไป โดยจะแสดงผลการวิเคราะห์ในรูป แบบของ decision tree และข้อมูลทางสถิติอื่นๆ เช่น ค่าความถูกต้องในการทำนาย (Correctly Classified Instances) เป็นต้น ซึ่งข้อมูลที่เห็นนี้เป็นผลที่ได้จากการวิเคราะห์ข้อมูลด้วยเทคนิค J48

4. ในช่อง Result list ทางด้านซ้ายเมื่อเราทำการคลิกขวาและเลือกเมนู Visualize treeจะปรากฏหน้าจอ Tree View ขึ้นมา ซึ่งต้นไม้ (tree) ที่แสดงนี้จะเรียกว่า ต้นไม้ช่วยตัดสินใจ หรือ decision tree ซึ่งเป็นต้นไม้ที่ใช้ใน การสร้างกฏเพื่อนำไปทำนายข้อมูลใหม่ในอนาคต ตัวอย่างของกฎที่สร้างได้จากต้นไม้ช่วยตัดสินใจนี้เช่น ถ้ามีฝนตก (rainy) และ มีลมแรง (windy) ก็ไม่ควรจะแข่งขันกีฬา เป็นต้น

 

ผลลัพธ์ของการ Visualize tree

WEKA เกี่ยวข้อง กับ Software Engineer อย่างไร
WEKA เป็นโปรแกรมที่ใช้ในการวิเคราะห์ข้อมูล ซึ่ง Software Engineer ก็ต้องวิเคราะห์ข้อมูล ความต้องการของผู้ใช้ ซึ่ง WEKA ตอบโจทย์ในการวิเคราะห์ซึ่ง โปรแกรม WEKA ยังสามารถผลลัพธ์ในการตัดสินใจของลูกค้า และนอกจากนั้นยังสามารถ วิเคราะห์ของมูลเป็นจำนวนมากได้อย่างมีประสิทธิภาพอีกด้วย และนอกจากนั้นยังนำข้อมูลผู้ใช้ที่เก็บไว้มาวิเคราะห์ความคิดเห็นของผู้ใช้ต่อได้ว่าผู้ใช้มีความต้องการให้พัฒนา Software ในด้านไหนบ้าง ซึ่งจะทำให้ Software Engineer มีความสะดวก ถูกต้อง และ แม่นยำในการวิเคราะห์ข้อมูล และ พัฒนา Software ได้อย่างมีประสิทธิภาพมากขึ้น

คลิปสอนการใช้งาน

YouTube Preview Image

 

 

จัดทำโดย

นายดนัย ค้ายา 1560900118

 

  •  
  •  
  •  
  •  
  •  
  •  
Danai Kayar
at GlurGeek.Com

Leave a Reply