ทำความรู้จักกับ Data Wrangling & Transform
สามารถดู video ของหัวข้อนี้ก่อนได้ ดู video
Data Wrangling & Transform หมายถึงกระบวนการเตรียมและปรับเปลี่ยนข้อมูลให้อยู่ในรูปแบบที่สามารถนำไปใช้งานได้ตามวัตถุประสงค์ที่ต้องการ ซึ่งอาจประกอบไปด้วยการทำความสะอาดข้อมูล (Data Cleaning) การแปลงข้อมูล (Transformation) การรวมข้อมูล (Merging) หรือการจัดโครงสร้างข้อมูลใหม่ กระบวนการนี้ช่วยให้ข้อมูลที่ได้มีความสมบูรณ์ถูกต้องและพร้อมต่อการนำไปใช้งาน
จุดประสงค์ของการทำ Data Wrangling & Transform
- เพิ่มคุณภาพของข้อมูล: ช่วยจัดการข้อมูลที่อาจมีความผิดพลาด เช่น ข้อมูลที่ขาดหายไป (Missing Values) หรือข้อมูลที่มีค่าผิดพลาด (Outliers)
- ทำให้ข้อมูลใช้งานได้ง่ายขึ้น: การแปลงรูปแบบข้อมูลให้อยู่ในลักษณะที่สอดคล้องกับเครื่องมือหรือโมเดลที่จะนำไปใช้งาน เช่น การจัดรูปแบบวันที่ การแปลงข้อมูลจากชนิดข้อความไปเป็นตัวเลข
- รวมข้อมูลจากแหล่งต่าง ๆ: การรวมข้อมูลจากหลายแหล่งเข้าด้วยกันเพื่อให้ได้ข้อมูลที่ครอบคลุมมากขึ้น เช่น การรวมข้อมูลจากหลายระบบฐานข้อมูลหรือหลายไฟล์
- เพิ่มประสิทธิภาพของการวิเคราะห์และการทำ Machine Learning: การทำ Data Wrangling ช่วยให้ข้อมูลพร้อมต่อการนำไปวิเคราะห์หรือสร้างโมเดล Machine Learning ได้อย่างมีประสิทธิภาพ และลดการคำนวณที่ซ้ำซ้อน