ถึงการมาของเทคโนโลยีอย่าง AI, Machine Learning และ Robotics ทำให้อาชีพยอดนิยมในศตวรรษที่ 20 ค่อยๆหายไป แต่ก็สร้างอาชีพใหม่ๆด้วย และดูเหมือนว่าอาชีพที่เรียกว่า นักวิทยาศาสตร์ข้อมูล (Data Scientist) เป็นอาชีพที่บริษัทต่างๆต้องการมากขึ้นและหลายบริษัทใหญ่ก็ให้ค่าตอบแทนสูง หากอ้างอิงจาก Adecco ฐานเงินเดือนอยู่ที่ 35,000 และสูงสุดอยู่ที่ 150,000 บาท
Data Science ไม่ใช่แค่รู้แค่เลขและคอมพิวเตอร์ แต่ต้องรู้เรื่องธุรกิจด้วย หากมีแต่ข้อมูล ไม่รู้เรื่องธุรกิจก็ใช้แก้ปัญหาและสร้างประโยชน์ไม่ได้ (ภาพจาก towardsdatascience)
คำถามคือถ้าอยากทำงานด้าน Data Science ต้องเก่งเรื่องอะไรบ้าง? แล้วจะต้องฝึกฝนแบบไหนถึงจะเก่ง? นั่นแหละคือความท้าทายของคนที่สนใจ เพราะเราต้องรู้ทักษะที่ “ใช่” ซึ่งบริษัทในตลาดแรงงานต้องการตัว ซึ่งทักษะที่ว่าก็ไม่พ้น 9 อย่างต่อไปนี้
1. การเขียนโค้ตโปรแกรมทางสถิติ อย่าง R และ Python ซึ่งเป็นภาษาคอมพิวเตอร์ยอดนิยมสำหรับ Data Science เนื่องจากเป็นภาษาที่เข้าใจแะละเรียนรู้ง่ายที่สุดเทียบกับภาษาอื่นๆ หากอยากเรียนเขียน R กับ Python ลองเริ่มเรียนที่นี่ก็ได้
2. สถิติ (Statistics) เช่น Distribution, การทดสอบทางสถิติ, ตัวประเมินแนวโน้มที่เป็นไปได้มากที่สุด (Maximum Likelihood Estimators) สถิติที่เรารวบรวมและวิเคราะห์มาแล้วจะช่วยให้บริษัทสามารถตัดสินใจในเชิงธุรกิจจากข้อมูล ทำให้องค์กรยึดข้อมูลเพื่อดำเนินการ (data-driven Organization)
3. รู้จักใช้ Machine Learning เช่นเทคนิคที่ใช้พัฒนา learning model ใน machine learning เพื่อเพิ่มประสิทธิภาพการทำงาน (Ensemble Methods), Random Forests ที่ใช้แก้ปัญหาทางสถิติด้วยอัลกอริธึ่มเช่น regression และ classification และ K-Nearest neighbor ที่เป็นอัลกอริธึ่มเพื่อหากลุ่มข้อมูลที่ใกล้มากที่สุด
4. สมการเชิงเส้นและแคลคูลัส (Linear Algebra and Calculus) เอาไว้ใช้เพื่อหาตัวเลขเพื่อเพื่มประสิทธิภาพในการทำงานให้สูงสุดภายใต้ข้อจำกัด หรืออย่างน้อยถ้าเราไปสัมภาษณ์ในตำแหน่ง Data Scientist เราก็อาจจะใช้ความรู้ตรงนี้ไปตอบ
5. สื่อสารข้อมูลให้เห็นภาพ (Data Visualization) จึงต้องหัดใช้โปรแกรมอย่าง Power BI และ Tableau ให้เป็น
6. การสื่อสาร (Communication) เพราะไม่ใช่ทุกคนที่จะเข้าใจข้อมูลตัวเลขและภาษาคอมพิวเตอร์ การทำความเข้าใจข้อมูลและเล่าออกมาให้คนที่ไม่รู้เรื่องให้เข้าใจก็เป็นทักษะที่สำคัญ
7. การปรับเปลี่ยนข้อมูลให้อยู่ในรูปแบบให้พร้อมใช้งาน (Data Wrangling) เพราะไม่ใช่ข้อมูลทุกอย่างที่จะอยู่ในรูปแบบเดียวกัน และข้อมูลที่มีอยู่ในมือต้องได้รับการแก้ไขก่อนที่จะเข้าไปอยู่ในระบบและคิดคำนวนได้
8. วิศวกรรมซอฟแวร์ (Software Engineering) เพราะเกิดเราต้องทำงานในบริษัทเล็ก เราอาจเป็นคนเดียวในบริษัทที่ต้องจัดการกับข้อมูลมหาศาลเพื่อพัฒนาสินค้าและโซลูชั่น
9. แยกแยะข้อมูลสำคัญ (Data Intuition) เพื่อไว้แก้ปัญหาที่ซับซ้อนยิ่งขึ้น เพราะบางบริษัทอาจทดสอบเราตอนสมัครงานโดยโยนโจทย์ที่บริษัทกำลังแก้ปัญหาให้เราได้ทดลองคิดก็ได้
ข้อดีข้อเสียของ Data Science เป็นสาขาที่คนต้องการสูงแต่กว่าคนจะเก่งด้านนี้แทบจะหายากและเป็นคำที่คนมักใช้โดยที่ไม่รู้ว่าความหมายจริงๆคืออะไร (ภาพจาก Data Flair)
แหล่งข้อมูล: https://towardsdatascience.com/top-skills-every-data-scientist-needs-to-master-5aba4293b88