ไม่ว่าจะทำงานแบบไหน เราหนีจากการทำงานกับข้อมูลไม่พ้น แต่หลายๆครั้งที่เราเก็บ วิเคราะห์ หรือแม้แต่ฟังคนอื่นนำเสนอข้อมูลมา เรามักด่วนสรุป หรือคืดไปเองว่าที่ได้ยินได้เห็นมา เป็นข้อมูลที่น่าเชื่อถือ ครบถ้วนพอที่จะใช้ประโยชน์ในการตัดสินใจในธุรกิจ
ฉะนั้นไม่ว่าเราจะเป็นนักวิเคราะห์ข้อมูลหรือไม่ก็ตาม เราอยากให้รู้ 5 เรื่องที่สำคัญเวลาทำงานกับข้อมูลเอาไว้
1. คำนึงถึงความไม่แน่นอนของเหตุการณ์ที่เกิดขึ้นเสมอ
ปรกติเรามักจะยึดค่าเฉลี่ยเป็นหลัก เวลาเราจะหาค่ากลางของข้อมูลอะไรสักอย่าง แต่ถ้าถามนักสถิติ นักสถิติจะมีความระมัดระวังในการใช้ค่ากลางเป็นพิเศษ เป็นคนที่คำนึงถึงความไม่แน่นอนของเหตุการณ์ที่เกิดขึ้น ฉะนั้นการใช้ค่าเฉลี่ยอย่างเดียวจึงเป็นค่ากลางที่ไม่ได้อธิบายสิ่งที่เกิดขึ้นได้ทุกอย่าง
เช่นหากค่าเฉลี่ย กับค่ามัธยฐาน หรือที่เรารู้จักกันดีคือค่า Median ถ้าค่าเฉลี่ยมันสูงมาก เพียงเพราะว่ามีตัวเลขตัวหนึ่งมันสูงกว่าตัวเลขอื่นๆ แบบนี้ค่าเฉลี่ยก็ไม่สามารถเนค่ากลางได้แล้ว ควรจะใช้ค่า Mean หรือ Mode
อีกอย่างหนึ่งคือปรกติการใช้ค่าเฉลี่ยเป็นตัวเลขเดี่ยวๆนั้น ไม่ได้รับประกันว่าข้อมูลในอนาคตที่เราได้รับจะต้องเกิดขึ้นเท่ากับค่าเฉลี่ยเป๊ะๆ มันแทบเป็นไม่ได้เลย นักสถิติไม่มั่นใจขนาดนั้น
สถิติถึงต้องมีหลักที่เรียกว่า Statistical Inference เพื่อมี Range สำหรับค่าเฉลี่ย เอา Margin of Error มาคิด มากะเอาว่า ต่อไปข้อมูลที่ได้ก็น่าจะเกิดขึ้นใน Range ของค่าเฉลี่ย แล้วมั่นใจแค่ไหน
2. “All Models Are Wrong, Some Are Useful” – George Box
จริงๆแล้วโมเดลที่สามารถอธิบายข้อมูลได้มากที่สุดเป็นโมเดลที่ขาดความน่าเชื่อถือ ผลลัพธ์ที่โมเดลที่ว่านั้นทำนายจะขาดความน่าเชื่อถือ เพราะโมเดลถูกสร้างมาจากบางข้อมูลที่โดยปรกติไม่ได้เกิดขึ้นเป็นประจำ
การหาโมเดลที่สามารถอธิบายข้อมูลส่วนใหญ่ได้และผลลัพธ์ออกมาน่าเชื่อถือจึงสำคัญ ซึ่งแน่นอนว่ากว่าจะหาโมเดลที่ว่านั้น ต้องใช้เวลาลองผิดลองถูกพอสมควร ความรู้ทางสถิติจะช่วยให้เรามี “เซ้นส์” ในการสร้างโมเดลนั้นขึ้นมา
3. ไม่ควรตั้งคำถามเยอะและกว้างเกินไป
เข้าใจว่าการตั้งคำถามเยอะๆทำให้เราสำรวจข้อมูลได้ครบทุกมุมมองมากขึ้น แต่มันเสียเวลา เสียแรงคนมาก หากจะมานั่งตั้งสมมติฐานและตอบคำถามทั้งหมด และหากคำถามที่มีอยู่เป็นคำถามที่ได้เกี่ยวกับการตัดสินใจในธุรกิจเลย ก็ยิ่งเสียแรงเสียเวลา
ที่นักวิเคราะห์ข้อมูลควรทำคือ ตั้งคำถามเดียวแต่ตรงประเด็น และตอบคำถามนั้น คำถามนั้นจะต้องมีค่ามากพอที่จะต้องศึกษาต่อ คำตอบของปัญหาต้องทำให้เป้าหมายธุรกิจสำเร็จ เช่นตอบแล้ว เอาไปใช้ทำโฆษณา เพิ่มยอดขาย
4. ต้องว่องไวในการสำรวจและเข้าใจข้อมูล
ถ้าเทียบกับบทบาทอื่นที่เกี่ยวข้องกับข้อมูลแล้ว นักวิเคราะห์ข้อมูลควรจะเป็นคนที่สำรวจ เข้าใจ และนำเสนอข้อมูลได้เร็วกว่า การให้ทุกคนเข้าไปสำรวจและเข้าใจข้อมูลกันเองจะเสียเวลามาก แต่หากมีใครสักคนสรุปข้อมูลให้แล้วเอามาเล่าให้คนอื่นฟัง คนอื่นจะได้เข้าใจข้อมูลได้เร็วขึ้นผ่านชาร์ต แผนภูมิ รูปภาพต่างๆ ไม่ต้องลงมือวิเคราะห์เอง
5. อย่าได้วิเคราะห์และสรุปไปไกลกว่าที่ข้อมูลบอกเรา
นักวิเคราะห์ข้อมูลเป็นคนที่เล่าเรื่องจากข้อมูลได้ดีที่สุดแล้ว แต่ระวังอย่าให้คนที่อ่านหรือฟังบทวิเคราะห์ตีความเกินกว่าที่ข้อมูลบอกด้วย หน้าที่ของนักวิเคราะห์ข้อมูลจะไม่ฟังธงอะไรไรทั้งนั้น แต่ชี้ให้เห็นว่าสิ่งที่วิเคราะห์ออกมาได้ สามารถตีความได้หลายอย่าง
ยกตัวอย่างเช่นเราพบว่า Bounce Rate ที่มากขึ้นสัมพันธ์กับ Conversion Rate ที่ตกลง หากเราฟันธงการเพิ่มขึ้นของ Bounce Rate บนเว็บไซต์ ทำให้ Conversion Rate ตกลงนั้น อาจจะไม่ถูกต้องเสียทีเดียว เพราะต้องดูบริบทด้วย เช่นเว็บเพจนั้นอาจจะไม่ได้เกี่ยวกับการช่วยให้สินค้าขายได้เยอะขึ้นแต่อย่างใด อาจจะเป็นหน้า FAQ หรือ Contact Us ก็ได้
ตามที่ประโยคที่คุ้นหูว่า “Correlation is not Causation” นั่นแหละครับ
แหล่งอ้างอิงส่วนหนึ่งมาจาก
What Great Data Analysts Do โดย Cassie Kozyrkov จาก Harvard Business Review: Strategic Analytics