เริ่มทำ Big Data Project ได้เมื่อไร?

CORALINE CO. LTD
2 min readSep 18, 2018

--

ทุกวันนี้ เราได้เห็นคำว่า “Big Data” บ่อยมาก ทั้งในหน้าหนังสือพิมพ์ ในรายการคืนความสุขให้คนในชาติ รายการศาสตร์พระราชาสู่การพัฒนาอย่างยั่งยืน โครงการต่างๆ ของภาครัฐ หรือแม้แต่กลยุทธ์ภายในองค์กรต่างๆ ซึ่งคำนี้ เริ่มเข้ามามีบทบาทในประเทศไทยตั้งแต่ปี 2016 กันแล้ว เพียงแต่ในฐานะของผู้รับสารยังไม่สามารถระบุได้ชัดเจนว่าควรใช้ข้อมูลอะไรเพื่อสร้างประโยชน์แก่ส่วนไหนและต้องมีการเตรียมการรับมืออย่างไรต่อไป

การที่สื่อประโคมข่าวเรื่อง Big Data บ่อยครั้ง ทำให้เกิดแรงกดดันที่ต้องหาความจริงให้ได้ว่ามันคืออะไร นำพามาซึ่งโครงการใหม่ๆที่เกิดขึ้น มักจะมีหัวข้อว่า “Big Data” เข้ามาเกี่ยวข้องด้วยเพื่อให้สามารถได้รับอนุมัติดำเนินโครงการและทำให้เกิดความน่าสนใจในการพัฒนาเรื่องใหม่ๆ

ดังนั้นหากถามว่า “เมื่อไรที่เราควรเริ่มทำ Big Data Project?” ก็ตอบได้ง่ายๆว่า “ตอนนี้” เพราะทุกๆที่กำลังผลักดัน Big Data Project ใครทำได้ก่อนก็เดินเกมส์ได้ก่อน ใครล้าหลังก็ตกรถม้ากันไป การเริ่มต้นที่ถูกหลักที่สุดคือเริ่มจากการมี “เป้าหมาย” ซึ่งส่วนใหญ่แล้วจะไม่สามารถตั้งเป้าหมายได้เพราะเข้าใจว่า Big Data Project คือเรื่องของการมี “ข้อมูล” เท่านั้น ดังนั้นวันนี้จะขอพูดเรื่องปริมาณข้อมูลที่เหมาะสมต่อการเริ่มทำ Big Data Project ดังนี้

1. เมื่อมีข้อมูลจำนวนมาก

คนส่วนใหญ่มักจะเข้าใจว่าจะทำ Big Data Project ต้องขอให้มีข้อมูลจำนวนมากก่อน ซึ่งไม่ถูกซะทีเดียวเพราะการมีข้อมูลเอาไว้มากๆแต่ไม่เคยนำมาใช้ ทำให้ความสกปรกเกิดขึ้น เมื่อถึงเวลานำมาใช้จริงๆจะต้องมีขั้นตอนในการทำความสะอาดข้อมูลเหล่านั้นซึ่งเป็นขั้นตอนที่ใช้เวลานานและกินพลังงานอย่างมาก

โดยเฉพาะอย่างยิ่งเมื่อข้อมูลที่มีเก็บเอาไว้ตามแหล่งข้อมูลต่างๆที่อยู่แยกกันคนละระบบจะยิ่งสร้างปัญหาใหญ่เพราะนอกจากระบบต่างๆจะไม่เชื่อมต่อกันแล้ว ยังมีทั้งข้อมูลซ้ำซ้อน มีโครงต่างกันอีกด้วยแม้กระทั่งมีชนิดของไฟล์ต่างกัน เช่น Excel File หรือ PDF file เป็นต้น ดังนั้นหากเป็นไปได้ “อย่ารอให้ข้อมูลมีปริมาณมหาศาล ก่อนที่จะเริ่มทำ Big Data Project” เพราะสุดท้ายแล้วการมีข้อมูลเดิมอยู่จำนวนมากไม่ได้หมายความว่าข้อมูลนั้นเพียงพอ เพราะสิ่งที่เราต้องการไม่ใช่ข้อมูลเยอะๆแต่เราต้องการข้อมูลที่มีคุณภาพ

กรณีตัวอย่างที่เหมาะที่สุดสำหรับหัวข้อนี้คือกรณีการจัดการข้อมูลของภาครัฐ เช่น การตั้งงบของโรงพยาบาลที่มีทั้งกฎจากกระทรวงการคลัง ข้อมูลประกันสังคมจากกระทรวงแรงงาน ข้อมูลจำนวนผู้มีสิทธิตามพื้นที่จากสำนักงานหลักประกันสุขภาพแห่งชาติซึ่งขึ้นตรงกับกระทรวงสาธารณสุขและยังมีนโยบายอื่นๆที่เกี่ยวข้องกับกระทรวงอื่นๆ อีกด้วย ทำให้เจ้าของข้อมูลเป็นคนละภาคส่วนกัน จึงมีรูปแบบในการกรอกข้อมูลหรือการตั้งเบิกงบที่ไม่เหมือนกันเป็นปัญหาที่แก้ได้ยากและคงต้องใช้เวลานานถึงจะสามารถแก้ไขได้หมด

บทสรุปของกรณีมีข้อมูลจำนวนมากคือควรเริ่มทำ Big Data Project โดยเร็วที่สุด เพราะยิ่งปล่อยให้มีข้อมูลจำนวนมากอยู่ในระบบยิ่งก่อให้เกิดความยุ่งยากของระบบ ในบางกรณีข้อมูลจำนวนมากที่คิดว่าพอ อาจจะไม่เพียงพอก็เป็นได้ ทำให้ต้องมีการเก็บข้อมูลเพิ่มเติม ทั้งนี้การเริ่มทำ Big Data Project อันดับแรกคือต้องเรียนรู้ก่อนว่า “Big Data” คืออะไร และจะใช้ประโยชน์ได้อย่างไรบ้าง โดยแยกออกเป็น 2 ส่วน ได้แก่ ส่วนการวางระบบเพื่อการใช้งาน กับการสร้างโมเดลเพื่อวิเคราะห์และประมวลผล และแน่นอนว่า Data Expert คือผู้เชี่ยวชาญที่สามารถเข้ามาแก้ปัญหาตรงนี้ได้ ซึ่งทางเลือกมีหลากหลายทาง ไม่มีทางใดที่ดีที่สุด ตามหลักการแล้วทางเลือกที่ทำได้จริงที่สุดตามข้อจำกัดต่างๆไม่ว่าจะเป็น ราคา เวลา หรือความซับซ้อนในการวางระบบ ดังนั้น Data Expert ที่ว่านี้อาจจะเป็น Data Scientist หรือ Data Engineer หรือบุคคลที่สามารถวางระบบการทำงานได้ตั้งแต่ต้นน้ำยันปลายน้ำนั่นเอง ส่วนในเรื่องของการตั้งเป้าหมาย อาจจะทำได้โดยการการคิดโจทย์เองภายในองค์กรหรือให้ Data Expert เข้ามาช่วยออกแบบโจทย์ก็เป็นได้เพราะบางครั้งโจทย์ก็เกิดจากการรู้ว่ามีวิธีการแก้ปัญหาได้อย่างไรบ้าง

2. เมื่อมีข้อมูลอยู่บางส่วน

สำหรับในกรณีมีข้ออยู่อยู่บางส่วนถือว่าเป็นการเริ่มทำ Big Data Project ที่มีความเสี่ยงน้อยที่สุดเพราะอย่างน้อยก็มีข้อมูลที่พอจะทำไปขึ้นเป็นต้นแบบหรือโมเดลได้บ้างและระบบการได้มาซึ่งข้อมูลยังไม่ซับซ้อนเกินไป

ในความเป็นจริงแล้วไม่มีใครบอกได้ว่าข้อมูลแค่ไหนถึงจะพอแต่โดยธรรมชาติแล้ว การมีข้อมูลจำนวนมากจะทำให้มีตัวเลือกในการใช้งานได้มากกว่าและด้วยเหตุนี้ หลายๆองค์กรจึงรอให้มีข้อมูลจำนวนมากพอก่อนที่จะเริ่มทำ Big Data Project การตัดสินใจว่าข้อมูลที่มีนั้นเพียงพอหรือไม่ ต้องมีการสร้างโมเดลและวัดผลจากโมเดลนั้นๆแต่หากไม่มีการสร้างโมเดลเสียทีก็จะไม่สามารถบอกได้ว่าข้อมูลที่นี้นั้นเพียงพอหรือยัง

ตัวอย่างเช่นกรณีลูกค้า SME กลุ่ม Retail มีการเก็บข้อมูลยอดสั่งซื้อสินค้ามา 3 ปี ถือว่ามีข้อมูลจำนวนหนึ่ง อาจไม่ได้ใหญ่โตมากแต่เมื่อนำข้อมูลนั้นมาวิเคราะห์ก็พบว่ายอดขายที่เกิดขึ้นไม่ใช่ยอดขายที่แท้จริงเนื่องจากมีของขาดตลาดทำให้มีช่วงเวลาหนึ่งที่ไม่มีของขาย ส่งผลให้การสร้างโมเดลอาจมีความไม่แม่นยำเกิดขึ้น

หากไม่มีความคิดริเริ่มจะทำ Big Data Project เจ้าของกิจการท่านนี้จะไม่ทราบได้เลยว่า องค์กรของเขามีปัญหาเรื่องการวางแผนอุปสงค์และอุปทานหรือ Demand and Supply Planning ซึ่งในกรณีนี้ การมีข้อมูลเก่า 3 ปีเป็นประโยชน์อย่างมากเพราะมันทำให้ Data Scientist มองภาพออกว่าจะมีข้อมูลใดให้เก็บได้บ้างรวมไปถึงไม่จำเป็นต้องออกแบบแนวทางในการเก็บข้อมูลใหม่

3. เมื่อไม่มีข้อมูลในระบบเลย

หลายองค์กรเป็นองค์กรเปิดใหม่ หรือเป็น StartUp ที่มีกลยุทธ์ในการใช้ข้อมูลทำให้ไม่มีข้อมูลประวัติใดๆเก็บเอาไว้เลย แล้วแบบนี้จะเริ่มทำ Big Data Project ได้หรือไม่ คำตอบ คือ “เริ่มได้เลย” เพราะการทำ Big Data Project เริ่มจากการวางเป้าหมายในการทำงานเสียก่อน เรารู้ก่อนว่าเราต้องการทำธุรกิจประเภทไหนและต้องการข้อมูลอะไรบ้างเพื่อวางแผนให้ได้ข้อมูลนั้นๆเข้ามาในระบบ

กรณีตัวอย่างได้แก่การวางแผนระบบคมนาคมขนส่งของประเทศสิงคโปร์ที่มีนโยบายในการออกแบบระบบคมนาคมขนส่งอย่างมีประสิทธิภาพโดยการใช้ Big Data สิ่งที่เขาทำคือมีการออกแบบระบบการเก็บเงินค่าโดยสารตามระยะทาง โดยให้ผู้โดยสารแตะบัตรขาขึ้นเพื่อเก็บข้อมูลจำนวนผู้โดยสารต่อป้ายและแตะบัตรโดยสารอีกครั้งตอนขาลงเพื่อคิดค่าโดยสาร ซึ่งระบบจะหักเงินค่าโดยสารในบัตรตามระยะทางที่มีการผูก GPS และคำนวณระยะทางในระบบเอาไว้ แนวทางนี้ทำให้รัฐบาลสิงคโปร์มีข้อมูลจำนวนผู้โดยสารขึ้น-ลงต่อป้ายอย่างชัดเจนจนสามารถนำไปต่อยอดทำ Smart City ต่อได้

ดังนั้นหากถามว่า “ไม่มีข้อมูลเก็บเอาไว้เลยจะสามารถทำ Big Data Project ได้หรือไม่” ก็ต้องตอบว่า “ทำได้” และในบางกรณีนี้อาจจะดีกว่าการที่ไม่มีข้อมูลอยู่เลยก็เป็นได้ เพราะเมื่อมีเป้าหมายการทำงานที่ชัดเจนก็สามารถวางระบบได้ว่าต้องการข้อมูลส่วนใดบ้าง ต้องเก็บข้อมูลจากส่วนไหนบ้าง ความยุ่งยากในการทำความสะอาดตัวข้อมูลก็น้อยลงรวมไปถึงการลงทุนซื้ออุปกรณ์หรือ Software ต่างๆก็มีเหตุที่มาที่ไปมากขึ้นอีกด้วย

แต่ข้อเสียของการทำ Big Data Project โดยที่ไม่มีข้อมูลอยู่เลย นั้นคืออาจต้องเสียเวลารอให้มีข้อมูลมากพอจะสร้างโมเดลหรืออาจต้องรอให้วางระบบอุปกรณ์ให้เรียบร้อยเสียก่อนนั้นเอง

โดยสรุปแล้วการทำจะเริ่ม Big Data Project นั้นไม่ได้อยู่ที่ปริมาณหรือการมีข้อมูลแต่อยู่ที่ว่าองค์กรนั้นมีเป้าหมายหรือมีความเข้าใจในการทำ Big Data Project อย่างไรเสียมากกว่าจะเริ่มได้เมื่อไร ก็คือ เริ่มได้ เมื่อ “พร้อม” โดยที่คำว่า “พร้อม” นี้ก็อาจหมายถึงต้องมีทีมงานที่พร้อมและมีสภาพแวดล้อมที่พร้อมรับการเปลี่ยนแปลงด้วย

เพราะ Big Data Project มันใหญ่สมชื่อ ทั้งในมุมกว้างและมุมลึก ดังนั้นการจะทำ Big Data Project ให้สำเร็จ จึงต้องมีการวางแผนให้ดีและมีความชัดเจนในทุกขั้นตอนการทำงาน ที่สำคัญ คือ “รอไม่ได้” เพราะทุกนาทีที่เสียไปคือ “ค่าเสียโอกาส” สำหรับองค์กร

#BigData

#DataScience

#Optimization

#ProductivityImprovement

#Coraline ให้คำปรึกษาการทำ Big Data Project และ Digital Transformation เพื่อเพิ่มศักยภาพของธุรกิจ

— — — — — — — — — — — — — — — — — — — — —

We turn your DATA into your KEY of success.

ให้คำปรึกษาการทำโครงการ Big Data, Data Model, Artificial Intelligence และ Digital Transformation เพื่อเพิ่มศักยภาพของธุรกิจ

Tel: 099–425–5398

Email: inquiry@coraline.co.th

FB Page: Data Driven Business by Coraline

Messenger: m.me/coralineltd

— — — — — — — — — — — — — — — — — — — — —

Originally published at https://www.coraline.co.th

--

--

CORALINE CO. LTD
CORALINE CO. LTD

Written by CORALINE CO. LTD

We seek to be the acknowledged leader in Data Science & Operations Research in searching for new solutions and bringing customer’s big data into real action.

No responses yet