Output หรือ ผลลัพธ์ของ Data Science คืออะไร?

CORALINE CO. LTD
2 min readAug 5, 2018

--

แต่…. มีน้อยคนนักที่สามารถอธิบายได้ว่า Data Science คืออะไร?

Data Science หรือ วิทยาศาสตร์ข้อมูลคือกระบวนการในการทำความเข้าใจ วิเคราะห์ สังเคราะห์ และสร้างผลลัพธ์ใหม่ๆ ได้จากการมี “ข้อมูล” ตั้งต้นเดิม ซึ่งแตกต่างกับ Analytics ที่เราคุ้นเคยกันตรงที่ว่า Data Science จะเป็นการคิดค้นวิธีการใหม่ๆ เช่น การสร้าง Machine Learning Model การเขียน Decision Chart ใหม่จากชุดข้อมูลใหม่ เป็นต้น ในขณะที่ Analytics จะใช้วิธีการเดิมๆ เช่น การหาค่าเฉลี่ย การทำนายโดยใช้ Moving Average Model เป็นต้น

ศาสตร์ Data Science คือการผสมรวมกันระหว่าง คณิตศาสตร์ (เช่น แคลคูลัส สถิติ ความน่าจะเป็น) และคอมพิวเตอร์ ซึ่งด้านหนึ่งจะเป็นกลไกการออกแบบแนวทางการแก้ปัญหา ในขณะอีกด้านหนึ่ง(คอมพิวเตอร์)จะเป็นเสมือนเครื่องมือที่ต้องเขียนขึ้นมาเพื่อพิสูจน์แนวทางนั้นๆและเพื่อนำกลไกการออกแบบนั้นไปใช้งานจริงในระบบต่อไป

การใช้ Data Science จะต้องอธิบายกลไกขั้นตอนในการตัดสินใจแต่ละส่วนได้ด้วยตัวเลข มิใช่แค่ทฤษฎีเปล่าๆ เช่น เมื่อพูดถึงคำว่า Deadstock เราทราบกันดีว่าเป็นการพูดถึงสินค้าคงคลังที่เหลือค้างในระบบ … แต่… เมื่อไหร่ถึงเรียกว่า Deadstock จะไม่มีใครตอบได้อย่างชัดเจน เพราะไม่มีสมการหาค่า Deadstock ที่ตายตัว

สิ่งที่ Data Scientist ต้องทำคือการสร้าง Model ในการบ่งบอกว่า Deadstock ของแต่ละสินค้า เกิดขึ้นเมื่อใด ได้อย่างไร เป็นตัวเลข หรือ สถานะ ที่มีความชัดเจน ไม่ใช่แค่การประเมินสถานการณ์ ซึ่งสินค้าแต่ละประเภท ก็จะมี Criteria หรือ คุณสมบัติการคงค้างที่ต่างกัน

วิธีการคิด คือ การสร้าง Forecasting Model และ ใช้หลักการสถิติ และความน่าจะเป็น มาสร้างเป็น Model เพื่อหา “จุดสมดุล” เพื่อแจ้งให้ผู้ปฏิบัติงานทราบ (ซึ่งแต่ละสินค้า จะมี หรือไม่มี สถานะคงค้าง หรือ Deadstock ก็ได้ ถ้า Forecasting Model นั้นมีความแม่นยำ ก็จะสามารถสั่งสินค้านั้นได้แม่นยำด้วยเช่นกัน)

อีกตัวอย่างหนึ่ง คือ การคิด Fraud Detection Model หรือ การตรวจจับการโกง ซึ่งวิธีการทำ คือ การสร้าง Model เพื่อประเมินพฤติกรรม “ปกติ” ของแต่ละคน และมีการสร้างจุดแจ้งเตือน เมื่อเกิดเหตุการณ์ “ไม่ปกติ” เกิดขึ้นในแต่ละบุคคล ทำให้สามารถทราบสถานะได้ (เกือบ) ทันที เป็นการป้องกันการโกง หรือ การโจรกรรมได้อย่างทันทีทันใด

ถ้าไม่มี Fraud Detection Model สิ่งที่ต้องทำ อาจเป็นการสุ่มตรวจ การส่งเรื่องร้องเรียน หรือ เกิดการโกงไปแล้วโดยที่องค์กรไม่สามารถตรวจสอบได้ สร้างความเสียหายให้องค์กรและลูกค้าขององค์กรอย่างไม่สามารถประเมินค่าได้

ทั้ง 2 ตัวอย่างแสดงให้เห็นชัดเจนว่า “Model” คือสิ่งที่ Data Scientist ต้องสร้างและนี่คือ “ผลลัพธ์” จากการทำ “Data Science”

Model มาจากอะไร? มาจากการนำ “ข้อมูล” ที่อาจจะต้องมีขนาดใหญ่ระดับหนึ่ง ผ่านการทำความสะอาด สร้างโครงสร้างให้ชัดเจน และต้องมี “ตัวแปร” ที่สำคัญเพื่อใช้กลไกทางคอมพิวเตอร์ในการสร้าง Model ในการทำงานจริง ขั้นตอนการสร้าง Model ใช้เวลาไม่นานแต่ที่นานและยากกว่า ก็คือการทำความเข้าใจในตัวข้อมูลรวมไปถึงการทำความสะอาดข้อมูลนั้นด้วย

มี Model แล้ว จะนำไปใช้ต่อได้อย่างไร มีผลลัพธ์อย่างไร? ผลลัพธ์ที่ได้จาก Model ออกมาเป็น “ข้อมูล” ซึ่งอาจจะมีทั้งเป็นตัวเลข หรือตัวอักษรก็ได้ เมื่อต้องการนำไปใช้ต่อ มีได้ 2 กรณีหลักๆ ได้แก่

  1. ออกเป็นรายงาน เช่น นำข้อมูลนั้นไปแสดงผลใน Dashboard หรือ โปรแกรม BI เป็นต้น
  2. ออกเป็นข้อมูลที่ส่งผ่านไปยังโปรแกรมอื่น เพื่อให้เกิดการกระทำ เช่น ส่งข้อความอัตโนมัติให้ผู้ใช้งาน ส่งข้อความไปที่ระบบเพื่อให้เครื่องมือดำเนินการตามกลไกต่างๆ เช่น ระบบรถขับเคลื่อนไร้มนุษย์ เป็นต้น

การจะนำผลลัพธ์ไปใช้ต่อ ต้อง สร้างระบบ ซึ่ง Data Scientist อาจไม่ใช่ผู้ทำหน้าที่ตรงนี้ (ขึ้นอยู่กับแต่ละกรณี) หน้าที่นี้อาจจะเป็นของ Data Engineer หรือ Software Developer ก็ได้

ในฐานะที่เป็นผู้บริหาร หรือผู้เกี่ยวข้องที่ต้องทำงานกับ Data Scientist นั้น จำเป็นที่จะต้องตรวจสอบงานของ Data Scientist เพราะการสร้าง Model เกิดจากการลองผิดลองถูก และ Model ที่เหมาะสมที่สุด ต้องได้รับการประเมิน และทดสอบจากหน้างาน โดยมีผู้เกี่ยวข้องช่วยกันตรวจสอบ มิควรให้ Data Scientist เสนอเองไปเสียหมด เพราะอย่างไรเสีย หน้าที่หลักของ Data Scientist คือ การสร้าง Model ในขณะที่หน้าที่ Business เป็นการตั้งโจทย์ และวางนโยบายเพื่อพัฒนาศักยภาพขององค์กร

อย่าให้ “Data Science” เป็นแค่ Buzzword สำหรับองค์กร เพราะหากองค์กรไหนสามารถสร้างทีมงาน Data Science ได้จริงๆ องค์กรนั้นจะสามารถสร้าง Model ใหม่ๆ ได้อย่างรวดเร็ว จนสามารถเกิดเป็นระบบการทำงานแบบ Data Driven Business ได้ไม่ยากอย่างแน่นอน

#BigData

#DataScience

#Optimization

#ProductivityImprovement

#Coraline ให้คำปรึกษาการทำ Big Data Project และ Digital Transformation เพื่อเพิ่มศักยภาพของธุรกิจ

— — — — — — — — — — — — — — — — — — — — —

We turn your DATA into your KEY of success.

ให้คำปรึกษาการทำโครงการ Big Data, Data Model, Artificial Intelligence และ Digital Transformation เพื่อเพิ่มศักยภาพของธุรกิจ

Tel: 099–425–5398

Email: inquiry@coraline.co.th

FB Page: Data Driven Business by Coraline

Messenger: m.me/coralineltd

— — — — — — — — — — — — — — — — — — — — —

Originally published at https://www.coraline.co.th

--

--

CORALINE CO. LTD
CORALINE CO. LTD

Written by CORALINE CO. LTD

We seek to be the acknowledged leader in Data Science & Operations Research in searching for new solutions and bringing customer’s big data into real action.

No responses yet