COLUMNISTS

Big Data ประโยชน์ – อุปสรรคจุดเปลี่ยนธุรกิจ

ดร.ไวฑูรย์ โภคาชัยพัฒน์
กรรมการผู้จัดการ บริษัท ทริส คอร์ปอเรชั่น จำกัด
98

สวัสดีครับ วันนี้อยากจะขอแตะเบาๆ เรื่อง Big Data หน่อย เพราะเราได้ยินกันมามาก แต่พอถามแต่ละคนว่ารู้จักมันจริงๆ แค่ไหน? โดยเฉพาะคำถามพื้นฐานว่า Big Data มันมีขนาดหรือความมหึมาที่ทำให้เราทั้งโลกต้องรับมือกับมัน และถือโอกาสใช้ประโยชน์จากมัน หรือตรงกันข้ามคือโดนมันหรือคนอื่นที่เขาหาประโยชน์จากมันได้ดีกว่าแล้วมาทำให้เราตกอยู่ในฐานะที่ลำบากล่ะก้อ คิดว่าหลายท่านน่าจะอึ้งๆ กันบ้าง

เริ่มจากเกล็ดเล็กๆ ก่อนเลยแล้วกันครับว่า Big Data นั้นมีลักษณะสำคัญๆ อะไรบ้างที่ทำให้เรียกว่า Big Data? อันนี้ขอหยิบมาจาก IBM bigdatahub ที่เขาเผยแพร่ไว้ที่ Web ของเขาโดยรวบรวมข้อมูลจากหลายๆ แหล่งแล้วมาสรุปให้ดูง่ายๆ ทั้งในแบบคำอธิบายและในแบบ  Infographic กัน

โดยนักวิทยาศาสตร์ด้านข้อมูล หรือ Data scientists ของ IBM ได้ให้คำอธิบายให้เห็นภาพของBig data โดยแบ่งออกเป็น 4 มิติ โดยทุกมิติเริ่มต้นด้วยตัว V นำหน้า เลยเป็นที่มาของการเรียกว่า 4Vs ของ Big data นั่นเอง ประกอบไปด้วย

1. Volume2.Variety 3. Velocityและ 4. Veracity โดย V ตัวแรกคือ Volume นั้นปริมาณของข้อมูลมันมากมายมหึมาขนาดที่ว่าภายในปี 2020 นั้นจะมีข้อมูลที่ถูกสร้างขึ้นขนาดถึง 40 Zettabytes (1 Zettabyte =หนึ่งพันล้านล้านล้านไบต์) คิดเป็นประมาณ 50 เท่าของข้อมูลปี 2011 ซึ่งส่วนตัวแล้วผมคิดว่าข้อมูลขนาด 40 Zettabytes นี้น่าจะเกิดขึ้นก่อนปี 2020 แน่ๆ ข้อมูลจำนวนมหาศาลเหล่านี้มาจากไหน?

ง่ายๆ ครับ ประชากรโลก 7 พันล้านคน มีมือถือทั่วโลกอยู่ 6 พันล้านเครื่อง ทุกๆ วันข้อมูลใหม่ๆ ถูกสร้างขึ้นมา 2.3 ล้านล้าน GB และบริษัทในอเมริกาส่วนใหญ่จะมีข้อมูลเก็บไว้ราว 100,000 GBครับแค่นี้ V ตัวแรกก็ทำให้คนฟังขาสั่นได้ง่ายๆ แล้ว V ตัวที่สอง Variety นั้น สำหรับธุรกิจแล้วในอดีตนั้นข้อมูลจะอยู่ในรูปแบบที่มีการจัดเก็บที่เป็นระบบ ชัดเจนเพราะมักจะอยู่ในรูปของแบบฟอร์ม รายงาน ตาราง ฯลฯ ที่บริษัทออกแบบมา แต่มันไม่ใช่อีกต่อไปแล้ว เพราะข้อมูลที่เกิดขึ้นและจัดเก็บจะมีแหล่งที่มาและรูปแบบที่หลากหลาย หรือ Form โดยตัวอย่างในกรณีของ Facebook คือจะมีการแชร์ Content กันถึง 30,000 ล้านชิ้นต่อเดือน ขณะที่จะมีคนดู Youtubeมากกว่า 4,000 ล้านชม. ต่อเดือน และมีการทวีต 400 ล้านทวีตในแต่ละวันจากทวีตเตอร์200 ล้านคนเป็นต้น V ถัดมาคือ Velocity หรือ ความเร็วที่ข้อมูลจะถูกสร้าง-จัดเก็บ-วิเคราะห์-นำเสนอเพื่อให้เห็นภาพ

ตลาดหลักทรัพย์ที่นิวยอร์คจะมีข้อมูล 1 ล้านล้านไบต์ในแต่ละช่วง (Session) ของการซื้อขาย รถที่ผลิตใหม่แต่ละคันจะมีการตรวจจับข้อมูลโดยเซ็นเซอร์ ไม่น้อยกว่า 100 ตัวในแต่ละคัน ตั้งแต่ข้อมูลง่ายๆ เช่น ปริมาณน้ำมันจนถึงบางอย่าง เช่น ความดันยางรถยนต์ที่เรียกว่าลมยางและตัวเลขที่น่าตกใจอีกตัวหนึ่งคือ 90% ของข้อมูลที่ถูกสร้างขึ้นมาบนโลกถูกสร้างขึ้นในช่วง 2 ปีนี้เอง!

นี่แหละคือความเร็วของการเกิดขึ้นของข้อมูล! เมื่อพูดถึง Big data แล้ว สิ่งหนึ่งที่ต้องตระหนักถึงคือข้อมูลที่จะเป็นข้อมูลที่เกิดขึ้น-ส่งต่อ-จัดเก็บ ณ ขณะนั้นเลย ที่เรียกว่า Real time นั่นเอง หรือไม่ก็เกือบจะ Real time เพราะความสามารถของอุปกรณ์และเทคโนโลยีที่เอื้อต่อการสื่อสารส่งผ่านข้อมูลได้อย่างน่าอัศจรรย์ ทุกครั้งที่มีการส่ง Line กัน รูดบัตรเครดิต ซื้อของออนไลน์ อัพเดท Facebook ฯลฯ คงจะนึกภาพได้ออกนะครับ และ V ตัวสุดท้ายคือ Veracity หรือความไม่แน่นอน,ความผิดปกติ, ความไม่ชัดเจน, หรือ ความแปรปรวนของข้อมูล เป็นมรดกตัวสุดท้ายของ Big data และในความเห็นส่วนตัวแล้วเป็นตัวที่แสบที่สุด เพราะความที่ข้อมูลมีปริมาณมาก ในหลากหลายรูปแบบ และไหลมาอย่างรวดเร็ว ทำให้สิ่งที่เข้ามาในระบบของเรามันมีทั้ง “ของดี” และ “ของเสีย” คือ ข้อมูลที่เป็นประโยชน์ ตรงตามที่เราต้องการ หรือ เป็นอะไรไม่รู้ ใช้ไม่ได้ ไหลเข้ามาด้วย เพราะฉะนั้นเมื่อพูดถึง Big data แล้วสิ่งหนึ่งที่ต้องคำนึงถึงตลอดเวลาคือทำอย่างไรเราจะกรองข้อมูลให้ได้ข้อมูลที่เป็นประโยชน์ ตรงตามที่เราต้องการ เอาไปใช้ประโยชน์ได้จริง!สิ่งที่ IBM ยกมาเป็นตัวอย่างก็มี เช่น 1 ใน 3 ของผู้บริหารธุรกิจไม่เชื่อใจในข้อมูลที่เอามาใช้ตัดสินใจ หรือ ในงานสำรวจหนึ่งๆ นั้น 27% ของผู้ตอบไม่แน่ใจในข้อมูลที่ตนเองให้ เป็นต้น

สุดท้ายมีคนแนะว่าน่าจะมีมากกว่า 4 Vs นะ (ยังกับว่าแค่นี้ยังปวดหัวไม่พอ) บางคนว่า V ที่มาจากคำ Volatility ซึ่งพูดง่ายๆ คือ อายุของข้อมูลนั่นเอง ข้อมูลนั้นจะเป็นข้อมูลที่ดีได้แค่ชั่วระยะเวลาหนึ่งเท่านั้น ผ่านจุดนี้ไปแล้ว คือ ใช้ไม่ได้ ไม่เป็นประโยชน์ ส่วน V อีกตัวนั้นบางคนก็ว่าควรจะเป็น V ที่มาจากคำ Value นั่นคือ Big data ที่เราพูดถึงกันมาทั้งหมดแต่ต้นนั้น บริษัทหรือองค์กรสามารถเอามาสร้าง/ใช้ ให้เกิดประโยชน์ได้มากน้อยเพียงใด อย่าลืมว่าที่กล่าวมาทั้งหมดนั้น ต้องใช้การลงทุนทั้งสิ้น ทั้งเงิน เวลา และ คน สุดท้ายจึงดูว่าแล้วเจ้า Big data ที่เราสู้จัดการไปมันคุ้มไหม? เราสกัดอะไรได้และสร้างสรรค์อะไรได้บ้าง? คิดเอาเองครับ

Add Friend Follow