อาชีพ Data Scientist หรือ “นักวิทยาศาสตร์ข้อมูล” เป็นอาชีพที่ทุกคนได้ยินบ่อยและได้ร้บความสนใจมากขึ้น เพราะตัวงานได้โฟกัสกับการแพลน แก้ไขปัญหา ช่วยองค์กรหรือธุรกิจให้บรรลุเป้าหมาย โดยการนำดาต้าที่มีอยู่มาใช้ให้เกิดประโยชน์มากที่สุด Show
อีกทั้งยังส่งเสริมการจัดการอย่างเป็นระบบด้วย Machine Learning หรือ AI ทำให้สามารถคาดการณ์ความต้องการของตลาด รู้ใจลูกค้าล่วงหน้าได้ และเพิ่มความสะดวกสบายรวดเร็วในแต่ละกระบวนการ เพราะเหตุนี้ทำให้บริษัทต้องการตัวคนที่มีความเชี่ยวชาญด้านนี้จริงๆพอสมควร ฟังดูแล้วอาชีพนี้ก็เหมือนซูเปอร์แมนเลยใช่ไหมคะ ในบทความนี้ เราจะมารู้จักกับอาชีพ Data Scientist กัน รวมถึงสกิลที่ต้องเรียนรู้สำหรับอาชีพนี้ และแนะนำคอร์สที่น่าสนใจ เพื่อคนที่สนใจอาชีพด้านนี้จะได้ไปเริ่มศึกษากันได้เลยค่า มาทำความรู้จักอาชีพ นักวิทยาศาสตร์ข้อมูล กันเลย สารบัญเนื้อหา Data Scientist คือใคร อาชีพนี้ทำอะไรบ้างData Scientist ผู้ค้นพบ solution ของปัญหา [ขอขอบคุณรูปจาก Illustration by Freepik Storyset]ในยุคที่โลกของเราหมุนไปเร็วขึ้นด้วยเทคโนโลยี ข้อมูลมากมายเกิดขึ้นในทุกเสี้ยววินาที การใช้ประโยชน์จากข้อมูลที่เกิดขึ้นนั้นก็เป็นเรื่องที่ควรทำอย่างยิ่ง โดยคนที่จะมาทำหน้าที่นี้ก็คือ Data Scientist นั่นเอง หากจะพูดสั้นๆให้เข้าใจง่ายๆ หน้าที่หลักของ Data Scientist หรือ นักวิทยาศาสตร์ข้อมูล คือ
และสำหรับคนที่รู้สึกว่าอาชีพ Data Scientist กับ Data Analyst มีความคล้ายกันอยู่ แล้วแตกต่างกันอย่างไร ลองอ่านในบทความ Data Scientist กับ Data Analyst แตกต่างกันอย่างไร ทำงานอาชีพไหนดี ได้เลย Solution ของปัญหาที่ซ่อนอยู่Solution ที่ Data Scientist คิดขึ้นมานั้นสามารถนำมาแก้ปัญหาต่าง ๆ ภายในหรือทำให้การทำงานในองค์กรมีประสิทธิภาพได้ ซึ่งปัญหาหรือโจทย์ที่ต้องแก้นั้น ก็มีหลากหลายมากตามแต่ละองค์กร เช่น การสร้างระบบแนะนำสินค้าเพื่อจัดการกับยอดขายที่ลดลงของบริษัท เมื่อเรากดเลือกสินค้าชนิดหนึ่งบนเว็บไซต์ลงในตะกร้า ก็จะมีสินค้าที่มักจะใช้ด้วยกัน หรือหมวดหมู่เดียวกันโผล่ออกมาให้เราเห็น ซึ่งก็อาจกระตุ้นความต้องการในการช้อปปิ้งของเรา และก็เพิ่มโอกาสในการขายก็เป็นได้ หรือการที่เรามีบัตรสะสมแต้มของแบรนด์ต่าง ๆ บริษัทสามารถเก็บข้อมูลและนำไปวิเคราะห์ สร้างโมเดลมาดูว่ากลุ่มลูกค้าแต่ละกลุ่มมีแนวโน้มจะใช้สินค้าประเภทไหนอีก แล้วส่งอีเมล หรืออัพเดทเกี่ยวกับโปรโมชั่นให้กับลูกค้าในกลุ่มนั้น ๆ Use case ตัวอย่างของงาน Data Scientistอย่างที่เล่าให้ฟังข้างต้นว่า เป้าหมายของ Data Scientist คือการแก้ปัญหาหรือแก้โจทย์ ในองค์กร โดยใช้สกิลการเขียนโปรแกรม ความรู้ด้านสถิติ และความเข้าใจในเชิงธุรกิจเข้ามาร่วมด้วย แต่ถึงอย่างไรก็ตามปัญหาของแต่ละธุรกิจ หรือองค์กรก็แตกต่างกันมาก ทำให้งานก็แตกต่างกันออกไปตามโจทย์ที่ได้รับ เราลองมาดูตัวอย่างงานของบริษัทที่เราน่าจะเคยได้ยินชื่อมาบ้าง ว่างาน Data Scientist ทำอะไรได้บ้าง ตัวอย่างของงาน Data Scientist ใน AmazonRecommendation System ของ Amazon.com [ขอขอบคุณรูปจาก AI Society]Amazon.com ใช้ Recommendation system ในการแนะนำสินค้าให้กับลูกค้าโดยสำรวจข้อมูลบันทึกการซื้อสินค้าของลูกค้าเอง การซื้อสินค้าของลูกค้าคนอื่น ๆ ที่มีการจับจ่ายใช้สอยคล้ายกัน และเรทการให้คะแนนสินค้าที่เหมือนกันด้วย นอกจากนี้ Data Scientist ยังสร้างโมเดลทำนายว่าลูกค้าจะมีแนวโน้มสินค้าตัวไหน (Demand Prediction) แล้วส่งสินค้าไปเก็บไว้ในคลังสินค้าที่ใกล้ลูกค้าที่สุด เพื่อที่จะสำรองเอาไว้ในกรณีที่ลูกค้าสั่งซื้ออีกด้วย เป็นการลดค่าใช้จ่ายในการสำรองของ และเพิ่มความพึงพอใจของลูกค้าไปในตัว ทั้งยังมีการตั้งราคาสินค้าตามหลายปัจจัยเช่น ประวัติการซื้อของเรา ราคาของคู่แข่ง จำนวนสินค้าที่มีอยู่ ทำให้สามารถจัดส่วนลดสำหรับสินค้าที่เป็นที่นิยม และสร้างกำไรจากสินค้าที่ไม่ค่อยฮิตได้ ตัวอย่างของงาน Data Scientist ใน AirbnbAirbnb Insight Dashboard [ขอขอบคุณรูปจาก Inside Airbnb]Airbnb เป็นบริษัทหนึ่งที่มีข้อมูลเยอะมาก ทั้งข้อมูลของลูกค้า ข้อมูลของเจ้าของที่พัก โฮมสเตย์ ข้อมูลการจอง และ การเยี่ยมชมเว็บไซต์ Data Scientist จึงใช้ข้อมูลในการเพิ่มประสิทธิภาพของการค้นหา และใช้ demographic analytics ในการวิเคราะห์ Bounce rate ว่ามีคนเข้ามาหน้าเว็บไซน์แล้วกดออกเลยมากแค่ไหน แล้วเราจะแก้ปัญหายังไง เมื่อพบว่าลูกค้าชอบกดเข้ามาแล้วออกเลย หรือชอบคลิกดูลิงค์ประเทศเพื่อนบ้าน จึงทำเวอร์ชั่นใหม่ให้โดยเพิ่มสถานที่เที่ยว จุดหมายปลายทางยอดนิยม ส่งผลให้จำนวนคนเข้าชมเพิ่มขึ้น อยู่ในเว็บไซต์เพิ่มมากขึ้นและก็เพิ่มยอดการจองมากขึ้นนั่นเอง ตัวอย่างของงาน Data Scientist ใน SpotifyPersonalized Spotify Playlist [ขอขอบคุณรูปจาก The Startups]Spotify เป็นแอพที่แนะนำเพลงแบบเฉพาะบุคคลให้กับลูกค้ามากกว่า 100 ล้านคน ดูตัวเลขก็รู้แล้วว่าต้องมีข้อมูลเยอะมาก ถึงขนาด Big Data แน่ ๆ เลยใช้ Machine Learning เพิ่มประสิทธิภาพในการค้นหา แนะนำเพลง และเพิ่มความพึงพอใจของลูกค้า สร้าง playlist พิเศษเฉพาะบุคคลจากลักษณะนิสัยการฟังเพลง และยังมี feature ในการวิเคราะห์หลายตัว หนึ่งในนั้นทำให้ศิลปินและผู้จัดการสามารถวิเคราะห์การสตีมเพลง ความคิดเห็นของแฟนเพลง จำนวนเพลงฮิตติดชาร์ตที่อยู่ใน playlist ต่าง ๆ ที่สร้างขึ้นได้ นอกจากนี้ยังมี insight เกี่ยวกับเทรนด์ของเพลงที่ถูกปล่อยออกมาให้ชาวโลกได้รับรู้ อยากเป็น Data Scientist ต้องมีความรู้พื้นฐานด้านไหนสำหรับคนที่อยากเป็น Data Scientist อยากให้ลองศึกษาสกิลพื้นฐานเหล่านี้ดูก่อน จากนั้นลองดูว่าเราขาดสกิลอะไรบ้างก่อนที่จะสมัครงาน โดยอ่านรายละเอียดงานใน Job Description และไปหาเรียนรู้เพิ่มเติมค่ะ เพราะหน้าที่ของ Data Scientist จะแตกต่างกันไปตามแต่ละองค์กร แล้วเดี๋ยวเราจะมีคอร์สเรียนแนะนำให้ในส่วนท้ายของบทความด้วยนะคะ พื้นฐาน 1) ทักษะการเขียนโปรแกรม Python, R และ SQLการเขียนโปรแกรมเป็นทักษะหนึ่งที่ควรจะมีของอาชีพ Data Scientist ค่ะ เพราะเราต้องทำงานกับข้อมูลโดยใช้เครื่องมือแตกต่างกันไป โดยที่บางเครื่องมือต้องเขียนโค้ดเยอะ บางเครื่องมือก็มีตัวช่วยทำให้เราไม่ต้องเขียนโค้ดมากเกินไป Python ภาษาแรกๆที่ Data Scientist ใช้ภาษาโปรแกรมมิ่ง Pythonถือว่าเป็นภาษาที่เป็นที่นิยมมากๆ และเป็นภาษาแรกๆที่ Data Scientist เริ่มใช้เลยก็ว่าได้ เพราะเป็นภาษาที่เราสามารถเรียนรู้ได้ไม่ยาก เนื่องจากมันถูกออกแบบมาเพื่อให้ง่ายต่อการอ่านอย่างเป็นขั้นตอนของมนุษย์ ใช้เขียนโปรแกรมได้หลากหลาย และมี library รองรับมากมาย library คือโค้ดชุดหนึ่งที่คนอื่นเค้าเขียนเอาไว้ เราสามารถอิมพอร์ตมันเข้ามาไว้ใช้งานได้เพื่อที่ว่าเราจะได้ไม่ต้องทำทุกอย่างด้วยตัวเอง เราลองมาดูตัวอย่าง library ที่ Data Scientist มือใหม่ใช้บ่อยๆกันค่ะ
R ภาษาคู่ใจคนรักสถิติภาษาโปรแกรมมิ่ง Rเป็นภาษาหนึ่งที่ได้รับความนิยมในวิเคราะห์ข้อมูล และการคำนวณทางสถิติ ต้องบอกว่าคนชอบสถิติทุกคนถูกใจ R อย่างแน่นอน สามารถทำได้ตั้งแต่การคลีนข้อมูล (Data Wrangling) ตรวจสอบ สำรวจข้อมูลเบื้องต้นเพื่อตั้งสมมติฐาน ก่อนนำไปสร้างโมเดลทางสถิติเพื่อทดสอบสมมติฐาน (Exploration Data Analysis – EDA) รวมถึงการสร้าง Machine Learning นอกจากใช้คิดคำนวณทั่วไปแล้ว นี้ยังมี Package ไว้เพิ่มความสามารถ คล้ายๆกับ Python อีกด้วย โดยเราต้องติดตั้ง Package แล้วเรียกใช้งานด้วยฟังก์ชั่น library() ลองมาดูแพคเกจที่เราจะมีโอกาสได้เจอบ่อยๆกันค่ะ
ตัวอย่างหนึ่งในชีวิตจริงคือ การวิเคราะห์ Text จากทวิตเตอร์ โดยการเก็บข้อมูลในทวิตเตอร์ผ่านแพคเกจ twitteR แล้วนำมาวิเคราะห์ หา Insight สร้างกราฟ ผ่านแพคเกจ RGoogleAnalytics ถ้าเพื่อนอ่านมาถึงตรงนี้แล้วรู้สึกอยากเรียน R ขึ้นมาบ้างแล้ว คลิ้กเข้าไปในลิ้งค์นี้ สอนเขียน R Programming เข้าใจง่าย ๆ ใน 20 นาที ได้เลยค่ะ จะเห็นได้ว่าทั้งสองภาษานี้สามารถทำอะไรได้หลายอย่าง ตั้งแต่การคลีนข้อมูลจนไปถึงสร้างโมเดลที่ซับซ้อนได้ พื้นฐาน 2) มีความเข้าใจเรื่อง Statistics หรือ สถิติต่อให้ Data Scientist จะมีสกิลการเขียนโค้ดที่ยอดเยี่ยมมากแค่ไหน แต่ถ้าไม่เข้าใจสถิติพื้นฐาน ก็จะไม่สามารถตีความ เปรียบเทียบโมเดลที่เราสร้างขึ้นมา หรือแม้แต่สื่อสารผลลัพธ์ให้คนอื่นเข้าใจได้ ซึ่งก็เป็นเรื่องน่าเสียดายมากค่ะ เพราะฉะนั้นเราลองมาดูคอนเซ็ปต์สำคัญๆที่ Data Scientist มือใหม่ควรทำความเข้าใจกัน ซึ่งก็มี
อ่านมาสักพักเริ่มรู้สึกว้าวกันแล้วใช่ไหมคะ แต่ยังไม่หมดแค่นี้ ไปต่อพื้นฐานที่สามเลย พื้นฐาน 3) AI, Machine learning, Deep learningMachine Learning [ขอขอบคุณรูปจาก Illustration by Freepik Storyset]เมื่อเรามีพื้นฐานการเขียนโปนแกรม และพอรู้พื้นฐานสถิติบ้างแล้ว ก็ได้เวลาเรียนรู้เรื่องแอดวานซ์ขึ้นมาหน่อยอย่างเรื่องการสร้างโมเดล Machine Learning, Deep Learning และ AI Machine Learning คืออะไรMachine learning คือการเรียนรู้ของเครื่องคอมพิวเตอร์จากข้อมูลที่เราป้อนเข้าไป โดยที่มี Data Scientist เป็นผู้ออกแบบ โมเดล หรืออัลกอริทึมขึ้นมา เพื่อที่จะทำนายหรือแก้โจทย์ที่เราตั้งไว้ หลังจากนั้นก็ส่งผลลัพธ์ออกมาเป็นโค้ดหรือตัวเลข เพื่อให้เรานำไปใช้งานต่อ การจะหาโมเดลที่ดีที่สุดสำหรับปัญหานั้น Data Scientist ต้องมีความรู้ด้านสถิติ และจำเป็นต้องออกแบบตัวแปรต่างๆ ทั้งในโมเดลเอง และต้องหาโมเดล อื่นๆ มาเป็นคู่เปรียบเทียบ เพื่อมองหาโมเดลที่เหมาะสมที่สุดในการใช้งานจริง การที่เรามี Machine Learning ประกอบกับกับการที่เรามีข้อมูลปริมาณมาก หลากหลาย แถมการประมวลผลของคอมพิวเตอร์ก็มีราคาถูกลงและทรงพลังมากขึ้น ทำให้เราสามารถสร้างโมเดลได้โดยอัตโนมัติและอย่างรวดเร็ว ซึ่งก็สามารถวิเคราะห์ข้อมูลที่มีขนาดใหญ่ ซับซ้อน และให้ผลลัพธ์ที่ดีกว่า ส่งผลให้องค์กรมองเห็นช่องทางในการ พัฌนาโปรดัก และมีโอดาสในการสร้างผลกำไร ลบเลี่ยงความเสี่ยงที่จะเกิดขึ้นได้ ความแตกต่างระหว่าง Artificial Intelligence, Machine Learning และ Deep Learning
ตัวอย่างโมเดล Machine LearningMachine Learning [ขอขอบคุณรูปจาก MathWorks]ใน Machine Learning เรามีการแบ่งโมเดลเป็น 3 รูปแบบการเรียนรู้หลัก ๆ ดังนี้
เงินเดือนพื้นฐานของ Data Scientist ประมาณกี่บาทData Scientist ได้เงินเท่าไหร่ [ขอขอบคุณรูปจาก Illustration by Freepik Storyset]มาคุยกันถึงเรื่องเงินเดือนของอาชีพนักวิทยาศาสตร์ข้อมูลกันบ้างนะคะ สำหรับผู้ที่มีประสบการณ์ ทาง Adecco ซึ่งรวบรวมข้อมูลเงินเดือนในไทยมาจากการประกาศงานทั่วประเทศ สรุปผลมาว่าเงินเดือนสำหรับ Data Scientist ในไทยที่เป็น New Graduate อยู่ที่ 30,000 – 50,000 บาท ต่อเดือน สำหรับคนที่มีประสบการณ์ 1 -5 ปี ทางทีมงาน DataTH ได้ไปลองค้นคว้าจากเว็บประกาศหางานในไทยมา เงินเดือนของ Data Scientist อยู่ที่ประมาณ 70,000 บาท ขึ้นอยู่กับ industry และประสบการณ์ ส่วนในตลาดต่างประเทศ ข้อมูลจากเว็บไซต์ Payscale ซึ่งรวบรวมเงินเดือนของอาชีพ Data Scientist จากตลาดงานในอเมริกา สรุปผลมาว่าเงินเดือนสำหรับ Data Scientist ที่มีประสบการณ์ 0-1 ปีจะอยู่ที่ $85,000 ต่อปี (2.7 ล้านบาท) และสำคัญผู้ที่มีประสบการณ์ 5 ปีขึ้นไป จะอยู่ที่ $109,000 ต่อปี (3.4 ล้านบาท) แนะนำคอร์สสำหรับ Data Scientistเรารวบรวมคอร์สที่น่าสนใจสำหรับ Data Scientist จากคำแนะนำของคนที่ทำงานในด้าน Data Scientist จริง มาให้ด้านล่างนี้แล้วค่า สามารถเลือกเรียนด้านที่ต้องการได้เลย ทางทีม DataTH เลือกมาเฉพาะคอร์สของ Udemy เนื่องจากคุ้มค่ามาก ช่วงโปร (ซึ่งเค้าจัดบ่อยมาก) จะเหลือประมาณ 300 – 500 บาทต่อคอร์ส และแต่ละคอร์สมีจำนวนชั่วโมงเยอะมาก เรียนกันเต็มอิ่มเลย ชื่อคอร์สรายละเอียดลิงค์
MeowData Engineer ที่ออสเตรเลีย มีความสนใจด้าน Healthcare/Insurance อย่างมาก ชอบตัวเลข Stat Machine learning การสร้างโมเดลทำนายผลและวิเคราะห์ข้อมูลให้ทำประโยชน์ได้จริง วิทยาการ ข้อมูล หางาน ยาก ไหมถ้าพูดถึงอาชีพที่กำลังมาแรงที่สุดในช่วงนี้คงหนีไม่พ้น Data Scientist หรือนักวิทยาศาสตร์ข้อมูล Data Scientist ยังคงเป็นอาชีพที่ขาดแคลน ในไทยมีจำนวนไม่เกิน 400คน เงินเดือนเฉลี่ยสูงถึง 135,000 บาทต่อเดือน
Data Scientist ต้องเรียนคณะอะไรโดยทั่วไปแล้วผู้ที่ทำงานด้าน Data Scientist ในไทย จะจบการศึกษาปริญญาโทจากคณะวิศวกรรมศาสตร์ คณิตศาสตร์ สารสนเทศข้อมูล และวิทยาการคอมพิวเตอร์ เพราะเป็นคณะที่สอนคณิตศาสตร์ขั้นสูงและการเขียนโปรแกรมคอมพิวเตอร์ ซึ่งมหาวิทยาลัยไทยที่เปิดสอนมีดังต่อไปนี้
วิทยาการข้อมูลมีความสําคัญอย่างไรวิทยาศาสตร์ข้อมูลช่วยให้ธุรกิจต่างๆ ค้นพบรูปแบบและความสัมพันธ์ใหม่ๆ ที่มีศักยภาพในการเปลี่ยนแปลงองค์กรได้ สามารถเปิดเผยการเปลี่ยนแปลงการจัดการทรัพยากรในต้นทุนต่ำเพื่อสร้างผลกระทบสูงสุดต่ออัตรากำไร ตัวอย่างเช่น บริษัทอีคอมเมิร์ซใช้วิทยาศาสตร์ข้อมูลแล้วค้นพบว่ามีการสอบถามจากลูกค้ามากเกินไปหลังเวลาทำการ การตรวจสอบพบว่า ...
|