Data scientist เรียนคณะอะไร

มีคนถามผมในงาน Insurtech Ignite Hackathon ที่ว่า ถ้าอยากจะเป็น Data Scientist ต้องเรียนอะไรดี ระหว่าง วิศวกรรมศาสตร์ สถิติศาสตร์ บริหารธุรกิจ การตลาด (ใครเป็นผู้ถามผม หลังไมค์มาหน่อย จะหารางวัลให้นะครับ :D)

คำตอบที่ตอบไปในงาน ก็คือ เรียนคณะไหนก็ได้ครับ แต่ด้วยความที่ Data Scientist ต้องการความรู้ความสามารถ 3 ด้าน ได้แก่

  1. สถิติ/คณิต/คำนวณ
  2. เขียนโปรแกรม algorithm และประมวลผลข้อมูล
  3. ความรู้ด้านธุรกิจหรือความรู้ให้เรื่องที่ทำการวิเคราะห์

ถ้าจบวิศวะ ก็ต้องไปค้นคว้าอ่านเรื่องธุรกิจ บริหารจัดการ ซึ่งเด็กวิศวะบางคนจะแพ้ทาง เพราะเรื่องการบริหารธุรกิจ ไม่ได้ตรงไปตรงมาแบบการเรียนวิศวะ ทำให้เด็กวิศวะบางคนแอบมึน และรู้สึกอึดอัดกับการบริหารธุรกิจ และถ้าไม่เก่งสถิติ ก็ต้องไปอ่านเพิ่มอีก

ถ้าจบสถิติ ก็ต้องไปฝึกเขียนโปรแกรม หรือ ถ้าเขียนพอเป็นอยู่แล้ว ก็ต้องไปศึกษาการบริหารธุรกิจอีก

ถ้าจบบริหาร ก็ต้องไปฝึกเขียนโปรแกรม และอ่านทำความเข้าใจเรื่องคำนวณหรือสถิติต่างๆ

ความท้าทาย ก็คือ ใครจะอึดกว่ากันในการฝึกในสิ่งที่ตัวเองขาดไป

กลับมาจากงาน คำถามก็ยังวนเวียนอยู่ในหัว เพราะแต่ละคนที่จบกันมาหลากหลายก็จะบ่นว่า รู้งี้ ไปเรียนคณะนู้นนั้นนี้ดีกว่า (ตัวผมเอง จบวิศวะโยธา คือ อิจฉาทุกคน) เลยเอาคำถามไปโพสต์บน Facebook มา ก็ได้คำตอบมาหลากหลาย แล้วก็มีคำตอบน่ารักๆ เยอะแยะเลย เลยขอเอามาแชร์ให้ฟังกันครับ

Getting Started with Statistics/Mathematics

อย่างแรกเลยก็คงจะต้องเริ่มต้นกับความเข้าใจในเรื่องข้อมูล การวิเคราะห์ข้อมูล การทำโมเดล การสร้างสมการ การคำนวณ เพื่อให้เข้าใจวิธีการนำข้อมูลทำการทดสอบสมมติฐานหรือความเชื่อของเรา หาความสัมพันธ์

คนที่เรียนสถิติก็สบายไป คนที่เรียนวิศวะหรือบริหารธุรกิจ จริงๆ ก็เรียนสถิติ ก็ลองไปขวนขวายเรียนรู้อ่านเพิ่มเติม เอาจริงๆ ก็คือ แค่สถิติพื้นฐานบางคนก็ไม่แน่นแล้ว อันนี้ก็ไปต่อยาก

Getting Ahead with Programming

ถ้ามีแค่สถิติคำนวณ ก็อาจจะไปได้ไม่ไกลมาก เพราะพวกซอฟต์แวร์สถิติ ก็ไม่สามารถจัดการข้อมูลขนาดใหญ่ได้ หรือ ไม่สามารถปรับแก้วิธีการคำนวณได้ ถ้าเขียนโปรแกรมได้ ก็จะสามารถเขียนวิธีการคำนวณของตัวเองได้ มีความพริ้วไหวในการคำนวณมากกว่า รวมถึงสามารถประมวลผลข้อมูลขนาดใหญ่ได้ สร้างตัวแปรใหม่ๆ ที่ตัวเองต้องการได้อีก

คนที่เรียนวิศวะคอม หรือ วิทยาฯคอม ก็คงสบายไป เขียนโปรแกรมวนลูปวิ่งกันปิ้วๆๆ แต่สิ่งที่พบเจอก็คือ คนเขียนโปรแกรมจะคิดแบบการพัฒนาโปรแกรม หรือ โปรแกรมที่จะมีข้อมูลเพียง 1 record วิ่งเข้ามาประมวลผล แต่ถ้าเป็นการเขียนโปรแกรมเชิงการวิเคราะห์ จะทำการประมวลผลทีละหลายๆ record หรือ ที่เค้าชอบเรียกกันว่า vectorization

ณ จุดนี้ คนที่ไม่ได้เรียนคอมมา ก็ต้องสู้เค้าหน่อย ไปดูพวก online course แล้วฝึกเขียนโค้ดตาม ถ้าเอาให้ง่ายและสนุก ก็ลองหาโปรเจคทำเองเพื่อหัดเขียนโปรแกรม เพราะเวลาไปเรียนเขียนโปรแกรม มันจะเป็น step ที่น่าเบื่อ

Getting Insights with Domain Knowledge

เขียนโปรแกรมได้ วิเคราะห์ข้อมูลเป็น การตีความหรือการ validate ผลก็สำคัญมากครับ การ validate ผล ไม่ใช่แค่การ validate model ว่าแม่น หรือไม่แม่น เคยเจอเคสที่ model สุดแสนจะแม่นครับ แต่ผลที่ได้มันผิด business sense ซึ่งถ้าย้อนกลับไปตรวจก็คือ ข้อมูลที่เอาเข้ามา เป็นข้อมูลที่มีผลจากโปรโมชัน แต่ไม่ได้มีการแยกข้อมูลโปรโมชันออกไป หรือ นำโปรโมชันไปใช้เป็นตัวแปร

คนที่มี Domain Knowledge ก็จะมีความคล่องแคล่วในการตั้งตัวแปร ตั้งคำถาม ตั้งแนวทางการวิเคราะห์ข้อมูล เอาผลลัพธ์ของการวิเคราะห์ไปเชื่อมโยงกับการพัฒนาธุรกิจ รู้ข้อจำกัด รู้สมมติฐานในการวิเคราะห์ ดูแว้บเดียวก็รู้แล้วว่า ข้อมูลหรือผลลัพธ์นั้นถูกหรือผิด

คนที่จบบริหารธุรกิจมา ก็จะเก่งและเข้าใจ มีทฤษฎีแนวคิดในการวิเคราะห์ที่หลากหลาย ลองจินตนาการว่า ส่งวิศวกรไปวิเคราะห์ข้อมูลบัญชีสิครับ ก็จะงงว่า เดบิตเงินสด หรือ เครดิตขาย นี่ คือ บวก หรือ ลบ

บทส่งท้าย

จากที่มีหลายคนมาช่วยตอบคำถามที่โพสต์ถามไว้ ก็มีหลายคำตอบที่ผมชอบและเป็นสิ่งที่อธิบายได้ว่า ทำไม Data Scientist ถึงหายากและมีรายได้สูง

ในมุมมองผม ก็คือ คนที่เป็น Data Scientist ที่มีทักษะความสามารถครบรอบด้านนั้น จะต้องทั้งเรียนในศาสตร์ที่หลากหลาย ทั้งไปเรียนมาเป็นปริญญา หรือ ไปทำงานมาจนมีประสบการณ์ หรือ ไปเรียนรู้ทดลองทำเองจนเกิดความชำนาญ (เน้นย้ำนะครับ ว่าเรียนรู้จนเกิดความชำนาญ) ซึ่งเป็นการลงทุนลงแรงของแต่ละคนทั้งนั้น ต้องใช้เวลาจำนวนมากในการสร้างความเชี่ยวชาญเฉพาะด้าน

ในปัจจุบัน ก็เพิ่งเริ่มจะมีหลักสูตรที่มุ่งพัฒนา Data Scientist ออกมา แต่ก็ยังไม่น่าจะเพียงพอ หรือ ผลิตได้ทันความต้องการของภาครัฐและภาคธุรกิจ

คุณปิง นักศึกษา ป.โท หลักสูตร Business Analytics and Data Science ของ NIDA ก็ให้มองว่าแต่ละคนก็อาจจะมีต้นทุนที่ต่างกัน แต่ยังไงก็คงจะยังไม่พอ ก็ต้องไปอ่าน หรือฝึกเพิ่มอีกมากมาย อีกสาเหตุหนึ่งที่คนไทยยังไม่ได้พัฒนาไปไกลมาก คือ คนไทยไม่ชอบอ่าน content ภาษาอังกฤษ (หลายคนให้ความเห็นมาแบบนี้นะครับ) การเรียนรู้ด้าน Data Science สามารถทำได้ด้วยตัวเอง มีเนื้อหาให้อ่านเยอะแยะมาก แต่ส่วนมากเป็นภาษาอังกฤษ ที่เป็นภาษาไทยยังน้อยอยู่

คุณจอส มหาบัณฑิตจาก College of Management Mahidol University ก็ได้ปิดท้ายนี้ไว้ดีมากว่า จะเรียนอะไรก็เรียนมาเถอะ ถ้าไม่มีความตั้งใจ มุ่งมั่น ขวนขวายเปิดรับสิ่งใหม่ ก็จะพัฒนาได้ไปไม่ถึงไหน

ท้ายสุดนี้ ก็อยากให้กำลังใจทุกคนว่า ขอให้คนที่อยากเป็น Data Scientist นั้น ตั้งใจฝึกฝนและขยันร่ำเรียนอย่าท้อถอย และได้ทำงานในตำแหน่งหน้าที่นี้อย่างที่หวังไว้

ผมเห็นหลายคนทุ่มเทมาก และพยายามอย่างมาก แต่ก็ยังไปไม่ถึงสิ่งที่หวังไว้ เราก็ต้องรับสิ่งเหล่านี้ไว้เป็นบทเรียนประสบการณ์เพื่อนำไปพัฒนาปรับปรุงตัวเราต่อไปอีก สิ่งที่ยากที่สุดคือ

Data Scientist เรียนสาขาอะไร

เรียนมาไม่ตรงสาย จะมาเรียนต่อ Data analytic, Data science ได้มั้ย? มหาลัยส่วนใหญ่เค้าจะกำหนดไว้ค่ะว่านักเรียนที่อยากมาเรียนต่อด้านนี้ควรจบปริญญาตรีในสาขาที่เกี่ยวข้อง เช่น เศรษฐศาสตร์ บัญชีและธุรกิจ วิศวกรรมศาสตร์ วิทยาศาสตร์คอมพิวเตอร์ คอมพิวเตอร์ คณิตศาสตร์

Data Science ต้องเรียนอะไรบ้าง

Data Science ประกอบด้วย Computer Science + Maths & Stats + Business Domain Expert ?.
Computer Science – วิทยาการคอมพิวเตอร์ เช่น การเขียนโปรแกรม, อัลกอริธึม, โครงสร้างข้อมูล (Data Structure).
Maths & Statistics – คณิตศาสตร์ และสถิติ.
Business / Domain Expertise – ความรู้ด้านธุรกิจ.

นักวิเคราะห์ข้อมูลต้องเรียนคณะอะไร

บทบาทนักวิเคราะห์ข้อมูลส่วนใหญ่ต้องการวุฒิปริญญาตรีด้านคณิตศาสตร์ สถิติ วิทยาการคอมพิวเตอร์ หรือการเงินเป็นอย่างน้อย ส่วนนักวิทยาศาสตร์ข้อมูล (รวมถึงนักวิเคราะห์ข้อมูลขั้นสูงจำนวนมาก) มักจบปริญญาโทหรือปริญญาเอกด้านวิทยาศาสตร์ข้อมูล เทคโนโลยีสารสนเทศ คณิตศาสตร์ หรือสถิติ

คณะ Data Science ใช้ คะแนน อะไรบ้าง

ต้องใช้คะแนน GAT / PAT 1. ไม่สอบสัมภาษณ์ GPAX (5 ภาคการศึกษา) > 2.50..
GPAX (5 ภาคการศึกษา) > 2.50..
เปิดรับประมาณ 5 คน.
เปิดรับสมัครช่วงเดือน พ.ค..