Làm thế nào để trở thành data scientist?

Trong lĩnh vực công nghệ những năm gần đây, data scientist vẫn thường đi liền với tên gọi “the sexiest job of 21st century” (https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century) như để thể hiện sức hút mạnh mẽ của lịch vực đầy tiềm năng này. Trong tương lai, thay vì cải thiện hiệu quả kinh doanh bằng phản hồi của khách hàng thì thông qua insight dữ liệu thu thập, các nhà phát triển hoàn toàn có thể biết được khách hàng cần sản phẩm nào, mong muốn tính năng gì, … Hay một ví dụ trực quan, chỉ cần chúng ta search “bikini” trên trình duyệt thì ngay lập tức newfeed Facebook sẽ ngập tràn các loại bikini cho các chị em tha hồ lựa chọn :smiley:

Data science = Data analysis + Computer science

Về cơ bản, data science là sự kết hợp của quá trình thống kê, phân tích để làm sáng tỏ các insight của dữ liệu và giải quyết thông qua các cơ sở toán học, khoa học máy tính, có nghĩa là không chỉ dừng lại ở phân tích dữ liệu, data scientist sẽ phải làm sao cho máy tính cũng hiểu vấn đề và đưa giải quyết ra phản hồi giản quyết vấn đề (làm cho máy tính hiểu được là người search đang muốn mua bikini và gợi ý các loại bikini qua Facebook và Google bán dữ liệu cho Facebook là điều chắc chắn rồi :thinking:).

Làm thế nào để trở thành data scientist ?
Data science luôn yêu cầu hiểu biết sâu về cả technique lẫn business, vậy những kiến thức gì để người kỹ sư trở thành 1 data scientist ?

  • Kinh tế: tất nhiên rồi, để giải quyết một bài toán về cái gì thì chúng ta phải có hiểu biết về cái đấy, đã có rất nhiều người có background về kinh tế đã lấn sân sang cả IT để trở thành 1 data scientist.
  • Xác suất thống kê: đây là kỹ năng phổ biến cho cả science lẫn analysis, thấy đơn giản nhưng lại không hề đơn giản :thinking:
  • Algorithm: Rất nhiều kỹ sư phần mềm muốn trở thành AI engineer, data scientist bằng cách sử dụng những thư viện hay API có sẵn, hưm :slight_smile: nghe không ổn cho lắm, để hiểu 1 model hoạt động, debug như thế nào, hãy tập làm quen với đại số tuyến tính, toán cao cấp và machine learning allgorithm nhé.
  • Lập trình: để máy tính hiểu được vấn đề và đưa ra quyết định thì lập trình là kỹ năng không thể thiếu, đi kèm theo đó là một số Framework phổ biến cho AI/ML như Pytorch, Tensorflow, …

Ngoài những kỹ năng hiểu biết trên, một số kỹ năng như visualization, self-learning, communication, … cũng là không thể thiếu cho những ai muốn làm công việc “sexiest job of 21st century” :kissing_heart: .Trong bài viết sau, AI team sẽ nói về sự khác nhau giữa các job titles: data scientist, data analyst, data engineer, machine learning engineer, AI engineer nhé :sunglasses:.

Julian.

3 Likes

Welcome Julian với những bài viết đầu tiên.

1 Like

Thú thật là khi đọc những title này, chị cũng ko hiểu đâu là sự khác biệt. Hóng bài viết tiếp theo của tụi em nhé!

1 Like