Con đường học machine learning cơ bản của Justin

Hello everyone. It’s Justin from AI Team.:grinning:

Ngày hôm nay, team AI rất vui khi có một trong những cơ hội đầu tiên để chia sẻ với mọi người về lộ trình học hoàn toàn “thú vị” về Machine Learning “from scratch to basics”. Điều đáng mừng đó là, tài liệu này được trực tiếp biên soạn bởi “chuyên gia” Justin, nhằm đặc biệt giúp đỡ cho các bạn thuộc tầng lớp “đang còn tự ti” với vốn liếng kiến thức eo hẹp và mang tâm lý ngại “dấn thân” trong lĩnh vực mới, giàu tiềm năng như Computer Science (Khoa học máy tính).

Justin hiểu rằng, khi tiếp xúc và làm việc trong lĩnh vực Machine Learning, điều hiển nhiên là chúng ta sẽ cần phải trang bị một nền tảng Toán học “thật tốt”, “thật vững” để tiếp cận được với các thành tựu “nở hoa” như ngày nay của Trí tuệ nhân tạo. Vô hình chung, điều này đã tạo ra một rào cản vô cùng lớn - thậm chí có thể làm “triệt tiêu” đi một nguồn lực dồi dào đáng kể “có khả năng” về AI nhưng vẫn lo sợ và “canh cánh” một nỗi ám ảnh mang tên “Toán học” !

Vậy thì Toán học có thực sự “đáng sợ” như chúng ta từng nghĩ không? Hay chúng ta cần học tốt Toán “đến cỡ nào” thì mới có thể làm được Data Science?

Phải nói rằng, đây thực sự là một rào cản rất lớn, có thể đã còn “ăn sâu” vào tiềm thức của rất nhiều người, tuy nhiên Justin cũng muốn “dũng cảm” để thử một lần “trút bỏ” nỗi lo này của các bạn với những kinh nghiệm “xương máu” mình đã có cách đây khoảng một năm cùng lộ trình học Machine Learning “from scratch” từ con số 0.

Mục tiêu cao đẹp của bài viết này, đó là team AI muốn gửi gắm một thông điệp, mong muốn chúng ta - những con người có “hoài bão” lớn lao, “dám thay đổi” hãy cứ tiếp tục “hy vọng” và “vững tin” về một tương lai “tươi sáng hơn” có thể trở thành những kỹ sư trí tuệ nhân tạo hay tiến xa hơn là những nhà khoa học dữ liệu mà được cả thế giới “tôn vinh” như “the sexiest job of 21st century !”

Có một tin “vui mừng” đối với các độc giả của bài viết này đó là: “Từ thực tế chứng minh, sinh viên kinh tế hoàn toàn có thể học, không những học giỏi mà còn có thể tiến rất xa trong lĩnh vực Data Science và trở thành những chuyên gia đầu ngành”. Điều này có thể kết luận rằng, Data Science/Machine Learning/Deep Learning không còn chỉ là “sân chơi” của riêng các bạn chuyên ngành kỹ thuật, mà ngày nay trong “cơn khan hiếm” về nguồn nhân lực, tầm ảnh hưởng của nó đã mở rộng ra để “chào đón” một bộ phận dồi dào “tưởng chừng không có điểm giao” nhưng đã cho thấy nhiều tiềm năng phát triển trong lĩnh vực này với các tên gọi như “kinh tế”, “tài chính”, “phân tích”,… Do vậy, “các bạn học kinh tế hay ngoại thương ơi, hãy cứ tự tin lên để đọc hết bài viết này nhé, bởi vì biết đâu đó những ‘chủ nhân mới’ của nó có thể chính là các bạn đấy !!!”

Hy vọng rằng với phần thuyết phục này của Justin đã giúp các bạn cảm thấy thoải mái hơn, và quan trọng có thể gỡ bỏ được phần nào về nỗi lo sợ “thâm niên” của chúng ta đối với Toán học. Toán học không thực sự khó như chúng ta nghĩ, nó được sử dụng như một công cụ “tuyệt đẹp” để mô phỏng và phản ánh “bản chất” của các quy luật, sự vật, hiện tượng. Nhờ có Toán học mà con người đã khám phá ra được vô vàn những điều kỳ diệu, tuyệt mỹ của thế gian này,…

Và giờ thì… hãy cùng đồng hành với Justin, để chiêm ngưỡng “vẻ đẹp” của Toán trên con đường học Machine Learning “from scratch to basics” nhé !!!

1. Ôn tập các kiến thức cơ bản về Toán học (tác giả Vũ Hữu Tiệp)

  https://github.com/tiepvupsu/tiepvupsu.github.io/blob/master/ML_math.pdf
  • Đây là một tài liệu học Toán bổ ích, cô đọng (chỉ 54 trang) và được trình bày dễ hiểu bởi tác giả Vũ Hữu Tiệp. Trọng tâm của tài liệu này tập trung về 4 nội dung chính yếu và quan trọng nhất trong lĩnh vực Machine Learning, bao gồm: Đại số tuyến tính, Giải tích ma trận, Xác suất thống kê và Maximum Likelihood.

  • Cách đây một năm cho tới hiện tại, Justin đã đọc cuốn “cẩm nang” này khoảng từ 6-7 lần, mỗi lần đọc là một lần Justin hiểu rõ hơn về các khái niệm toán học kỳ diệu được trình bày trong đó. Chúng ta nên rèn luyện một thói quen trong việc ghi chú lại những gì chúng ta hiểu và “cảm nhận tượng hình” được từ một công thức Toán học “có vẻ khô khan” (ở ngay bên cạnh nó). Các bạn hãy thử nghe lời Justin đi, với phương pháp đơn giản này, sau nhiều lần đọc, Justin có thể đi “khoác lác” về Toán với cả chính giáo sư của mình đó !!!

2. Chinh phục loạt bài về Machine Learning Cơ Bản (Tác giả Vũ Hữu Tiệp)

  https://machinelearningcoban.com/
  • Anh Vũ Hữu Tiệp - là một trong những thần tượng mà Justin vô cùng kính trọng. Thời điểm khi cảm thấy khó khăn và bế tắc nhất về Machine Learning, Justin đã tìm thấy blog này và đã đọc “ngấu nghiến” hết 15 bài viết đầu tiên trong blog.

  • Thời gian sau đó, Justin có tiếp tục đọc lại 15 bài viết này nhiều lần, kết hợp với chạy thử nghiệm code, đồng thời trình bày lại các kiến thức đó cho một số người bạn trên trường.

  • Sau khi đã nắm vững cơ bản các kiến thức trong 15 bài viết đầu tiên, chúng ta sẽ đến với một thử thách mới nhằm chinh phục một lý thuyết Toán khó về đối ngẫu cùng thuật toán SVM (bài 16 → 22)

  • Vượt qua được giai đoạn này, thì bạn nên “gửi một lời cảm ơn” tới chính mình bởi những thứ khó khăn nhất về Toán đã gần như qua đi. So với các kiến thức trước đó, những thuật toán ở các bài viết tiếp theo khá “nhẹ nhàng” và có thể lĩnh hội nhanh chóng trong một thời gian ngắn.

  • Kết thúc 37 bài viết trên blog là sự đánh dấu “một bước ngoặt mới” cho “cuộc đời” của chúng ta, khi đã vượt qua được “ngoạn mục” các lý thuyết cơ bản nhất về Machine Learning. Đích đến tiếp cần hướng tới và chinh phục sẽ là Deep Learning (phần lõi quan trọng của Machine Learning, và đang gặt hái được nhiều thành quả “nở hoa” từ cuộc cách mạng 4.0)

3. Sách Hands-on Machine Learning With Scikit-Learn And TensorFlow

  https://github.com/yanshengjia/ml-road/blob/master/resources/Hands%20On%20Machine%20Learning%20with%20Scikit%20Learn%20and%20TensorFlow.pdf
  • Sau khi kết thúc các loạt bài trên Machine Learning Cơ Bản, Justin nghĩ rằng chúng ta nên tiếp tục củng cố các kiến thức đã có của mình, thông qua cuốn sách kinh điển “Hands-on Machine Learning With Scikit-Learn And TensorFlow”

  • Theo Justin đánh giá, đây là một cuốn sách thú vị, chi tiết và được trình bày “lôi cuốn”, dễ hiểu dành cho các beginners hướng dẫn cách sử dụng các thư viện lập trình quan trọng trong Machine Learning như Scikit-Learn, TensorFlow.

  • Trong phần I, cuốn sách tập trung vào Machine Learning với thư viện Scikit-Learn (được sử dụng phổ biến)

  • Trong phần II, tác giả sử dụng TensorFlow để hướng người đọc tới một mảng nhỏ nhưng rất quan trọng của Machine Learning, đó là Deep Learning (với các mạng CNN, RNN, AutoEncoders,…)

  • Vượt qua được cuốn sách này, các bạn đã có thể tiếp cận được với các nghiên cứu khoa học quốc tế nổi bật hiện hành (international papers), được nhanh chóng tiếp thu những sự thành tựu quan trọng từ cộng đồng các nhà nghiên cứu trên thế giới. Điều này thật thú vị phải không?!

4. Sách Python Data Science Handbook

https://tanthiamhuat.files.wordpress.com/2018/04/pythondatasciencehandbook.pdf

  • Sau khi vượt qua được 3 chặng đường “đầy gian nan” và thử thách ở phía trên, đã tới lúc bạn cần nhìn lại mình và nhận thấy rằng: “mình cần phải học thêm về các công cụ visualize dữ liệu, quản lý data, làm việc với ma trận số với các thư viện matplotlib, pandas, numpy”. Đây là 3 công cụ được sử dụng phổ biến trong hầu hết các bài toán về Machine Learning.

  • Với những kiến thức bạn đã có được từ 3 nguồn đầu tiên, Justin tin rằng bạn sẽ lĩnh hội cuốn sách này một cách dễ dàng và “gần như không có nhiều sự cản trở” ở trong đó!!!

5. Ba nguồn paper Justin thường đọc (khi rảnh)

Trên đây là toàn bộ tâm huyết của Justin và Team AI gửi gắm cho các bạn newbies có quyết tâm và mong muốn học tập, theo đuổi con đường trở thành Data Scientist, AI/ML/DL Engineer,… Justin luôn tin tưởng rằng, bất kỳ ai có “kỹ năng phân tích” đều có thể học tốt Data Science, tuy nhiên “dám bước chân” trên con đường này sẽ cần tới rất nhiều sự kiên trì, quyết tâm và nỗ lực của bạn !!!

Hãy cố gắng lên nhé & luôn tin tưởng về một tương lai tốt đẹp! :heart_eyes:
Justin

6 Likes

Vậy là release đúng trong 1 ngày luôn :wink:

1 Like

Quả là một con đường dài và khổ luyện mới chắt chiu được như thế này ấy @anon67481427 ạ. Thank em đã sharing những kinh nghiệm thú vị nhé!