Tìm hiểu về bài toán dự đoán bằng AI

Như trong bài viết trước, em đã đề cập đến một trong những điều quan trọng nhất trong việc cải thiện chatbot giúp đỡ các chủ cửa hàng bán lẻ chính là thuật toán dự đoán, vậy câu hỏi đặt ra là lợi ích của việc dự đoán là gì, dự đoán số liệu gì và dự đoán như thế nào?

Dự báo bán hàng là một công cụ quan trọng cho bất kỳ doanh nghiệp nào. Có một vài lý do chính khiến dự báo doanh số bán hàng quan trọng đối với doanh nghiệp, chủ yếu để xác định doanh thu trong tương lai (dự báo doanh thu) và lập kế hoạch cho bất kỳ yêu cầu nào (Dự báo khối lượng). Dự báo bán hàng có một số ứng dụng quan trọng như:

  1. Để thiết lập hạn ngạch bán;

  2. Lên kế hoạch cho việc bán hàng cá nhân cũng như các hình thức khác của hoạt động xúc tiến trong phối thức marketing

  3. Tính toán và cân đối các chi phí bán hàng;

  4. Lập kế hoạch và kết nối công việc sản xuất, phân phối nguồn lực, kho bãi, nhân sự…

Bằng cách sử dụng dự báo:

  • Nhân viên bán hàng có thể theo dõi hiệu suất so với mục tiêu của họ và xác định rủi ro trong quy trình bán hàng ảnh hưởng đến khả năng đạt được mục tiêu.

  • Người quản lý có thể theo dõi hiệu suất bán hàng cá nhân so với hạn ngạch để chủ động cung cấp huấn luyện.

  • Giám đốc có thể dùng xu hướng dự báo để dự đoán doanh số của bộ phận và phân bổ lại nguồn lực nếu cần thiết.

  • Nhà lãnh đạo tổ chức có thể dùng số liệu ước tính được dự đoán để thay đổi chiến lược sản phẩm hoặc thông báo các số liệu dự đoán cập nhật cho nhà đầu tư.

Có nhiều phương pháp dự đoán thủ công, tuy nhiên em sẽ chỉ đề cập đến các phương pháp liên quan trực tiếp đến bài toán đang cần giải quyết của team:

  • Những phân tích theo chuỗi thời gian: Phương pháp này liên quan đến việc phân tích số liệu bán hàng trong quá khứ và sự tác động của các nhân tố ảnh hưởng tới việc bán (các khuynh hướng tăng trưởng dài hạn, những tăng giảm có tính chất chu kì, các thay đổi theo mùa).

  • Phân tích tương quan: Cách này liên quan tới việc đo lường quan hệ giữa biến số phụ thuộc là lượng bán với một hoặc nhiều biến số độc lập mà có thể giải thích sự tăng hay giảm trong khối lượng bán.

  • Những kỹ thuật định lượng khác: Nhiều kĩ thuật thống kê và toán học có thể được dùng để dự đoán hoặc ước lượng việc bán trong tương lai.

Việc dự đoán như thế nào:
Dữ liệu đầu vào sẽ lấy từ 2 nguồn:

  • Dữ liệu về hành vi thực của đối tượng trên môi trường số

  • Dữ Liệu mà chính khách hàng cung cấp cho doanh nghiệp

Trí tuệ nhân tạo và Machine Learning sẽ tổng hợp, chọn lọc, phân tích, từ đó vẽ “bức chân dung của khách hàng” với nhiều tầng thông tin nhất có thể giúp doanh nghiệp có sự hiểu biết rõ ràng, cụ thể về đối tượng tiềm năng. Công nghệ phân tích dự báo kết hợp với trí tuệ nhân tạo sẽ giúp cá nhân hóa mọi trải nghiệm của khách hàng, truyền tải đúng thông điệp đến đúng đối tượng và đúng thời điểm.

Trong các dạng bài toán của Machine Learning, em đặc biệt quan tâm đến một lớp bài toán quan trọng đó chính là bài toán dự đoán dựa trên Phương pháp hồi quy, bản chất của phân tích hồi quy chính là việc ước lượng mối quan hệ giữa các tham số trong mô hình đang xét.

Trước đây trong môn Xác Suất chúng em đã từng phải làm dự báo dữ liệu theo phương pháp hồi quy, về cơ bản, chúng em được cung cấp một bộ dữ liệu về các thuộc tính của thời tiết như nhiệt độ trong phòng ăn, phòng khách, độ ẩm, ánh sáng… và phải dự đoán được nhiệt độ ngoài trời.

Có câu nói là: “Không có một sự kiện nào trên đời là ngẫu nhiên, những thứ đang cho là ngẫu nhiên chỉ là những sự kiện ta chưa tìm ra được mô hình để biểu diễn quy luật của chúng”, và bởi vì trong bài toán dự đoán sales, hầu như mọi chỉ số khác đều sẽ ảnh hưởng đến chỉ số ta đang xét dù ít hay nhiều, thứ ta cần tìm chính là biến độ ảnh hưởng ít hay nhiều đó thành 1 hệ số gần đúng, ta thậm chí có thể coi là tất cả chỉ số đều ảnh hưởng đến nhau, bởi nếu không ta chỉ cần tính ra hệ số bằng 0. Trong bài tập môn Xác Suất của em, bằng 1 bộ dữ liệu chính xác và đủ lớn, cuối cùng em cũng tìm ra được công thức tính nhiệt độ ngoài trời dựa trên các yếu tố khác, cũng như tìm ra được độ chính xác của dự đoán này. Tương tự như vậy trong bài toán dự đoán sales, chúng ta cần có một tập dữ liệu gốc thật chuẩn ( training dataset ). Sau khi tìm ra được các tham số phụ thuộc tạm thời, chúng ta sẽ sử dụng để so sánh nó trên tập dữ liệu kiểm tra ( testing dataset ). Thay đổi các phương pháp hồi quy cho đến khi sai số trên tập dữ liệu kiểm tra là nhỏ nhất. Như vậy chúng ta đã có một mô hình hồi quy sử dụng để tính toán dự báo.

Tuy nhiên phân tích dư báo chỉ cho kết quả chính xác khi có một lượng dữ liệu đủ lớn để thu thập và phân tích. Đồng thời đảm bảo ngoài việc về độ lớn, dữ liệu cũng cần có tính năng mới và được cập nhật liên tục. Nếu không kết quả phân tích dự báo sẽ không đủ chính xác. Từ đó ảnh hưởng xấu đến những quyết định của doanh nghiệp.

8 Likes