Máy học có phải là phép kiểm định phi tham số ?

Đa số các lý thuyết khoa học đều có dạng Y = f(X), hay tổng quát hơn g(Y) = f(X). Trong đó Y và X là các đại lượng/biến số/hiện tượng có thể quan sát/đo lường/suy luận ra được từ thực tế/thiên nhiên. Các hàm số g và f chứa một số parameters (tham số/hằng số) để biểu diễn tương tác/quan hệ (không nhất thiết là nhân quả) giữa các biến số Y và X. Ví dụ E = mc^2 trong vật lý, 2H2 + O2 = 2H2O trong hóa học, PY = MV trong kinh tế.

Một ứng dụng quan trọng của các lý thuyết khoa học là dự báo Y sau khi quan sát/đo đạc/thu thập được các giá trị X. Để làm điều này các nhà lý thuyết phải xác định dạng hàm cho g và f còn các nhà khoa học thực nghiệm phải xác định giá trị các parameters trong hai hàm số đó. Phương pháp dự báo này được xếp vào dạng parametric method với hàm ý mối quan hệ/tương tác giữa Y và X chỉ được xác định sau khi các parameters đã được đo lường/tính toán/ước lượng cho một dạng hàm g và f cụ thể.

Trái ngược với parametric là non-parametric method. Với phương pháp này mối quan hệ/tương tác giữa Y và X không đòi hỏi phải được xác định qua g và f cụ thể nào đó. Trong nhiều trường hợp Y và X không cần có một lý thuyết chặt chẽ mà được gán cho một dạng quan hệ lỏng lẻo H(Y,X) = 0. Hàm H cũng thường có một số parameters (mà thỉnh thoảng còn gọi là hyper-parameters) nhưng chúng không có tính chất định hình mối quan hệ giữa Y và X mà chỉ phản ánh đặc tính của bộ số liệu thu thập thực tế liên quan đến các biến số này.

Nhìn từ phương diện này có thể coi AI hay nhiều kỹ thuật ML là một dạng non-parametric method. Ví dụ một Convolutional Neural Network (CNN) có chức năng nhận dạng khuôn mặt đã được số hóa thành hàng chục nghìn pixels (X) với một cá nhân cụ thể ( Y ) không đòi hỏi phải có một lý thuyết chi tiết về nhận dạng mặt người. CNN không cần dựa vào mô hình đánh giá mầu mắt, tỷ lệ khuôn mặt, kích thước mũi/trán, đặc điểm phụ nữ vs nam giới... mà trộn lẫn hàng chục nghìn giá trị X đó với giá trị Y trong một hàm H rất tổng quát (là một cấu trúc CNN với số layer, số lần convolution, pooling cho trước).

Các parameter của hàm H đó được xác định qua quá trình học tập (training) từ một lượng dữ liệu lớn để biến CNN thành một black box, cứ đưa ảnh (X) của một người vào nó sẽ nói đó có phải Y hay không mà người sử dụng không biết các pixels được xử lý thế nào bên trong CNN. Cần lưu ý cấu trúc CNN (hàm H) là môt hàm tổng quát nên CNN này có thể trained để nhận dạng mặt người hay nhận dạng một con mèo, chỉ cần thay đổi số liệu đầu vào. Trong khi đó nếu từ góc độ parametric để nhận dạng mặt người cần phải xác định hàm g và f từ các lý thuyết nhân chủng học/giải phẫu học nên những hàm này không thể sử dụng để xác định một con mèo.

Image result for nonparametric & Machinery learning

Tính chất non-parametric như vậy có ở tất cả các machine learning algorithms khác như decision tree, nearest neighbor, support vector machine. Nói cách khác bản chất black box của AI/ML chính là sự biến mất của các hàm g và f, loại bỏ vai trò xây dựng các mô hình lý thuyết trong việc tìm kiếm mối quan hệ giữa Y và X đo đạc được trên thực tế. Cho nên AI/ML dù có nhiều ứng dụng thực tế, chưa chắc đã góp phần vào việc thúc đẩy các lý thuyết khoa học như đóng góp của các nghiên cứu khoa học thực nghiệm truyền thống (sử dụng parametric methods).

Theo TS. Giang Lê

Tài chính thông minh

Hot news

Máy học có phải là phép kiểm định phi tham số ?

Unknown

No comments:

Post a Comment