Deep learning và Machine learning

Có một biểu đồ về xu thế cho thấy kể từ 2018, Deep Learning (DL) sẽ chiếm thế hoàn toàn áp đảo trong lĩnh vực nghiên cứu về machine learning (ML). Về mặt thực tế thì lý do thật đơn giản: các thuật toán DL kể từ mấy năm gần đây (cột mốc lớn có lẽ là 2012) ăn đứt các thuật toán ML khác trong nhiều vấn đề quan trọng, như là xử lý phim ảnh, âm thanh và ngôn ngữ. 

Về mặt nào đó, tình hình tương tự như là vô tuyển analog và vô tuyến digital vậy. sau một thời gian chuyển pha, ngày nay các vô tuyến analog đã biến mất khỏi thị trường, nhảy vào viện bảo tàng. Không có nghĩa là kỹ thuật truyền tin analog vứt đi hoàn toàn. Các sinh viên sẽ vẫn cần học analog mới hiểu rõ hơn digital, và có nhiều thứ biểu diễn vẫn bằng analog được tốt. Đối với ML cũng vậy, để hiểu rõ hơn DL thì cần học những thuật toán ML cổ điển, và trong nhiều trường hợp có thể kết hợp giữa ML cổ điển với DL hoặc chỉ dùng ML cổ điển là đủ.

Bây giờ chuyển sang câu hỏi có tính triết lý hơn: vì sao DL lại cho ra kết quả tốt hơn hẳn ML "cổ điển", và trong rất nhiều trường hợp đã cho ra các kết quả tốt hơn người (chơi cờ giỏi hơn cả nhà vô địch thế giới, khám bệnh chuẩn hơn bác sĩ, nhận dạng ảnh it sai hơn người, nói còn hay hơn người trung bình nói, v.v.) ? Thử đưa ra vài lý do tại sao:

DL chia nhỏ quá trình quyết định thành nhiều bước nhỏ (layers) mỗi bước chỉ xứ lý chút xíu gì đó, rồi kết nối các bước lại với nhau, hệt như một hệ thần kinh phức tạp, với hàng triệu tham số (trong một thuật toán DL trung bình)
Để xử lý một tình huống cụ thể nào đó thì thuật toán (sau khi đã học) thực ra không dùng hết toàn bộ cái hệ đó mà chủ yếu dùng một phần nhỏ của nó, phần nào được "activate" nhiều nhất thôi, cũng khá là giống hệ thần kinh của ta mỗi lúc chỉ sự dụng một phần nhỏ (chứ nếu không thì đầu bốc lửa mất)
Có thể nhận thấy rất nhiều ý tưởng toán học trong DL (và tất nhiên cả trong ML cổ điển nữa), từ phân tích phổ cho đến chuỗi điều hòa cho đến sóng địa phương v.v.
Việc có nhiều lớp cho phép kết nối các tính chất địa phương vào với nhau thành tính chất toàn cục, như là một đa tạp được gắn vào từ những bản đồ nhỏ vậy. Khi gắn như vậy, các tính chất tô-pô được thể hiện (và deep learning có khả năng tô-pô đó, điều mà ML cổ điển không có), và đủ tinh tế để biểu diễn các cấu trúc quan hệ phức tạp trong thực tế.
"Lấy thịt đè người, bắt nhầm hơn bỏ sót". Xem cách thuật toán DL hoạt động thì có cảm giác là nó tính toán rất nhiều cái thừa xong rồi bỏ đi. Có thể hiểu đó là vì nó muốn "bắt nhầm hơn bỏ sót", việc tính toán đó tạo ra các cái sàng để mà "lọt sàng thì xuống nia" túm được cả những trường hợp khó túm. Tất nhiên điều đó đi đôi với cần có nhiều data để mà học, và ... tốn nhiều điện. Thế nên DL cũng mới chỉ phát triển mạnh những năm gần đây khi tốc độ xử láy máy tính và nguồn data tăng lên gấp bội.

Kết luận gì?

Thứ nhất là nếu ta cảm nhận được cấu trúc logic toán học của từng vấn đề, thì chọn lựa được thuật toán DL tương tứng phù hợp nhất (nếu không thì cứ thử đại các thuật toán khác nhau cái nào tốt hơn thì dùng)
Thứ hai là DL có khả năng tiến hóa thành cái gì nhỉ? Genetic learning?

Theo GS. Nguyễn Tiến Dũng

Tài chính thông minh

Hot news

Deep learning và Machine learning

Unknown

No comments:

Post a Comment