Google cho biết đây là một bước tiến lớn trong quá trình phát triển thuật toán AI với khả năng tự học và xử lý nhiều vấn đề phức tạp trong đa dạng các lĩnh vực khác nhau, từ khoa học cho tới thiết kế các loại thuốc mới lẫn lập mô hình ảnh hưởng của biến đổi khí hậu.
Phiên bản AlphaGo trước đây dù đã có kỹ năng đánh cờ vây vượt trội hơn so với con người nhưng nó vẫn cần phải nhờ vào kiến thức chuyên môn từ con người. Chính xác hơn, người ta phải dùng cơ sở dữ liệu hơn 100 ngàn trận cờ để làm xuất phát điểm cho kiến thức của nó. Tuy nhiên, ở phiên bản mới nhất là AlphaGo Zero, các nhà nghiên cứu chỉ lập trình nó với những quy tắc cờ vây cơ bản và mọi thứ khác sẽ được nó tự học lại từ đầu.
Google cho biết bằng cách tự đánh cờ với chính mình, Zero đã có thể tự phát triển nên kỹ năng đánh cờ. Cách làm của nó là bắt đầu với những nước đi ngẫu nhiên trên bàn cờ và cứ mỗi lần thắng cuộc, Zero sẽ cập nhật vào hệ thống của nó. Quá trình này cứ lặp đi lặp lại hàng triệu lần để hoàn thiện khả năng đánh cờ. Sau 3 ngày tự chơi cờ, Zero đã đủ mạnh để 18 lần đánh bại phiên bản trước đây vốn từng đánh thắng nhà vô địch cờ vây Lee Se-dol.
Người đứng đầu dự án AlphaGo Zero David Silver cho biết: “Bằng cách không sử dụng dữ liệu của con người, chính xác hơn là không dùng chuyên môn của con người dưới bất cứ hình thức nào, chúng tôi đã có thể loại bỏ được sự kiềm kẹp trong giới hạn kiến thức con người. Bởi thế nên AI có thể tự tạo ra kiến thức cho chính nó trên nguyên tắc cơ bản nhất là từ ‘trang giấy trắng’. Điều này giúp AI mạnh hơn tất cả các phiên bản trước đây.”
Silver cho biết Zero đã tự chơi với chính nó, tái khám phá các chiến thuật cờ vậy mà con người đã hình thành nên trong hàng ngàn năm qua: “Nó bắt đầu chơi một cách ngây thơ giống như người mới chơi, nhưng một thời gian sau thì cách chơi của nó rất khó phân biệt với các người chơi chuyên nghiệp. Chương trình đã tự học được một số thế cờ thông thường lẫn nhiều biến thể của nó trong quá trình tự chơi, sau đó hình thành nên cả những chiến thuật của riêng nó. Nó nhận thấy những nước cờ của con người, thử áp dụng và cuối cùng là chọn ra thứ nó thích.”
Bên cạnh nâng cấp trình độ chơi cờ thì Zero còn có những bước tiến khác cũng không kém phần quan trọng so với phiên bản trước đây. Đầu tiên, nó ít hao tài nguyên hơn, chỉ xài có 4 con TPU (con chip xử lý AI mà Google thiết kế), so với con số 48 TPU ở phiên bản trước đây, từ đó giúp hệ thống được triển khai linh hoạt hơn. Tiếp theo, nhờ vào khả năng tự dạy chính mình nên các nhà nghiên cứu có thể phát triển thêm những thuật toán tiên tiến khác mà không dựa vào hàng tá dữ liệu ban đầu như hồi xưa.
Nhận định về thành công lần này, Ilya Sutskever, giám đốc nghiên cứu tại học viện OpenAI do Elon Musk tài trợ, cho biết: “Nghiên cứu lần này đã chứng minh rằng sự kết hợp của những kỹ thuật hiện tại có thể đạt đến những thành công ngoài sức tưởng tượng của những người trong ngành, ngay cả khi chính các kỹ thuật đó không phải là mới. Nhưng cuối cùng, điều mà các nhà nghiên cứu đạt được chính là tiếp tục phát triển lĩnh vực này, điều quan trọng không phải là phát minh ra kỹ thuật hoàn toàn mới mà thay vào đó alf ứng dụng những cái hiện có mọto cách thông minh và không ngờ tới.”
Như trong dự án AlphaGo Zero, thành công nổi trội nhất chính là loại bỏ sự cần thiết của lượng lớn cơ sở dữ liệu đầu vào vốn là kinh nghiệm từ con người. Từ đây mở ra một hướng tiếp cận mới cho các hệ thống AI tiên tiến có thể tự học một cách độc lập mà không cần hướng dẫn của con người. Khỏi cần phải nói, khi được hoàn thiện thì ứng dụng của một hệ thống như Zero là vô số. Điển hình như có thể phục vụ nghiên cứu thuốc, sinh học phân tử, hóa học lượng tử, vật lý hạt, thiết kế vật liệu,…Những công việc đòi hỏi phải xử lý lượng cực lớn dữ liệu có thể đảm nhận bởi AI, từ đó giúp các nhà nghiên cứu có thêm thời gian và công sức để tạo nên những ứng dụng thực tiễn phục vụ loài người.
Tham khảo Theverge