Microsoft cho biết các mô hình máy học (Machine Learning) sẽ chạy nhanh hơn với độ trễ thấp trên Brainware và nền tảng này cho phép các nhà phát triển tích hợp mô hình máy học trực tiếp lên chip bán dẫn, từ đó đạt được hiệu năng cao hơn cả CPU hay GPU.
Các nhà nghiên cứu tại Microsoft đã cho chạy một mô hình máy học có tên Gated Recurrent Unit trên chip lập trình (FPGA) Stratix 10 mới của Intel ở tốc độ xử lý 39,5 TFLOPS mà không định loạt tiến trình, nhờ đó hệ thống máy học có thể đạt được hiệu năng xử lý theo thời gian thực.
Mô hình được Microsoft chọn có tỉ lệ lớn hơn nhiều lần so với các mạng thần kinh ảo như Alexnet và Resnet-50 vốn được nhiều công ty khác sử dụng để đánh giá hiệu năng phần cứng được họ phát triển. Do đó, độ trễ thấp là yếu tố cực kỳ quan trọng để có thể triển khai các hệ thống máy học ở tỉ lệ lớn như vậy bởi người dùng dĩ nhiên không hề mong muốn phải chờ đợi quá lâu để ứng dụng phản hồi.
Doug Burger - kỹ sư tại Microsoft Research cho biết: ' Chúng tôi gọi đây là AI thời gian thực bởi ý tưởng ở đây là khi bạn gởi một chỉ thị vào chip, bạn sẽ muốn có được câu trả lời ngay lập tức.'
Microsoft hiện đang sử dụng Brainwave với rất nhiều chip lập trình FPGA trang bị cho các trung tâm dữ liệu của hãng. Theo Burger, Brainwave sẽ cho phép các dịch vụ của Microsoft hỗ trợ nhanh hơn với các tính năng AI. Thêm vào đó, công ty cũng đã có kế hoạch cung cấp nền tảng Brainwave cho các khách hàng phía thứ 3 thông qua nền tảng đám mây Azure.
Brainwave nạp một mô hình máy học đã qua huấn luyện vào bộ nhớ của chip Stratix 10 và nó sẽ nằm ở đây suốt vòng đời của hệ thống. Phần cứng này sau đó có thể được dùng để tính toán những gì có bên trong một mô hình được thiết kế tạo ra dữ liệu, chẳng hạn như các đoạn văn bản dự đoán trước. Trong tình huống một mô hình máy học quá lớn để có thể chạy trên một con FPGA riêng lẻ, phần mềm sẽ triển khai và thực thi nó trên nhiều phần cứng khác.
Microsoft hiện không phải là công ty duy nhất đầu tư vào phần cứng giúp tăng tốc quá trình xử lý của máy học. Google hồi đầu năm cũng đã công bố thế hệ 2 của Tensor Processing Unit - một con chip dành riêng cho mục đích thực thi và huấn luyện cho các mô hình máy học. Kéo theo sau đó là một loạt các công ty khởi nghiệp cũng bắt đầu phát triển các phần cứng tăng tốc dành riêng cho máy học.
Nhắc đến chip lập trình FPGA, nhiều ý kiến cho rằng nó không nhanh hay không thể đạt hiệu suất như các con chip được phát triển riêng cho tác vụ thực thi hoạt động của mô hình máy học. Thế nhưng Burger cho rằng mốc hiệu năng đạt được qua hệ thống demo của Microsoft Research chứng minh rằng FPGA có thể đạt hiệu năng cao tương tự.
Thêm vào đó, hiệu năng mà Microsoft Research đạt được dựa trên một nền tảng phần cứng mới và Burger nói sẽ còn rất nhiều điều mà Microsoft và Intel có thể làm để tối ưu hóa hiệu năng phần cứng lẫn phần mềm chạy trên Brainwave. Với những cải tiến trong tương lai, việc Microsoft đạt được năng lực tính toán đến 90 TFLOPS với chip Stratix 10 của Intel điều có thể xảy ra.
Hiện tại Brainwave hỗ trợ các mô hình máy học được huấn luyện sẵn được phát triển từ thư viện Microsoft CNTK và TensorFlow của Google. Burger cho biết nhóm nghiên cứu hiện đang mở rộng khả năng tương thích với các công cụ khác như Caffe. Công ty vẫn chưa đưa ra lộ trình phát hành Brainwave cho khách hàng nhưng đã bắt đầu phối hợp với các đối tác phía thứ 3 để có thể hỗ trợ mọi mô hình máy học để chúng có thể chạy trên Brainwave.
Theo: VentureBeat