Đây là SR3: AI nâng cấp chất lượng ảnh của Google, anh em có thấy ấn tượng?

Ngày xưa xem CSI, mấy anh cảnh sát Mỹ có công nghệ “enhance” hình ảnh để soi chi tiết khuôn mặt hay biển số xe của nghi phạm, nghe rất viễn tưởng và phi lý so với công nghệ thời bấy giờ. Nhưng hiện giờ với sự phát triển của AI, công nghệ của phim CSI đã được hiện thực hóa rất nhiều. Bằng chứng là vừa rồi, nhóm phát triển trí thông minh nhân tạo Brain Team của Google vừa có bài viết mang tên “Tạo hình ảnh độ nét cao bằng mô hình khuếch tán”, và thành quả của họ, trong mắt mình, thật sự đáng nể.
Với công nghệ nâng cấp hình ảnh, mô hình machine learning được huấn luyện để biến những hình ảnh độ phân giải rất thấp trở thành những bức hình độ phân giải cao đầy đủ chi tiết, và có thể nói, tiềm năng ứng dụng của công nghệ này rất rộng, từ việc phục chế ảnh cũ, cho đến nâng cấp hình ảnh dùng trong y khoa.
Đây là SR3: AI nâng cấp chất lượng ảnh của Google, anh em có thấy ấn tượng?

Ý tưởng mô hinh khuếch tán để nâng cấp hình ảnh đã được Google nghiên cứu và giới thiệu từ năm 2015, nhưng kể từ đó đến thời gian gần đây, công nghệ này bị dẹp sang một bên để Google nghiên cứu những dạng AI khác thuộc dạng “deep generative models,' tạm dịch là mô hình phát triển sâu. Nhưng gần đây, diffusion models lại lên ngôi khi nhóm nghiên cứu của Google tạo ra được những giải pháp đánh bại những công nghệ hiện tại, khi được chính con người đánh giá kết quả nâng cấp hình ảnh.
Giải pháp đầu tiên mà Google đưa ra chính là SR3, với những kết quả là những hình ảnh trong bài viết mà anh em đang xem. SR3 là viết tắt của Super-Resolution via Repeated Refinement, và nó hoạt động như thế này: “SR3 là một mô hình khuếch tán lấy dữ liệu đầu vào là những hình ảnh độ phân giải thấp, rồi sau đó xây dựng những hình ảnh độ phân giải cao chỉ bằng hạt nhiễu của bức ảnh. Mô hình này được huấn luyện dựa trên quy trình làm nhiễu ảnh, nơi phần mềm sẽ thêm các hạt nhiễu vào bức hình độ phân giải cao cho tới khi nhìn vào bức hình, chỉ thấy hạt nhiễu chứ không có chi tiết ảnh. Sau đó AI sẽ học cách đảo ngược quá trình đó, bắt đầu với một hình ảnh chỉ có hạt nhiễu, dần dần gỡ bỏ những chi tiết ấy để đạt được chi tiết hình ảnh thông qua ‘hướng dẫn’ từ hình ảnh gốc độ phân giải thấp.'




Qua thử nghiệm, SR3 của Google vận hành rất tốt đối với những bức hình chân dung và hình ảnh tự nhiên. Thử nghiệm nâng cấp nâng độ chi tiết gương mặt lên 8 lần, giải pháp của SR3 được người đánh giá nghĩ là chân thực hơn, với tỷ lệ “confusion rate” lên đến gần 50%, còn những giải pháp nâng cấp hình ảnh khác cũng chỉ đạt đến khoảng 34% về độ chân thực.
Để biến hình ảnh độ phân giải thấp thành độ phân giải cao, quá trình “khử nhiễu” kể trên chỉ là một giải pháp. Một giải pháp khác được Google nghiên cứu ra, gọi là CDM: “CDM là một mô hình khuếch tán có điều kiện theo lớp, được huấn luyện dựa trên dữ liệu ImageNet để tạo ra hình ảnh tự nhiên có độ phân giải cao. Vì ImageNet là một tập dữ liệu khó, chúng tôi xây dựng CDM thành một chuỗi nhiều mô hình khuếch tán. Giải pháp tiếp cận theo từng tầng này bao gồm việc xâu chuỗi nhiều mô hình tái tạo dựa trên những độ phân giải khác nhau: Một mô hình tạo ra dữ liệu độ phân giải thấp, tiếp theo là những mô hình khuếch tán nâng chất lượng hình ảnh SR3, giúp tăng dần độ phân giải hình ảnh cho tới khi bức hình được tạo ra đạt độ phân giải cao nhất.”
Lấy ví dụ những hình ảnh dưới đây được nâng cấp dần dần để đạt độ phân giải ưng ý:




Công nghệ này dĩ nhiên chưa hoàn hảo, ví dụ như thiếu những chi tiết trong toa tàu ở bức ảnh trên đây, nhưng nhìn sơ qua thì vẫn chấp nhận dược. Các nhà nghiên cứu của Google cho rằng: “Với SR3 và CDM, chúng tôi đã có thể đẩy được hiệu suất mô hình khuếch tán lên mức cao nhất đối với những tiêu chuẩn nâng cấp độ phân giải hình ảnh. Chúng tôi sẽ muốn kiểm tra thêm những giới hạn của nó, đặc biệt là trong nhiều dạng vấn đề mà mô hình tổng hợp phải giải quyết.”
Theo Petapixel, Google AI Blog

googleaiđộ phân giảinghiên cứutrí thông minh nhân tạosuper resolutiondeep learningnâng cấp hình ảnh

TIN LIÊN QUAN

Google phát triển công nghệ AI để chỉnh ảnh đẹp hơn ngay cả khi bạn chưa nhấn nút chụp!

Google đã phối hợp cùng các nhà khoa học ở Đại học MIT để phát triển các thuật toán machine learning giúp cải thiện hình ảnh theo thời gian thực, tức là khi bạn đưa smartphone lên để chuẩn bị chụp thì các thuật toán này đã chạy rồi.

Nhân viên Google tức giận khi AI do họ phát triển dùng cho máy bay quân sự

Việc AI của Google được Bộ Quốc phòng Hoa Kỳ sử dụng là một phần của Dự án Maven, hay còn gọi là AWCFT (Algorithmic Warfare Cross-Functional Team) – Một dự án do Lầu Năm Góc khởi xướng vào tháng 4 năm ngoái nhằm ứng dụng công nghệ Big Data và

Google I / O chứng minh rằng Google vẫn là ông trùm công nghệ

Google có lẽ là một câu chuyện viễn tưởng mà hầu hết mọi người sống trong thập niên 90 cũng khó có thể ngờ rằng đây sẽ là công ty có giá trị lớn nhất trên thế giới hiện nay.

Machine learning và công nghệ trí tuệ nhân tạo khác nhau thế nào?

Thuật ngữ “machine learning” gần đây xuất hiện ngày một phổ biến đại diện cho một lĩnh vực khoa học máy tính, nhằm mục đích tạo ra cho các cỗ máy khả năng tự học các thông tin, kỹ năng mà không cần sự lập trình chính xác từ con người. Nhiều người

Cải tiến trợ lý ảo Siri, Apple chiêu mộ cựu giám đốc AI của Google

John Giannandrea, cựu giám đốc bộ phận tìm kiếm về trí tuệ nhân tạo của Google đã gia nhập Apple. Sự việc này được The New York đưa tin chỉ một ngày sau khi John Giannandrea thông báo ông đã từ bỏ vai trò của mình tại Google. Giannandrea là một

Google phát triển công nghệ camera với trí thông minh nhân tạo giúp chỉnh sửa ảnh trước khi bấm chụp

Google dường như đang rất nghiêm túc với quyết tâm mạnh mẽ mang lại cho người dùng trải nghiệm chụp ảnh và quay video ở mức cao nhất có thể.

CEO công ty Google sẽ tới Việt nam vào ngày 22/12

Theo thông tin từ đại diện truyền thông Google, vị lãnh đạo cao cấp của Google - ông Sundar Pichai, một trong ba người đàn ông quyền lực nhất tại gã khổng lồ tìm kiếm Internet, sẽ có mặt tại Việt Nam vào ngày 22/12 tới.

Trong một số trường hợp, AI có thể tự lập trình ra đồng bọn với khả năng cao hơn bản của con người

Dự án trí thông minh nhân tạo AI AutoML của Google đã thành công trong việc dạy các phần mềm machine learning cách lập trình ra thêm những phần mềm machine learning khác và trong một số trường hợp, máy có thể tạo ra những những phần mềm AI tốt hơn

THỦ THUẬT HAY

Hướng dẫn tắt bong bóng chat head khi có tin nhắn trên Messenger

Hôm nay mình sẽ hướng dẫn các bạn cách một tính năng trên Messenger để máy đỡ lag và chậm hơn trên các thiết bị Android cấu hình hạn chế. Đó chính là bong bóng chat head khi có tin nhắn.

Hướng dẫn cách copy bài viết trên Facebook bằng điện thoại

Trong quá trình sử dụng Facebook, bạn thấy một bài viết hay và muốn copy bài viết đó về điện thoại. Tuy nhiên, bạn loay hoay mãi nhưng vẫn chưa tìm được cách để thực hiện.

Bạn biết gì về RAM cho máy trạm và Server?

Khi xảy ra lỗi truyền tệp tin như vậy với RAM non ECC sẽ có nguy cơ làm treo server hoặc server sẽ tự khởi động lại, điều này sẽ làm tê liệt hệ thống mạng của server đó gây nhiều thiệt hại. Vì vậy để đạt sự ổn định

Hướng dẫn mang giao diện iOS 11 lên Android không cần Root

Lưu ý: Trước khi hướng dẫn mình nói luôn, cách làm của mình không phải là đơn thuần chỉ sử dụng một iLauncher duy nhất mà mình còn sử dụng nhiều ứng dụng khác nhau cần phải Dowload trên Google Play. Và điều này có thể

Những plugin GIMP tốt nhất và cách cài đặt chúng

Tuy nhiên, plugin hỗ trợ GIMP thật phức tạp. Trải nghiệm tổng thể plugin GIMP không hề thân thiện người dùng. Chúng khó kiếm, cài đặt rắc rối và nảy sinh nhiều vấn đề tương thích.

ĐÁNH GIÁ NHANH

Đánh giá Honda PCX 150 HYBRID: Giá thành cao nhưng không có ưu thế vượt trội

Có thể coi là phiên bản cao cấp của chiếc PCX thế hệ mới từng xuất hiện ở nước ta với 2 model 125 và 150 cc, điểm thay đổi lớn nhất của chiếc xe đó là sự xuất hiện của hệ thống mô-tơ điện trợ lực cùng khối pin (ắc quy)

Đánh giá hiệu năng Vivo Y55: Khả năng chơi game đáng khen trong tầm giá 4 triệu!

Vivo Y55 được trang bị chip Snapdragon 430 và 2GB RAM, một cấu hình tốt so với mức giá chỉ 4 triệu đồng. Hãy cùng đánh giá hiệu năng của sản phẩm này nhé!

Mở hộp Audeze LCDi4: Tai nghe in-ear từ phẳng tuyệt vời nhất

Hình ảnh anh em thấy trong bài này là quá trình mở hộp chiếc tai nghe in-ear mình cho là đỉnh nhất hiện nay. Chiếc LCDi4 của Audeze dùng công nghệ từ phẳng, sản xuất bằng tay ở California và đang bán với số lượng giới