Đây là SR3: AI nâng cấp chất lượng ảnh của Google, anh em có thấy ấn tượng?

Ngày xưa xem CSI, mấy anh cảnh sát Mỹ có công nghệ “enhance” hình ảnh để soi chi tiết khuôn mặt hay biển số xe của nghi phạm, nghe rất viễn tưởng và phi lý so với công nghệ thời bấy giờ. Nhưng hiện giờ với sự phát triển của AI, công nghệ của phim CSI đã được hiện thực hóa rất nhiều. Bằng chứng là vừa rồi, nhóm phát triển trí thông minh nhân tạo Brain Team của Google vừa có bài viết mang tên “Tạo hình ảnh độ nét cao bằng mô hình khuếch tán”, và thành quả của họ, trong mắt mình, thật sự đáng nể.
Với công nghệ nâng cấp hình ảnh, mô hình machine learning được huấn luyện để biến những hình ảnh độ phân giải rất thấp trở thành những bức hình độ phân giải cao đầy đủ chi tiết, và có thể nói, tiềm năng ứng dụng của công nghệ này rất rộng, từ việc phục chế ảnh cũ, cho đến nâng cấp hình ảnh dùng trong y khoa.
Đây là SR3: AI nâng cấp chất lượng ảnh của Google, anh em có thấy ấn tượng?

Ý tưởng mô hinh khuếch tán để nâng cấp hình ảnh đã được Google nghiên cứu và giới thiệu từ năm 2015, nhưng kể từ đó đến thời gian gần đây, công nghệ này bị dẹp sang một bên để Google nghiên cứu những dạng AI khác thuộc dạng “deep generative models,' tạm dịch là mô hình phát triển sâu. Nhưng gần đây, diffusion models lại lên ngôi khi nhóm nghiên cứu của Google tạo ra được những giải pháp đánh bại những công nghệ hiện tại, khi được chính con người đánh giá kết quả nâng cấp hình ảnh.
Giải pháp đầu tiên mà Google đưa ra chính là SR3, với những kết quả là những hình ảnh trong bài viết mà anh em đang xem. SR3 là viết tắt của Super-Resolution via Repeated Refinement, và nó hoạt động như thế này: “SR3 là một mô hình khuếch tán lấy dữ liệu đầu vào là những hình ảnh độ phân giải thấp, rồi sau đó xây dựng những hình ảnh độ phân giải cao chỉ bằng hạt nhiễu của bức ảnh. Mô hình này được huấn luyện dựa trên quy trình làm nhiễu ảnh, nơi phần mềm sẽ thêm các hạt nhiễu vào bức hình độ phân giải cao cho tới khi nhìn vào bức hình, chỉ thấy hạt nhiễu chứ không có chi tiết ảnh. Sau đó AI sẽ học cách đảo ngược quá trình đó, bắt đầu với một hình ảnh chỉ có hạt nhiễu, dần dần gỡ bỏ những chi tiết ấy để đạt được chi tiết hình ảnh thông qua ‘hướng dẫn’ từ hình ảnh gốc độ phân giải thấp.'




Qua thử nghiệm, SR3 của Google vận hành rất tốt đối với những bức hình chân dung và hình ảnh tự nhiên. Thử nghiệm nâng cấp nâng độ chi tiết gương mặt lên 8 lần, giải pháp của SR3 được người đánh giá nghĩ là chân thực hơn, với tỷ lệ “confusion rate” lên đến gần 50%, còn những giải pháp nâng cấp hình ảnh khác cũng chỉ đạt đến khoảng 34% về độ chân thực.
Để biến hình ảnh độ phân giải thấp thành độ phân giải cao, quá trình “khử nhiễu” kể trên chỉ là một giải pháp. Một giải pháp khác được Google nghiên cứu ra, gọi là CDM: “CDM là một mô hình khuếch tán có điều kiện theo lớp, được huấn luyện dựa trên dữ liệu ImageNet để tạo ra hình ảnh tự nhiên có độ phân giải cao. Vì ImageNet là một tập dữ liệu khó, chúng tôi xây dựng CDM thành một chuỗi nhiều mô hình khuếch tán. Giải pháp tiếp cận theo từng tầng này bao gồm việc xâu chuỗi nhiều mô hình tái tạo dựa trên những độ phân giải khác nhau: Một mô hình tạo ra dữ liệu độ phân giải thấp, tiếp theo là những mô hình khuếch tán nâng chất lượng hình ảnh SR3, giúp tăng dần độ phân giải hình ảnh cho tới khi bức hình được tạo ra đạt độ phân giải cao nhất.”
Lấy ví dụ những hình ảnh dưới đây được nâng cấp dần dần để đạt độ phân giải ưng ý:




Công nghệ này dĩ nhiên chưa hoàn hảo, ví dụ như thiếu những chi tiết trong toa tàu ở bức ảnh trên đây, nhưng nhìn sơ qua thì vẫn chấp nhận dược. Các nhà nghiên cứu của Google cho rằng: “Với SR3 và CDM, chúng tôi đã có thể đẩy được hiệu suất mô hình khuếch tán lên mức cao nhất đối với những tiêu chuẩn nâng cấp độ phân giải hình ảnh. Chúng tôi sẽ muốn kiểm tra thêm những giới hạn của nó, đặc biệt là trong nhiều dạng vấn đề mà mô hình tổng hợp phải giải quyết.”
Theo Petapixel, Google AI Blog

googleaiđộ phân giảinghiên cứutrí thông minh nhân tạosuper resolutiondeep learningnâng cấp hình ảnh

TIN LIÊN QUAN

Google phát triển công nghệ AI để chỉnh ảnh đẹp hơn ngay cả khi bạn chưa nhấn nút chụp!

Google đã phối hợp cùng các nhà khoa học ở Đại học MIT để phát triển các thuật toán machine learning giúp cải thiện hình ảnh theo thời gian thực, tức là khi bạn đưa smartphone lên để chuẩn bị chụp thì các thuật toán này đã chạy rồi.

Nhân viên Google tức giận khi AI do họ phát triển dùng cho máy bay quân sự

Việc AI của Google được Bộ Quốc phòng Hoa Kỳ sử dụng là một phần của Dự án Maven, hay còn gọi là AWCFT (Algorithmic Warfare Cross-Functional Team) – Một dự án do Lầu Năm Góc khởi xướng vào tháng 4 năm ngoái nhằm ứng dụng công nghệ Big Data và

Google I / O chứng minh rằng Google vẫn là ông trùm công nghệ

Google có lẽ là một câu chuyện viễn tưởng mà hầu hết mọi người sống trong thập niên 90 cũng khó có thể ngờ rằng đây sẽ là công ty có giá trị lớn nhất trên thế giới hiện nay.

Machine learning và công nghệ trí tuệ nhân tạo khác nhau thế nào?

Thuật ngữ “machine learning” gần đây xuất hiện ngày một phổ biến đại diện cho một lĩnh vực khoa học máy tính, nhằm mục đích tạo ra cho các cỗ máy khả năng tự học các thông tin, kỹ năng mà không cần sự lập trình chính xác từ con người. Nhiều người

Cải tiến trợ lý ảo Siri, Apple chiêu mộ cựu giám đốc AI của Google

John Giannandrea, cựu giám đốc bộ phận tìm kiếm về trí tuệ nhân tạo của Google đã gia nhập Apple. Sự việc này được The New York đưa tin chỉ một ngày sau khi John Giannandrea thông báo ông đã từ bỏ vai trò của mình tại Google. Giannandrea là một

Google phát triển công nghệ camera với trí thông minh nhân tạo giúp chỉnh sửa ảnh trước khi bấm chụp

Google dường như đang rất nghiêm túc với quyết tâm mạnh mẽ mang lại cho người dùng trải nghiệm chụp ảnh và quay video ở mức cao nhất có thể.

CEO công ty Google sẽ tới Việt nam vào ngày 22/12

Theo thông tin từ đại diện truyền thông Google, vị lãnh đạo cao cấp của Google - ông Sundar Pichai, một trong ba người đàn ông quyền lực nhất tại gã khổng lồ tìm kiếm Internet, sẽ có mặt tại Việt Nam vào ngày 22/12 tới.

Trong một số trường hợp, AI có thể tự lập trình ra đồng bọn với khả năng cao hơn bản của con người

Dự án trí thông minh nhân tạo AI AutoML của Google đã thành công trong việc dạy các phần mềm machine learning cách lập trình ra thêm những phần mềm machine learning khác và trong một số trường hợp, máy có thể tạo ra những những phần mềm AI tốt hơn

THỦ THUẬT HAY

Google ra mắt Chrome Canvas: Cho phép người dùng vẽ và ghi chú ngay trên trình duyệt

Chrome Canvas cung cấp cho người dùng khá nhiều công cụ vẽ, bao gồm nhiều loại bút, kích thước nét vẽ. Nếu bạn dùng trên Android thì có thể dùng ngón tay trượt trên màn hình cảm ứng để vẽ. Trường hợp vẽ sai thì sử dụng

Hướng dẫn cài đặt Unity Web Player để chơi game 3D

Khi chơi một số tựa game trên trình duyệt đòi hỏi người chơi phải cài đặt Unity Web Player. Đây là công cụ đắc lực, giúp bạn thoải mái trải nghiệm những tựa game 3D sắc nét, hiệu ứng hình ảnh chất lượng hơn rất nhiều.

Bị mất thẻ ATM gắn chip phải làm sao?Xem ngay để biết cách xử lý nhé!

Bị mất thẻ ATM gắn chip phải làm sao? Trước hết, bạn phải thật bình tĩnh để xử lý tình huống này và hạn chế tối đa các thiệt hại về tài chính. Sau đây là giải pháp cho bạn...

Tạo kiểu khóa màn hình Android chất lừ

Hệ điều hành Android được sử dụng phổ biến nhất trong các hệ điều hành trên thế giới. Tạo ký tự khóa màn hình chất lừ cho mất kỳ điện thoại di động Android bằng công cụ Xposed.

Gõ chữ nhanh trên iPhone thật đơn giản

Tiếp theo phần mẹo hay dành cho các thiết bị iOS hôm nay chúng tôi sẽ gửi đến bạn bài hướng dẫn xóa nhanh các số trong ứng dụng máy tính cùng như hoàn tác văn bản vừa nhập.

ĐÁNH GIÁ NHANH

Mở hộp Sony XPERIA L1 Dual: Màn hình 5.5 inches, camera 13 MP, nổi bật trong phân khúc giá 4.490.000 đồng

Sau khi chính thức ra mắt tại Việt Nam, Sony XPERIA L1 Dual nhanh chóng trở thu hút sự quan tâm của nhiều người với mức giá dưới 5 triệu đồng. Đây hứa hẹn là một sản phẩm sẽ tạo nên làn sóng trong phân khúc giá này.

Đánh giá hiệu năng Vivo Y81: Hoàn toàn mang lại trải nghiệm tốt với giá 5 triệu

Đầu tiên hãy cùng điểm qua cấu hình của Vivo Y81, chiếc smartphone này được trang bị con chip Helio P22, đây hiện là vi xử lý tầm trung mới nhất của Mediatek được sản xuất trên chạy trên quy trình 12nm gồm 8 nhân

Trên tay Vivo V9: giao diện tận dụng toàn bộ màn hình, SnapDragon 626, camera kép

Vivo V9 là chiếc điện thoại hiếm hoi sử dụng tai thỏ nhưng phần viền dưới không dày, nó khá mỏng và hài hòa với thiết kế tổng thể của máy. Nhìn chung thì ở mức giá 7.99 triệu đồng cùng với SnapDragon 626 thì V9 vẫn có