Đây là SR3: AI nâng cấp chất lượng ảnh của Google, anh em có thấy ấn tượng?

Ngày xưa xem CSI, mấy anh cảnh sát Mỹ có công nghệ “enhance” hình ảnh để soi chi tiết khuôn mặt hay biển số xe của nghi phạm, nghe rất viễn tưởng và phi lý so với công nghệ thời bấy giờ. Nhưng hiện giờ với sự phát triển của AI, công nghệ của phim CSI đã được hiện thực hóa rất nhiều. Bằng chứng là vừa rồi, nhóm phát triển trí thông minh nhân tạo Brain Team của Google vừa có bài viết mang tên “Tạo hình ảnh độ nét cao bằng mô hình khuếch tán”, và thành quả của họ, trong mắt mình, thật sự đáng nể.
Với công nghệ nâng cấp hình ảnh, mô hình machine learning được huấn luyện để biến những hình ảnh độ phân giải rất thấp trở thành những bức hình độ phân giải cao đầy đủ chi tiết, và có thể nói, tiềm năng ứng dụng của công nghệ này rất rộng, từ việc phục chế ảnh cũ, cho đến nâng cấp hình ảnh dùng trong y khoa.
Đây là SR3: AI nâng cấp chất lượng ảnh của Google, anh em có thấy ấn tượng?

Ý tưởng mô hinh khuếch tán để nâng cấp hình ảnh đã được Google nghiên cứu và giới thiệu từ năm 2015, nhưng kể từ đó đến thời gian gần đây, công nghệ này bị dẹp sang một bên để Google nghiên cứu những dạng AI khác thuộc dạng “deep generative models,' tạm dịch là mô hình phát triển sâu. Nhưng gần đây, diffusion models lại lên ngôi khi nhóm nghiên cứu của Google tạo ra được những giải pháp đánh bại những công nghệ hiện tại, khi được chính con người đánh giá kết quả nâng cấp hình ảnh.
Giải pháp đầu tiên mà Google đưa ra chính là SR3, với những kết quả là những hình ảnh trong bài viết mà anh em đang xem. SR3 là viết tắt của Super-Resolution via Repeated Refinement, và nó hoạt động như thế này: “SR3 là một mô hình khuếch tán lấy dữ liệu đầu vào là những hình ảnh độ phân giải thấp, rồi sau đó xây dựng những hình ảnh độ phân giải cao chỉ bằng hạt nhiễu của bức ảnh. Mô hình này được huấn luyện dựa trên quy trình làm nhiễu ảnh, nơi phần mềm sẽ thêm các hạt nhiễu vào bức hình độ phân giải cao cho tới khi nhìn vào bức hình, chỉ thấy hạt nhiễu chứ không có chi tiết ảnh. Sau đó AI sẽ học cách đảo ngược quá trình đó, bắt đầu với một hình ảnh chỉ có hạt nhiễu, dần dần gỡ bỏ những chi tiết ấy để đạt được chi tiết hình ảnh thông qua ‘hướng dẫn’ từ hình ảnh gốc độ phân giải thấp.'




Qua thử nghiệm, SR3 của Google vận hành rất tốt đối với những bức hình chân dung và hình ảnh tự nhiên. Thử nghiệm nâng cấp nâng độ chi tiết gương mặt lên 8 lần, giải pháp của SR3 được người đánh giá nghĩ là chân thực hơn, với tỷ lệ “confusion rate” lên đến gần 50%, còn những giải pháp nâng cấp hình ảnh khác cũng chỉ đạt đến khoảng 34% về độ chân thực.
Để biến hình ảnh độ phân giải thấp thành độ phân giải cao, quá trình “khử nhiễu” kể trên chỉ là một giải pháp. Một giải pháp khác được Google nghiên cứu ra, gọi là CDM: “CDM là một mô hình khuếch tán có điều kiện theo lớp, được huấn luyện dựa trên dữ liệu ImageNet để tạo ra hình ảnh tự nhiên có độ phân giải cao. Vì ImageNet là một tập dữ liệu khó, chúng tôi xây dựng CDM thành một chuỗi nhiều mô hình khuếch tán. Giải pháp tiếp cận theo từng tầng này bao gồm việc xâu chuỗi nhiều mô hình tái tạo dựa trên những độ phân giải khác nhau: Một mô hình tạo ra dữ liệu độ phân giải thấp, tiếp theo là những mô hình khuếch tán nâng chất lượng hình ảnh SR3, giúp tăng dần độ phân giải hình ảnh cho tới khi bức hình được tạo ra đạt độ phân giải cao nhất.”
Lấy ví dụ những hình ảnh dưới đây được nâng cấp dần dần để đạt độ phân giải ưng ý:




Công nghệ này dĩ nhiên chưa hoàn hảo, ví dụ như thiếu những chi tiết trong toa tàu ở bức ảnh trên đây, nhưng nhìn sơ qua thì vẫn chấp nhận dược. Các nhà nghiên cứu của Google cho rằng: “Với SR3 và CDM, chúng tôi đã có thể đẩy được hiệu suất mô hình khuếch tán lên mức cao nhất đối với những tiêu chuẩn nâng cấp độ phân giải hình ảnh. Chúng tôi sẽ muốn kiểm tra thêm những giới hạn của nó, đặc biệt là trong nhiều dạng vấn đề mà mô hình tổng hợp phải giải quyết.”
Theo Petapixel, Google AI Blog

googleaiđộ phân giảinghiên cứutrí thông minh nhân tạosuper resolutiondeep learningnâng cấp hình ảnh

TIN LIÊN QUAN

Google phát triển công nghệ AI để chỉnh ảnh đẹp hơn ngay cả khi bạn chưa nhấn nút chụp!

Google đã phối hợp cùng các nhà khoa học ở Đại học MIT để phát triển các thuật toán machine learning giúp cải thiện hình ảnh theo thời gian thực, tức là khi bạn đưa smartphone lên để chuẩn bị chụp thì các thuật toán này đã chạy rồi.

Nhân viên Google tức giận khi AI do họ phát triển dùng cho máy bay quân sự

Việc AI của Google được Bộ Quốc phòng Hoa Kỳ sử dụng là một phần của Dự án Maven, hay còn gọi là AWCFT (Algorithmic Warfare Cross-Functional Team) – Một dự án do Lầu Năm Góc khởi xướng vào tháng 4 năm ngoái nhằm ứng dụng công nghệ Big Data và

Google I / O chứng minh rằng Google vẫn là ông trùm công nghệ

Google có lẽ là một câu chuyện viễn tưởng mà hầu hết mọi người sống trong thập niên 90 cũng khó có thể ngờ rằng đây sẽ là công ty có giá trị lớn nhất trên thế giới hiện nay.

Machine learning và công nghệ trí tuệ nhân tạo khác nhau thế nào?

Thuật ngữ “machine learning” gần đây xuất hiện ngày một phổ biến đại diện cho một lĩnh vực khoa học máy tính, nhằm mục đích tạo ra cho các cỗ máy khả năng tự học các thông tin, kỹ năng mà không cần sự lập trình chính xác từ con người. Nhiều người

Cải tiến trợ lý ảo Siri, Apple chiêu mộ cựu giám đốc AI của Google

John Giannandrea, cựu giám đốc bộ phận tìm kiếm về trí tuệ nhân tạo của Google đã gia nhập Apple. Sự việc này được The New York đưa tin chỉ một ngày sau khi John Giannandrea thông báo ông đã từ bỏ vai trò của mình tại Google. Giannandrea là một

Google phát triển công nghệ camera với trí thông minh nhân tạo giúp chỉnh sửa ảnh trước khi bấm chụp

Google dường như đang rất nghiêm túc với quyết tâm mạnh mẽ mang lại cho người dùng trải nghiệm chụp ảnh và quay video ở mức cao nhất có thể.

CEO công ty Google sẽ tới Việt nam vào ngày 22/12

Theo thông tin từ đại diện truyền thông Google, vị lãnh đạo cao cấp của Google - ông Sundar Pichai, một trong ba người đàn ông quyền lực nhất tại gã khổng lồ tìm kiếm Internet, sẽ có mặt tại Việt Nam vào ngày 22/12 tới.

Trong một số trường hợp, AI có thể tự lập trình ra đồng bọn với khả năng cao hơn bản của con người

Dự án trí thông minh nhân tạo AI AutoML của Google đã thành công trong việc dạy các phần mềm machine learning cách lập trình ra thêm những phần mềm machine learning khác và trong một số trường hợp, máy có thể tạo ra những những phần mềm AI tốt hơn

THỦ THUẬT HAY

Cách xem thông tin mũi tiêm trên ứng dụng PC Covid rất hữu ích cho bạn

Bạn có thể tra cứu thông tin tiêm vaccine Covid-19 mũi 1 và mũi 2 trên ứng dụng PC Covid. Sau đây là cách xem thông tin mũi tiêm trên ứng dụng PC Covid nhé...

Top 5 công cụ kiểm tra Backlink miễn phí

Giới thiệu độc giả những website bổ ích cho những SEOER kiểm tra Backlink hiệu quả và nhiều ứng dụng tuyệt vời hơn thế nữa.

[Hướng dẫn] 3 cách test RAM, kiểm tra RAM laptop đơn giản

Người dùng đang muốn kiểm tra nhanh tình trạng RAM trên laptop máy tính để theo dõi hiệu năng hoạt động của máy tính hoặc nâng cấp RAM phù hợp. Vậy bạn đừng bỏ qua những thông tin hữu ích trong bài viết dưới đây để

Làm thế nào để sử dụng camera thứ hai trên iPhone 7 Plus?

Dưới đây là những gì bạn cần biết về cách thức hoạt động và làm thế nào để sử dụng chiếc camera thứ hai trong hệ thống camera kép của iPhone 7 Plus

Top 5 ứng dụng chỉnh sửa ảnh đỉnh nhất miễn phí trên iPhone

Hình ảnh lưu giữ khoảnh khắc, để khoảnh khắc được tuyệt vời hơn không thể thiếu các ứng dụng chỉnh sửa ảnh. Cùng chúng tôi điểm qua top 5 ứng dụng chỉnh ảnh đỉnh nhất trên iPhone, vừa dễ sử dụng vừa miễn phí tội gì

ĐÁNH GIÁ NHANH

Đánh giá trình quản lý pin trên Samsung Galaxy S7 sau khi cập nhật Android 7.0

Android 7.0 đang mang lại rất nhiều các cải tiến mới cho Samsung Galaxy S7. Hôm nay hãy cùng FPTShop đánh giá trình quản lý pin trên Samsung Galaxy S7

Đánh giá OPPO A93: Có xứng đáng điểm 10 trong phân khúc smartphone tầm trung?

OPPO A93 là đại diện mới nhất của dòng điện thoại tầm trung A-Series của một trong những hãng sản xuất smartphone lớn nhất thế giới. Hãy cùng TCN đánh giá OPPO A93 một cách chi tiết xem sản phẩm này xứng với khung điểm

Đánh giá camera Mi 5: chụp thiếu sáng ấn tượng, cân bằng trắng tốt, phơi sáng tới 32 giây

Rõ ràng, so với các thế hệ smartphone tiền nhiệm, camera của Mi 5 đã được cải tiến rất nhiều.