Đây là SR3: AI nâng cấp chất lượng ảnh của Google, anh em có thấy ấn tượng?

Ngày xưa xem CSI, mấy anh cảnh sát Mỹ có công nghệ “enhance” hình ảnh để soi chi tiết khuôn mặt hay biển số xe của nghi phạm, nghe rất viễn tưởng và phi lý so với công nghệ thời bấy giờ. Nhưng hiện giờ với sự phát triển của AI, công nghệ của phim CSI đã được hiện thực hóa rất nhiều. Bằng chứng là vừa rồi, nhóm phát triển trí thông minh nhân tạo Brain Team của Google vừa có bài viết mang tên “Tạo hình ảnh độ nét cao bằng mô hình khuếch tán”, và thành quả của họ, trong mắt mình, thật sự đáng nể.
Với công nghệ nâng cấp hình ảnh, mô hình machine learning được huấn luyện để biến những hình ảnh độ phân giải rất thấp trở thành những bức hình độ phân giải cao đầy đủ chi tiết, và có thể nói, tiềm năng ứng dụng của công nghệ này rất rộng, từ việc phục chế ảnh cũ, cho đến nâng cấp hình ảnh dùng trong y khoa.
Đây là SR3: AI nâng cấp chất lượng ảnh của Google, anh em có thấy ấn tượng?

Ý tưởng mô hinh khuếch tán để nâng cấp hình ảnh đã được Google nghiên cứu và giới thiệu từ năm 2015, nhưng kể từ đó đến thời gian gần đây, công nghệ này bị dẹp sang một bên để Google nghiên cứu những dạng AI khác thuộc dạng “deep generative models,' tạm dịch là mô hình phát triển sâu. Nhưng gần đây, diffusion models lại lên ngôi khi nhóm nghiên cứu của Google tạo ra được những giải pháp đánh bại những công nghệ hiện tại, khi được chính con người đánh giá kết quả nâng cấp hình ảnh.
Giải pháp đầu tiên mà Google đưa ra chính là SR3, với những kết quả là những hình ảnh trong bài viết mà anh em đang xem. SR3 là viết tắt của Super-Resolution via Repeated Refinement, và nó hoạt động như thế này: “SR3 là một mô hình khuếch tán lấy dữ liệu đầu vào là những hình ảnh độ phân giải thấp, rồi sau đó xây dựng những hình ảnh độ phân giải cao chỉ bằng hạt nhiễu của bức ảnh. Mô hình này được huấn luyện dựa trên quy trình làm nhiễu ảnh, nơi phần mềm sẽ thêm các hạt nhiễu vào bức hình độ phân giải cao cho tới khi nhìn vào bức hình, chỉ thấy hạt nhiễu chứ không có chi tiết ảnh. Sau đó AI sẽ học cách đảo ngược quá trình đó, bắt đầu với một hình ảnh chỉ có hạt nhiễu, dần dần gỡ bỏ những chi tiết ấy để đạt được chi tiết hình ảnh thông qua ‘hướng dẫn’ từ hình ảnh gốc độ phân giải thấp.'




Qua thử nghiệm, SR3 của Google vận hành rất tốt đối với những bức hình chân dung và hình ảnh tự nhiên. Thử nghiệm nâng cấp nâng độ chi tiết gương mặt lên 8 lần, giải pháp của SR3 được người đánh giá nghĩ là chân thực hơn, với tỷ lệ “confusion rate” lên đến gần 50%, còn những giải pháp nâng cấp hình ảnh khác cũng chỉ đạt đến khoảng 34% về độ chân thực.
Để biến hình ảnh độ phân giải thấp thành độ phân giải cao, quá trình “khử nhiễu” kể trên chỉ là một giải pháp. Một giải pháp khác được Google nghiên cứu ra, gọi là CDM: “CDM là một mô hình khuếch tán có điều kiện theo lớp, được huấn luyện dựa trên dữ liệu ImageNet để tạo ra hình ảnh tự nhiên có độ phân giải cao. Vì ImageNet là một tập dữ liệu khó, chúng tôi xây dựng CDM thành một chuỗi nhiều mô hình khuếch tán. Giải pháp tiếp cận theo từng tầng này bao gồm việc xâu chuỗi nhiều mô hình tái tạo dựa trên những độ phân giải khác nhau: Một mô hình tạo ra dữ liệu độ phân giải thấp, tiếp theo là những mô hình khuếch tán nâng chất lượng hình ảnh SR3, giúp tăng dần độ phân giải hình ảnh cho tới khi bức hình được tạo ra đạt độ phân giải cao nhất.”
Lấy ví dụ những hình ảnh dưới đây được nâng cấp dần dần để đạt độ phân giải ưng ý:




Công nghệ này dĩ nhiên chưa hoàn hảo, ví dụ như thiếu những chi tiết trong toa tàu ở bức ảnh trên đây, nhưng nhìn sơ qua thì vẫn chấp nhận dược. Các nhà nghiên cứu của Google cho rằng: “Với SR3 và CDM, chúng tôi đã có thể đẩy được hiệu suất mô hình khuếch tán lên mức cao nhất đối với những tiêu chuẩn nâng cấp độ phân giải hình ảnh. Chúng tôi sẽ muốn kiểm tra thêm những giới hạn của nó, đặc biệt là trong nhiều dạng vấn đề mà mô hình tổng hợp phải giải quyết.”
Theo Petapixel, Google AI Blog

googleaiđộ phân giảinghiên cứutrí thông minh nhân tạosuper resolutiondeep learningnâng cấp hình ảnh

TIN LIÊN QUAN

Google phát triển công nghệ AI để chỉnh ảnh đẹp hơn ngay cả khi bạn chưa nhấn nút chụp!

Google đã phối hợp cùng các nhà khoa học ở Đại học MIT để phát triển các thuật toán machine learning giúp cải thiện hình ảnh theo thời gian thực, tức là khi bạn đưa smartphone lên để chuẩn bị chụp thì các thuật toán này đã chạy rồi.

Nhân viên Google tức giận khi AI do họ phát triển dùng cho máy bay quân sự

Việc AI của Google được Bộ Quốc phòng Hoa Kỳ sử dụng là một phần của Dự án Maven, hay còn gọi là AWCFT (Algorithmic Warfare Cross-Functional Team) – Một dự án do Lầu Năm Góc khởi xướng vào tháng 4 năm ngoái nhằm ứng dụng công nghệ Big Data và

Google I / O chứng minh rằng Google vẫn là ông trùm công nghệ

Google có lẽ là một câu chuyện viễn tưởng mà hầu hết mọi người sống trong thập niên 90 cũng khó có thể ngờ rằng đây sẽ là công ty có giá trị lớn nhất trên thế giới hiện nay.

Machine learning và công nghệ trí tuệ nhân tạo khác nhau thế nào?

Thuật ngữ “machine learning” gần đây xuất hiện ngày một phổ biến đại diện cho một lĩnh vực khoa học máy tính, nhằm mục đích tạo ra cho các cỗ máy khả năng tự học các thông tin, kỹ năng mà không cần sự lập trình chính xác từ con người. Nhiều người

Cải tiến trợ lý ảo Siri, Apple chiêu mộ cựu giám đốc AI của Google

John Giannandrea, cựu giám đốc bộ phận tìm kiếm về trí tuệ nhân tạo của Google đã gia nhập Apple. Sự việc này được The New York đưa tin chỉ một ngày sau khi John Giannandrea thông báo ông đã từ bỏ vai trò của mình tại Google. Giannandrea là một

Google phát triển công nghệ camera với trí thông minh nhân tạo giúp chỉnh sửa ảnh trước khi bấm chụp

Google dường như đang rất nghiêm túc với quyết tâm mạnh mẽ mang lại cho người dùng trải nghiệm chụp ảnh và quay video ở mức cao nhất có thể.

CEO công ty Google sẽ tới Việt nam vào ngày 22/12

Theo thông tin từ đại diện truyền thông Google, vị lãnh đạo cao cấp của Google - ông Sundar Pichai, một trong ba người đàn ông quyền lực nhất tại gã khổng lồ tìm kiếm Internet, sẽ có mặt tại Việt Nam vào ngày 22/12 tới.

Trong một số trường hợp, AI có thể tự lập trình ra đồng bọn với khả năng cao hơn bản của con người

Dự án trí thông minh nhân tạo AI AutoML của Google đã thành công trong việc dạy các phần mềm machine learning cách lập trình ra thêm những phần mềm machine learning khác và trong một số trường hợp, máy có thể tạo ra những những phần mềm AI tốt hơn

THỦ THUẬT HAY

3 thủ thuật hữu ích cho người dùng Firefox

Dưới đây là 3 thủ thuật đơn giản mà bạn nên thực hiện để việc sử dụng Firefox hiệu quả hơn.

5 phương pháp đối phó với cảnh báo "Bộ nhớ quá tải" trên điện thoại Galaxy

Trong cuộc sống hàng ngày, điện thoại chủ yếu được sử dụng cho mục đích liên lạc, giải trí, tương tác và lưu giữ dữ liệu. Tuy nhiên, theo thời gian, số lượng hình ảnh được lưu, ứng dụng không cần thiết và dữ liệu bộ nhớ

Hướng dẫn kiểm tra RAM của máy tính

RAM chính là nơi máy tính lưu trữ thông tin để chạy chương trình. Khi máy tính chạy chậm, có thể thủ phạm là do dung lượng bộ nhớ RAM quá ít. Bạn có thể kiểm tra dung lượng RAM đã cài đặt, cũng như dung lượng đã được

Hướng dẫn bật tính năng tự động khóa máy tính khi bạn không sử dụng

Khi rời khỏi máy tính, người dùng nên thiết lập khóa tự động màn hình sau khi máy tính không được sử dụng trong một khoảng thời gian (15 phút hoặc ít hơn). Hôm nay, TCN hướng dẫn bạn bật tính năng tự động khóa máy tính

Các bước đơn giản giúp ẩn thanh Dock trên iPhone mà không cần jailbreak

Hệ điều hành iOS của Apple nổi tiếng với việc bảo mật và không thể tùy biến như hệ sinh thái android. Điều đó khiến cho người dùng đôi khi sẽ chán với giao diện iOS.

ĐÁNH GIÁ NHANH

5 điểm nâng cấp của iPhone 13 Series so với iPhone 12 series

Sau nhiều tin đồn và mòn mỏi chờ đợi, cuối cùng các fan của “nhà Táo” đã được chứng kiến sự có mắt của iPhone 13 series. So với phiên bản tiền nhiệm iPhone 12 series, nâng cấp của iPhone 13 series là gì? Mời bạn cùng

Đánh giá chi tiết về thiết kế vận hành và giá bán của Mazda 2 2018

Mẫu xe cỡ B Mazda2 vừa bất ngờ được Thaco tăng giá thêm 30 triệu đồng so với tháng trước. Cụ thể, Mazda2 sedan tăng giá từ 499 lên 529 triệu đồng, trong khi đó phiên bản Mazda2 Hatchback cũng tăng từ 539 lên 569 triệu

Soi chi tiết Camera Samsung A52 có đáng tiền để mua ?

Nhìn chung phần thông số camera của Galaxy A52 có sự nâng cấp nhẹ khi camera chính được nâng cấp độ phân giải tối đa 64MP, trong khi camera góc rộng giảm độ phân giải xuống 8MP thay vì 12MP như trên A51.