Đây là SR3: AI nâng cấp chất lượng ảnh của Google, anh em có thấy ấn tượng?

Ngày xưa xem CSI, mấy anh cảnh sát Mỹ có công nghệ “enhance” hình ảnh để soi chi tiết khuôn mặt hay biển số xe của nghi phạm, nghe rất viễn tưởng và phi lý so với công nghệ thời bấy giờ. Nhưng hiện giờ với sự phát triển của AI, công nghệ của phim CSI đã được hiện thực hóa rất nhiều. Bằng chứng là vừa rồi, nhóm phát triển trí thông minh nhân tạo Brain Team của Google vừa có bài viết mang tên “Tạo hình ảnh độ nét cao bằng mô hình khuếch tán”, và thành quả của họ, trong mắt mình, thật sự đáng nể.
Với công nghệ nâng cấp hình ảnh, mô hình machine learning được huấn luyện để biến những hình ảnh độ phân giải rất thấp trở thành những bức hình độ phân giải cao đầy đủ chi tiết, và có thể nói, tiềm năng ứng dụng của công nghệ này rất rộng, từ việc phục chế ảnh cũ, cho đến nâng cấp hình ảnh dùng trong y khoa.
Đây là SR3: AI nâng cấp chất lượng ảnh của Google, anh em có thấy ấn tượng?

Ý tưởng mô hinh khuếch tán để nâng cấp hình ảnh đã được Google nghiên cứu và giới thiệu từ năm 2015, nhưng kể từ đó đến thời gian gần đây, công nghệ này bị dẹp sang một bên để Google nghiên cứu những dạng AI khác thuộc dạng “deep generative models,' tạm dịch là mô hình phát triển sâu. Nhưng gần đây, diffusion models lại lên ngôi khi nhóm nghiên cứu của Google tạo ra được những giải pháp đánh bại những công nghệ hiện tại, khi được chính con người đánh giá kết quả nâng cấp hình ảnh.
Giải pháp đầu tiên mà Google đưa ra chính là SR3, với những kết quả là những hình ảnh trong bài viết mà anh em đang xem. SR3 là viết tắt của Super-Resolution via Repeated Refinement, và nó hoạt động như thế này: “SR3 là một mô hình khuếch tán lấy dữ liệu đầu vào là những hình ảnh độ phân giải thấp, rồi sau đó xây dựng những hình ảnh độ phân giải cao chỉ bằng hạt nhiễu của bức ảnh. Mô hình này được huấn luyện dựa trên quy trình làm nhiễu ảnh, nơi phần mềm sẽ thêm các hạt nhiễu vào bức hình độ phân giải cao cho tới khi nhìn vào bức hình, chỉ thấy hạt nhiễu chứ không có chi tiết ảnh. Sau đó AI sẽ học cách đảo ngược quá trình đó, bắt đầu với một hình ảnh chỉ có hạt nhiễu, dần dần gỡ bỏ những chi tiết ấy để đạt được chi tiết hình ảnh thông qua ‘hướng dẫn’ từ hình ảnh gốc độ phân giải thấp.'




Qua thử nghiệm, SR3 của Google vận hành rất tốt đối với những bức hình chân dung và hình ảnh tự nhiên. Thử nghiệm nâng cấp nâng độ chi tiết gương mặt lên 8 lần, giải pháp của SR3 được người đánh giá nghĩ là chân thực hơn, với tỷ lệ “confusion rate” lên đến gần 50%, còn những giải pháp nâng cấp hình ảnh khác cũng chỉ đạt đến khoảng 34% về độ chân thực.
Để biến hình ảnh độ phân giải thấp thành độ phân giải cao, quá trình “khử nhiễu” kể trên chỉ là một giải pháp. Một giải pháp khác được Google nghiên cứu ra, gọi là CDM: “CDM là một mô hình khuếch tán có điều kiện theo lớp, được huấn luyện dựa trên dữ liệu ImageNet để tạo ra hình ảnh tự nhiên có độ phân giải cao. Vì ImageNet là một tập dữ liệu khó, chúng tôi xây dựng CDM thành một chuỗi nhiều mô hình khuếch tán. Giải pháp tiếp cận theo từng tầng này bao gồm việc xâu chuỗi nhiều mô hình tái tạo dựa trên những độ phân giải khác nhau: Một mô hình tạo ra dữ liệu độ phân giải thấp, tiếp theo là những mô hình khuếch tán nâng chất lượng hình ảnh SR3, giúp tăng dần độ phân giải hình ảnh cho tới khi bức hình được tạo ra đạt độ phân giải cao nhất.”
Lấy ví dụ những hình ảnh dưới đây được nâng cấp dần dần để đạt độ phân giải ưng ý:




Công nghệ này dĩ nhiên chưa hoàn hảo, ví dụ như thiếu những chi tiết trong toa tàu ở bức ảnh trên đây, nhưng nhìn sơ qua thì vẫn chấp nhận dược. Các nhà nghiên cứu của Google cho rằng: “Với SR3 và CDM, chúng tôi đã có thể đẩy được hiệu suất mô hình khuếch tán lên mức cao nhất đối với những tiêu chuẩn nâng cấp độ phân giải hình ảnh. Chúng tôi sẽ muốn kiểm tra thêm những giới hạn của nó, đặc biệt là trong nhiều dạng vấn đề mà mô hình tổng hợp phải giải quyết.”
Theo Petapixel, Google AI Blog

googleaiđộ phân giảinghiên cứutrí thông minh nhân tạosuper resolutiondeep learningnâng cấp hình ảnh

TIN LIÊN QUAN

Google phát triển công nghệ AI để chỉnh ảnh đẹp hơn ngay cả khi bạn chưa nhấn nút chụp!

Google đã phối hợp cùng các nhà khoa học ở Đại học MIT để phát triển các thuật toán machine learning giúp cải thiện hình ảnh theo thời gian thực, tức là khi bạn đưa smartphone lên để chuẩn bị chụp thì các thuật toán này đã chạy rồi.

Nhân viên Google tức giận khi AI do họ phát triển dùng cho máy bay quân sự

Việc AI của Google được Bộ Quốc phòng Hoa Kỳ sử dụng là một phần của Dự án Maven, hay còn gọi là AWCFT (Algorithmic Warfare Cross-Functional Team) – Một dự án do Lầu Năm Góc khởi xướng vào tháng 4 năm ngoái nhằm ứng dụng công nghệ Big Data và

Google I / O chứng minh rằng Google vẫn là ông trùm công nghệ

Google có lẽ là một câu chuyện viễn tưởng mà hầu hết mọi người sống trong thập niên 90 cũng khó có thể ngờ rằng đây sẽ là công ty có giá trị lớn nhất trên thế giới hiện nay.

Machine learning và công nghệ trí tuệ nhân tạo khác nhau thế nào?

Thuật ngữ “machine learning” gần đây xuất hiện ngày một phổ biến đại diện cho một lĩnh vực khoa học máy tính, nhằm mục đích tạo ra cho các cỗ máy khả năng tự học các thông tin, kỹ năng mà không cần sự lập trình chính xác từ con người. Nhiều người

Cải tiến trợ lý ảo Siri, Apple chiêu mộ cựu giám đốc AI của Google

John Giannandrea, cựu giám đốc bộ phận tìm kiếm về trí tuệ nhân tạo của Google đã gia nhập Apple. Sự việc này được The New York đưa tin chỉ một ngày sau khi John Giannandrea thông báo ông đã từ bỏ vai trò của mình tại Google. Giannandrea là một

Google phát triển công nghệ camera với trí thông minh nhân tạo giúp chỉnh sửa ảnh trước khi bấm chụp

Google dường như đang rất nghiêm túc với quyết tâm mạnh mẽ mang lại cho người dùng trải nghiệm chụp ảnh và quay video ở mức cao nhất có thể.

CEO công ty Google sẽ tới Việt nam vào ngày 22/12

Theo thông tin từ đại diện truyền thông Google, vị lãnh đạo cao cấp của Google - ông Sundar Pichai, một trong ba người đàn ông quyền lực nhất tại gã khổng lồ tìm kiếm Internet, sẽ có mặt tại Việt Nam vào ngày 22/12 tới.

Trong một số trường hợp, AI có thể tự lập trình ra đồng bọn với khả năng cao hơn bản của con người

Dự án trí thông minh nhân tạo AI AutoML của Google đã thành công trong việc dạy các phần mềm machine learning cách lập trình ra thêm những phần mềm machine learning khác và trong một số trường hợp, máy có thể tạo ra những những phần mềm AI tốt hơn

THỦ THUẬT HAY

Cách chụp ảnh màn hình trang web trên Microsoft Edge

Để có thể chụp được màn hình trang web trên Microsoft Edge, chúng ta có thể sử dụng công cụ có sẵn Make a Web Note trên trình duyệt.

Cách thay ảnh bìa kênh Youtube của bạn

Nếu bạn đang có một tài khoản Youtube và muốn thay ảnh bìa cho tài khoản Youtube ấy mà chưa biết làm cách nào thì hãy xem bài hướng dẫn dưới đây của Download.com.vn.

Cách tạo tài khoản Public Account trên Viber

Là chủ sở hữu một thương hiệu hoặc một công ty, bạn muốn sử dụng Public Account để tiếp cận người dùng thông qua Public Chat, tin nhắn cá nhân, các bot hoặc hơn thế nữa. Vậy thì hãy đọc bài viết này để biết cách tạo

Một lỗ hổng bảo mật trong Tinder sẽ tiết lộ vị trí thực sự của bạn

Một hành vi vi phạm an ninh trong các API của Tinder - một trong những ứng dụng hẹn hò dựa vào địa điểm cụ thể trên các thiết bị iOS / Android - có thể giúp những kẻ tội phạm tìm ra nơi chính xác bạn đang ở.

ĐÁNH GIÁ NHANH

Đánh giá thời lượng sử dụng pin của Galaxy S7: Ấn tượng không ngoài dự đoán

Với dung lượng pin cao 3000 mAh, Galaxy S7 cho thời gian sử dụng rất ấn tượng đủ để người dùng thoải mái trải nghiệm trong một ngày.

Baic Q7: Ngoài giá bán, còn gì khác để thuyết phục khách hàng Việt Nam

Với mức giá niêm yết 658 triệu (tặng 100% phí trước bạ), BAIC Q7 là một lựa chọn tương đối hấp dẫn trong phân khúc CUV 5 chỗ. Tuy nhiên, ngoài giá bán thì chiếc xe này có gì khác để thuyết phục khách hàng Việt Nam, vốn

Đánh giá Range Rover Velar R-Dynamic SE P250 - The Avant-garde Range Rover!

Leonardo da Vinci đã có một câu danh ngôn bất hủ: “Simplicity is the ultimate sophistication” (Sự đơn giản cũng là sự tinh tế tột cùng), và đó là triết lý thiết kế tột bậc mà nhiều nhà thiết kế đã, đang và sẽ theo