گوگل و فناوری باورنکردنی جدید ارتقای کیفیت عکسها: یک عکس ۶۴ در ۶۴ پیکسل بدهید و عکس ۱۰۲۴ در ۱۰۲۴ تحویل بگیرید
وقتی فیلمها و سریالها را تماشا میکنیم، بارها پیش آمده که از صحنههای خاصی حرص خورده باشیم. یکی از این صحنههای تکراری این است که یک عکس یا ویدئوی محو و کم کیفیت خاص را ماموران پلیس یا امنیتی میتوانند، آنقدر بزرگ و باکیفیت کنند که جزئیاتش هم مشخص شود. درست است که با پردازش کامپیوتری میتوان مقداری به وضوح عکسها افزود، اما اینها در حد معجزه هم نیستند و به صورت خلاصه نمیتوان دیتایی ثبت نشده را خلق کرد. فقط میشود که حدس زد که دیتای پیکسلهای دیگر چه میتوانستهاند باشند و وقتی آنها به تصویر اضافه شدند، چشم ما میتواند جزئیات اضافه ببیند. اما آیا واقعا چنین نرمافزارهای افزایش کیفیتی وجود دارند. باید بگوییم که محصولات متعددی در این زمینه وجود دارند و گوگل هم به تازگی نتایج تلاش چندسالهاش را منتشر کرده.
تصور کنید که عکسهای کمکیفیت تاریخی دارید یا تصور بفرمایید و یا برخی شخصیتهای مهم تاریخ را در نظر آورید که از آنها فقط چند عکس به جا مانده، در این صورت فناوریهای افزایش وضوح و ابعاد عکسها میتوانند کاربردی شوند و خدمت زیادی به ما کنند.
به تازگی در وبلاگ هوش مصنوعی گوگل، مقاله جالبی منتشر نشده که نشان میدهد تیم پژوهشی گوگل موسوم به Brain Team چقدر در این زمینه فعال است.
این تیم یک مدل یادگیری هوش مصنوعی ایجاد کرده و تعلیم داده که میتواند عکسها کمکیفیت را تبدیل به عکسهای پرکیفیت کند. کانسپت این کار را گوگل مدلهای پخش یا diffusion models مینامد. نخستین بار در سال ۲۰۱۵ گوگل خبر داده بود که روی چنین چیزی کار میکند و حالا برای نخستین بار عکسهایی از نخستین محصول نهایی شده منتشر کرده که SR3 نامیده میشود.
SR3 میتواند نویز عکسها را بگیرد. شیوه کار الگوریتم یادگیری ماشینی است که ابتدا به صورت معکوس آموزش داده میشود. یعنی عکسهای پرکیفیت به این الگوریتم نشان داده میشود و بعد در فرایندی نویز به عکسها اضافه میشود. الگوریتم این دو عکس را با هم مقایسه میکند. بعد یاد میگیرد در روندی معکوس عمل کند.
فعلا SR3 آنقدر خوب عمل میکند که میتواند تصویر چهرهها را ۸ برابر بزرگتر کند. محصول بعدی این فرایند CDM نامیده خواهد شد.
گوگل عکسهایی زیادی منتشر کرده که نشان میدهد الگوریتمش چطور عکسهای ۳۲ د ۳۲ را به عکسهای ۶۴ در ۶۴ و سپس ۲۵۶ در ۲۵۶ و حتی ۱۰۲۴ در ۱۰۲۶ تبدیل کرده است.
چنین فناوریای میتواند کاربردهای متعدد پیدا کند که یکی از آنها افزایش کیفیت تصویربرداریهای پزشکی است.
نظر شما :