Краток одговор: Зголемувањето на резолуцијата со вештачка интелигенција функционира така што го тренира моделот на спарени слики со ниска и висока резолуција, а потоа го користи за да предвиди веродостојни дополнителни пиксели за време на зголемувањето на резолуцијата. Ако моделот видел слични текстури или лица при обуката, може да додаде убедливи детали; ако не, може да „халуцинира“ артефакти како што се ореоли, восочна кожа или треперење во видеото.
Клучни заклучоци:
Предвидување : Моделот генерира веројатни детали, а не загарантирана реконструкција на реалноста.
Избор на модел : CNN-ите имаат тенденција да бидат постабилни; GAN-ите можат да изгледаат поостро, но ризикуваат да измислуваат карактеристики.
Проверки на артефакти : Внимавајте на ореоли, повторувачки текстури, „скоро букви“ и пластични лица.
Стабилност на видео : Користете временски методи или ќе видите треперење и поместување од кадар до кадар.
Употреба со висок ризик : Доколку точноста е важна, откријте ја обработката и третирајте ги резултатите како илустративни.

Веројатно сте го виделе ова: мала, крцкава слика се претвора во нешто доволно јасно за печатење, стримување или пуштање во презентација без да се згрчите. Се чувствува како измама. И - на најдобар начин - некако е 😅
Значи, како функционира зголемувањето на резолуцијата со вештачка интелигенција се сведува на нешто поспецифично од „компјутерот ги подобрува деталите“ (брановидно како рака) и поблиску до „моделот предвидува веродостојна структура со висока резолуција врз основа на шеми што ги научил од многу примери“ ( Длабоко учење за супер-резолуција на слика: Анкета ). Тој чекор на предвидување е целата игра - и затоа зголемувањето на резолуцијата со вештачка интелигенција може да изгледа зачудувачки… или малку пластично… или како вашата мачка да израснала бонус мустаќи.
Статии што можеби ќе ве интересираат по оваа:
🔗 Како функционира вештачката интелигенција
Научете ги основите на моделите, податоците и инференцијата во вештачката интелигенција.
🔗 Како учи вештачката интелигенција
Погледнете како податоците за обука и повратните информации ги подобруваат перформансите на моделот со текот на времето.
🔗 Како вештачката интелигенција открива аномалии
Разберете ги основните линии на шемите и како вештачката интелигенција брзо го забележува необичното однесување.
🔗 Како вештачката интелигенција ги предвидува трендовите
Истражете методи за предвидување што ги детектираат сигналите и ја предвидуваат идната побарувачка.
Како функционира зголемувањето на резолуцијата со вештачка интелигенција: основната идеја, со секојдневни зборови 🧩
Зголемувањето на резолуцијата значи зголемување на резолуцијата: повеќе пиксели, поголема слика. Традиционалното зголемување на резолуцијата (како бикубното) во основа ги растегнува пикселите и ги измазнува транзициите ( бикубна интерполација ). Во ред е, но не може да измисли нови детали - само интерполира.
Зголемувањето на резолуцијата со вештачка интелигенција се обидува со нешто похрабро (т.е. „суперрезолуција“ во светот на истражувањето) ( Длабоко учење за суперрезолуција на слика: Анкета ):
-
Гледа на влезот со ниска резолуција
-
Препознава шари (рабови, текстури, црти на лицето, потези на текст, ткаење на ткаенина…)
-
треба да изгледа верзијата со повисока резолуција
-
Генерира дополнителни пикселни податоци што одговараат на тие шеми
Не „совршено враќање на реалноста“, туку повеќе како „направи многу веродостојна претпоставка“ ( Слика со суперрезолуција користејќи длабоки конволуциони мрежи (SRCNN) ). Ако тоа звучи малку сомнително, не грешите - но тоа е и причината зошто функционира толку добро 😄
И да, ова значи дека зголемувањето на резолуцијата со вештачка интелигенција е во основа контролирана халуцинација… но на продуктивен начин што ги почитува пикселите.
Што ја прави верзијата на подобрување на резолуцијата со вештачка интелигенција добра? ✅🛠️
Ако оценувате зголемување на резолуцијата со вештачка интелигенција (или претходно подесена поставка), еве што е најважно:
-
Враќање на деталите без прегревање.
Доброто зголемување на резолуцијата додава свежина и структура, а не крцкав шум или лажни пори. -
Дисциплина на рабовите.
Чистите линии остануваат чисти. Лошите модели предизвикуваат рабовите да се нишаат или да никнуваат ореоли. -
Реализам на текстурата.
Косата не треба да стане потег со четка. Тулата не треба да стане печат со повторувачки шари. -
Ракување со шум и компресија.
Многу секојдневни слики се обработуваат во JPEG формат до смрт. Добриот уред за зголемување на резолуцијата не ја засилува таа штета ( Real-ESRGAN ). -
Свесност за лицата и текстот
Лицата и текстот се најлесните места за забележување грешки. Добрите модели се однесуваат кон нив нежно (или имаат специјализирани режими). -
Конзистентност низ сите кадри (за видео)
Ако деталите трепкаат од кадар до кадар, вашите очи ќе врескаат. Зголемувањето на резолуцијата на видеото живее или умира според временската стабилност ( BasicVSR (CVPR 2021) ). -
Контроли што имаат смисла.
Потребни ви се лизгачи што се мапираат со реални резултати: отстранување на шум, отстранување на заматеност, отстранување на артефакти, задржување на зрнеста текстура, острење… практичните работи.
Едно тивко правило кое важи: „најдоброто“ зголемување на резолуцијата е често она што едвај го забележувате. Само изгледа како да сте имале подобар фотоапарат уште од самиот почеток 📷✨
Табела за споредба: популарни опции за зголемување на резолуцијата со вештачка интелигенција (и за што се добри) 📊🙂
Подолу е дадена практична споредба. Цените се намерно нејасни бидејќи алатките варираат во зависност од лиценцата, пакетите, трошоците за пресметување и сите тие забавни работи.
| Алатка / Пристап | Најдобро за | Ценовниот амбиент | Зошто функционира (приближно) |
|---|---|---|---|
| Надградби на десктоп во стилот на Топаз ( Topaz Photo , Topaz Video ) | Фотографии, видеа, лесен работен процес | Платено | Силни општи модели + многу подесувања, имаат тенденција „едноставно да функционираат“… претежно |
| Функции од типот „Супер резолуција“ на Adobe ( Adobe Enhance > Супер резолуција ) | Фотографи кои веќе се дел од тој екосистем | Претплата-y | Солидна детална реконструкција, обично конзервативна (помалку драма) |
| Варијанти на Real-ESRGAN / ESRGAN ( Real-ESRGAN , ESRGAN ) | „Направи сам“, програмери, групни работи | Бесплатно (но одзема време) | Одлично за детали на текстурата, може да биде зачинето на лицата ако не сте внимателни |
| Режими на зголемување на резолуцијата базирани на дифузија ( SR3 ) | Креативна работа, стилизирани резултати | Мешано | Може да создаде прекрасни детали - исто така може да измисли глупости, па… да |
| Зголемување на резолуцијата на игрите (во стилот на DLSS/FSR) ( NVIDIA DLSS , AMD FSR 2 ) | Играње и рендерирање во реално време | Во пакет | Користи податоци за движење и научени претходни податоци - победа за непречени перформанси 🕹️ |
| Услуги за зголемување на резолуцијата во облак | Практичност, брзи победи | Плаќање по употреба | Брз + скалабилен, но менувате контрола, а понекогаш и суптилност |
| Зголемување на резолуцијата на вештачката интелигенција фокусирана на видео ( BasicVSR , Topaz Video ) | Стари снимки, аниме, архиви | Платено | Временски трикови за намалување на треперењето + специјализирани видео модели |
| „Паметен“ телефон/галерија за зголемување на резолуцијата | Повремена употреба | Вклучено | Лесни модели подесени за пријатен излез, а не за совршенство (сè уште практични) |
Признание за чудност при форматирање: „Платено“ прави многу работа во таа табела. Но, ја разбирате идејата 😅
Големата тајна: моделите учат мапирање од ниска до висока резолуција 🧠➡️🖼️
Во срцето на повеќето подобрувања со вештачка интелигенција е надгледувана поставеност за учење ( Суперрезолуција на слика со користење на длабоки конволуциони мрежи (SRCNN) ):
-
Започнете со слики со висока резолуција („вистината“)
-
Намалете ги семплирањето на верзии со ниска резолуција („влезот“)
-
Обучете модел за реконструкција на оригиналните слики со висока резолуција од сликите со ниска резолуција
Со текот на времето, моделот учи корелации како што се:
-
„Овој вид замаглување околу окото обично се должи на трепките“
-
„Овој кластер на пиксели често означува сериф текст“
-
„Овој градиент на рабовите изгледа како линија на покривот, а не како случаен шум“
Не е меморирање на специфични слики (во едноставна смисла), туку учење статистичка структура ( Длабоко учење за супер-резолуција на слики: Анкета ). Замислете го како учење на граматиката на текстурите и рабовите. Не граматика на поезија, туку повеќе како… граматика на прирачник од ИКЕА 🪑📦 (несмасна метафора, но сепак доволно блиска).
Завртки и навртки: што се случува за време на инференцијата (кога се зголемувате) ⚙️✨
Кога внесувате слика во уред за зголемување на резолуцијата со вештачка интелигенција, обично има ваков процес:
-
Претпроцесирање
-
Конвертирање на просторот на бои (понекогаш)
-
Нормализирај ги вредностите на пикселите
-
Поделете ја сликата на парчиња ако е голема (VRAM проверка на реалноста 😭) ( Real-ESRGAN репозиториум (опции за плочки) )
-
-
Екстракција на карактеристики
-
Раните слоеви откриваат рабови, агли, градиенти
-
Подлабоките слоеви детектираат обрасци: текстури, форми, компоненти на лицето
-
-
Реконструкција
-
Моделот генерира мапа на карактеристики со повисока резолуција
-
Потоа го претвора тоа во вистински излез на пиксели
-
-
Пост-обработка
-
Опционално острење
-
Опционално намалување на шумот
-
Опционално потиснување на артефакти (ѕвонење, ореоли, блокада)
-
Еден суптилен детаљ: многу алатки ги зголемуваат димензиите на плочките, а потоа ги мешаат споевите. Одличните алатки ги кријат границите на плочките. Мех алатките оставаат бледи траги од мрежата ако жмиркате. И да, ќе жмиркате, бидејќи луѓето обожаваат да ги проверуваат ситните несовршености со зум од 300% како мали гремлини 🧌
Главните семејства на модели што се користат за зголемување на резолуцијата со вештачка интелигенција (и зошто се чувствуваат различно) 🤖📚
1) Суперрезолуција базирана на CNN (класичен работен коњ)
Конволуционите невронски мрежи се одлични за локални шеми: рабови, текстури, мали структури ( Суперрезолуција на слика со користење на длабоки конволуциони мрежи (SRCNN) ).
-
Предности: брз, стабилен, помалку изненадувања
-
Недостатоци: може да изгледа малку „обработено“ ако се наметне напорно
2) Зголемување на резолуцијата базирано на GAN (ESRGAN стил) 🎭
GAN (Генеративни адверсаријални мрежи) тренираат генератор да произведува слики со висока резолуција што дискриминаторот не може да ги разликува од реалните ( Генеративни адверсаријални мрежи ).
-
Предности: впечатливи детали, импресивна текстура
-
Недостатоци: може да измисли детали што ги немало - понекогаш погрешни, понекогаш необични ( SRGAN , ESRGAN )
GAN може да ви даде таа острина што ќе ве воодушеви. Исто така, може да му даде на вашиот портрет дополнителен изглед на веѓите. Затоа… изберете ги вашите битки 😬
3) Зголемување на резолуцијата базирано на дифузија (креативна џокер-карта) 🌫️➡️🖼️
Дифузиските модели го отстрануваат шумот чекор по чекор и можат да бидат водени за да произведат детали со висока резолуција ( SR3 ).
-
Предности: може да биде неверојатно добар во веродостојните детали, особено за креативна работа
-
Недостатоци: може да се оддалечи од оригиналниот идентитет/структура ако поставките се агресивни ( SR3 )
Тука „надградбата“ почнува да се претопува во „преосмислување“. Понекогаш тоа е токму она што го сакате. Понекогаш не е.
4) Зголемување на резолуцијата на видеото со временска конзистентност 🎞️
Зголемувањето на резолуцијата на видеото често додава логика свесна за движење:
-
Користи соседни рамки за стабилизирање на деталите ( BasicVSR (CVPR 2021) )
-
Се обидува да избегне треперење и ползење на артефакти
-
Често комбинира супер-резолуција со дешум и деинтерлејсинг ( Topaz Video )
Ако зголемувањето на резолуцијата на сликата е како реставрирање на една слика, зголемувањето на резолуцијата на видеото е како реставрирање на флипбук без носот на ликот да ја менува формата на секоја страница. Што е… потешко отколку што звучи.
Зошто зголемувањето на резолуцијата со вештачка интелигенција понекогаш изгледа лажно (и како да го препознаете) 👀🚩
Зголемувањето на резолуцијата со вештачка интелигенција не успева на препознатливи начини. Откако ќе ги научите шемите, ќе ги видите насекаде, како купување нов автомобил и одеднаш забележување на тој модел на секоја улица 😵💫
Вообичаени кажувања:
-
Депилација на кожата на лицата (премногу отстранување на шум + измазнување)
-
Презаострени ореоли околу рабовите (класична територија на „пречекорување“) ( бикубична интерполација )
-
Повторени текстури (ѕидовите од тули стануваат шеми од копирање и лепење)
-
Крцкав микроконтраст што вреска „алгоритам“
-
Уништување на текст каде што буквите стануваат речиси букви (најлошиот вид)
-
Отстапување на детали каде што малите карактеристики суптилно се менуваат, особено во работните процеси со дифузија ( SR3 )
Замрштениот дел: понекогаш овие артефакти изгледаат „подобро“ на прв поглед. Вашиот мозок сака острина. Но, по еден момент, се чувствува… нејасно.
Добра тактика е да се одзумира и да се провери дали изгледа природно на нормално растојание на гледање. Ако изгледа добро само со 400% зум, тоа не е победа, тоа е хоби 😅
Како функционира зголемувањето на резолуцијата со вештачка интелигенција: од аспект на обука, без математичка главоболка 📉🙂
Обуката на модели со суперрезолуција обично вклучува:
-
Спарени бази на податоци (влез со ниска резолуција, цел со висока резолуција) ( Слика со суперрезолуција со користење на длабоки конволуциони мрежи (SRCNN) )
-
Функции на губење што ги казнуваат погрешните реконструкции ( SRGAN )
Типични видови на загуби:
-
Губење на пиксели (L1/L2)
Ја поттикнува точноста. Може да произведе малку меки резултати. -
Перцептивна загуба
Споредува подлабоки карактеристики (како „дали ова изгледа слично“) наместо точни пиксели ( Перцептивни загуби (Johnson et al., 2016) ). -
Адверсариска загуба (GAN)
Поттикнува реализам, понекогаш по цена на буквалната точност ( SRGAN , Генеративни Адверсариски Мрежи ).
Има постојано влечење јаже:
-
Направете го верен на оригиналот
vs. -
Направете го визуелно пријатно
Различни алатки се наоѓаат на различни места во тој спектар. И можеби ќе претпочитате една во зависност од тоа дали реставрирате семејни фотографии или подготвувате постер каде што „убавиот изглед“ е поважен од форензичката точност.
Практични работни процеси: фотографии, стари скенирања, аниме и видео 📸🧾🎥
Фотографии (портрети, пејзажи, фотографии од производи)
Најдобрата практика е обично:
-
Прво благо отстранување на бучавата (доколку е потребно)
-
Зголемено со конзервативни поставки
-
Додадете зрно назад ако работите се чувствуваат премногу мазни (да, навистина)
Житото е како сол. Премногу ја уништува вечерата, но ништо не може да има малку рамномерен вкус 🍟
Стари скенирања и силно компресирани слики
Овие се потешки бидејќи моделот може да ги третира блоковите за компресија како „текстура“.
Обидете се:
-
Отстранување или деблокирање на артефакти
-
Потоа проширете го вашиот дизајн
-
Потоа острење на светлината (не премногу… Знам, сите го велат тоа, но сепак)
Аниме и линиска уметност
Линискиот цртеж има придобивки од:
-
Модели што зачувуваат чисти рабови
-
Намалена халуцинација со текстура
. Зголемувањето на резолуцијата на анимето често изгледа одлично бидејќи формите се поедноставни и конзистентни. (Среќа.)
Видео
Видеото додава дополнителни чекори:
-
Отстранување на бучава
-
Деинтерлејс (за одредени извори)
-
Луксузен
-
Временско измазнување или стабилизација ( BasicVSR (CVPR 2021) )
-
Опционално повторно воведување на зрна за кохезија
Ако ја прескокнете временската конзистентност, ќе го добиете тој треперлив детаљ. Откако ќе го забележите, не можете да го избришете од вид. Како чкрипечка столица во тивка соба 😖
Избирање поставки без премногу нагаѓање (мала мамец) 🎛️😵💫
Еве еден добар почетен начин на размислување:
-
Ако лицата изгледаат пластично,
намалете го шумот, намалете го острината, обидете се со модел или режим за зачувување на лицето. -
Ако текстурите изгледаат премногу интензивно,
намалете ги лизгачите за „подобрување на деталите“ или „обновување на деталите“, додадете суптилна зрнеста текстура после тоа. -
Ако рабовите светат,
намалете го острилото, проверете ги опциите за потиснување на ореолот. -
Ако сликата изгледа премногу „со вештачка интелигенција“,
одете поконзервативно. Понекогаш најдобриот потег е едноставно… помалку.
Исто така: не зголемувајте резолуција 8x само затоа што можете. Чисто 2x или 4x е често идеално. Освен тоа, го замолувате моделот да напише фанфикција за вашите пиксели 📖😂
Етика, автентичност и непријатното прашање за „вистина“ 🧭😬
Зголемувањето на резолуцијата со вештачка интелигенција ја замаглува границата:
-
Реставрацијата подразбира враќање на она што било таму
-
Подобрувањето подразбира додавање на она што не било
Со лични фотографии, обично е во ред (и убаво). Со новинарството, правните докази, медицинското снимање или сè што е важно… треба да бидете внимателни ( OSAC/NIST: Стандарден водич за управување со дигитални форензички слики , SWGDE упатства за анализа на форензички слики ).
Едноставно правило:
-
Ако влоговите се високи, третирајте го зголемувањето на резолуцијата со вештачка интелигенција како илустративно , а не како дефинитивно.
Исто така, откривањето е важно во професионални контексти. Не затоа што вештачката интелигенција е зло, туку затоа што публиката заслужува да знае дали деталите биле реконструирани или снимени. Тоа е едноставно… почитувачко.
Заклучоци и краток преглед 🧡✅
Значи, како функционира зголемувањето на резолуцијата со вештачка интелигенција (AI Upscaling) е следново: моделите учат како деталите со висока резолуција имаат тенденција да се поврзат со шемите со ниска резолуција, а потоа предвидуваат веродостојни дополнителни пиксели за време на зголемувањето на резолуцијата ( Длабоко учење за супер-резолуција на слика: Анкета ). Во зависност од семејството модели (CNN, GAN, дифузија, видео-темпорално), тоа предвидување може да биде конзервативно и верно… или смело и понекогаш несигурно 😅
Краток преглед
-
Традиционалното зголемување на резолуцијата ги растегнува пикселите ( бикубна интерполација )
-
Зголемувањето на резолуцијата со вештачка интелигенција ги предвидува недостасувачките детали користејќи научени шеми ( Суперрезолуција на слика со користење на длабоки конволуциони мрежи (SRCNN) )
-
Одлични резултати доаѓаат од вистинскиот модел + ограничување на движењето
-
Внимавајте на ореоли, восочни површини, повторувачки текстури и треперење во видеото ( BasicVSR (CVPR 2021) )
-
Зголемувањето на резолуцијата често е „веродостојна реконструкција“, а не совршена вистина ( SRGAN , ESRGAN )
Ако сакаш, кажи ми што подобруваш (лица, стари фотографии, видеа, аниме, скенирање текст) и ќе ти предложам стратегија за поставки што има тенденција да ги избегне вообичаените стапици на „изгледот со вештачка интелигенција“ 🎯🙂
Најчесто поставувани прашања
Зголемување на резолуцијата со вештачка интелигенција и како функционира
Зголемувањето на резолуцијата со вештачка интелигенција (честопати наречено „суперрезолуција“) ја зголемува резолуцијата на сликата со предвидување на недостасувачките детали со висока резолуција од шемите научени за време на обуката. Наместо едноставно истегнување на пикселите како бикубна интерполација, моделот ги проучува рабовите, текстурите, површините и потезите слични на текст, а потоа генерира нови податоци за пиксели кои се во согласност со тие научени шеми. Помалку се „враќа реалноста“, а повеќе се „прави убедлива претпоставка“ што се чита како природна.
Зголемување на резолуцијата со вештачка интелигенција наспроти бикубно или традиционално менување на големината
Традиционалните методи на зголемување на резолуцијата (како бикубното) главно интерполираат помеѓу постоечките пиксели, измазнувајќи ги транзициите без да создаваат вистински нови детали. Зголемувањето на резолуцијата со вештачка интелигенција има за цел да реконструира веродостојна структура со препознавање на визуелни знаци и предвидување како изгледаат верзиите со висока резолуција од тие знаци. Затоа резултатите од вештачката интелигенција можат да бидат драматично поостри, а исто така и зошто можат да воведат артефакти или да „измислат“ детали што не биле присутни во изворот.
Зошто лицата можат да изгледаат восочно или премногу мазно
Восочните површини обично се добиваат од агресивно отстранување на шумот и измазнување, спарено со острење кое ја отстранува природната текстура на кожата. Многу алатки го третираат шумот и фината текстура на сличен начин, па „чистењето“ на сликата може да ги избрише порите и суптилните детали. Вообичаен пристап е да се намали отстранувањето на шумот и острењето, да се користи режим за зачувување на лицето доколку е достапен, а потоа повторно да се воведе допир на зрнеста текстура за резултатот да изгледа помалку пластичен и повеќе фотографски.
Чести артефакти за зголемување на резолуцијата со вештачка интелигенција на кои треба да се обрне внимание
Типичните знаци вклучуваат ореоли околу рабовите, повторувачки шеми на текстура (како цигли копирани и залепени), крцкав микроконтраст и текст што се претвора во „скоро букви“. Во работните процеси базирани на дифузија, можете да видите и поместување на деталите таму каде што малите карактеристики суптилно се менуваат. За видео, треперењето и ползењето на деталите низ кадрите се големи црвени знамиња. Ако изгледа добро само при екстремно зумирање, поставките веројатно се премногу агресивни.
Како GAN, CNN и дифузионите зголемувачи на скалери имаат тенденција да се разликуваат во резултатите
Суперрезолуцијата базирана на CNN има тенденција да биде постабилна и попредвидлива, но може да изгледа „обработено“ ако се притисне силно. Опциите базирани на GAN (во стилот на ESRGAN) често создаваат поизразена текстура и перципирана острина, но можат да халуцинираат неточни детали, особено на лицата. Зголемувањето на резолуцијата базирана на дифузија може да генерира прекрасни, веродостојни детали, но сепак може да отстапи од оригиналната структура ако поставките за водење или јачина се премногу силни.
Практична стратегија за поставување за избегнување на изглед со „премногу вештачка интелигенција“
Започнете конзервативно: зголемете ја резолуцијата 2× или 4× пред да посегнете по екстремни фактори. Ако лицата изгледаат пластично, намалете го намалувањето на шумот и острината и пробајте режим за свесност за лицето. Ако текстурите станат премногу интензивни, намалете го подобрувањето на деталите и размислете за додавање суптилна зрнеста текстура подоцна. Ако рабовите светат, намалете го острината и проверете ја супресијата на ореолот или артефактите. Во многу канали, „помалку“ победува бидејќи зачувува убедлив реализам.
Ракување со стари скенирања или силно компресирани JPEG слики пред зголемување на резолуцијата
Компресираните слики се сложени бидејќи моделите можат да ги третираат блоковите артефакти како вистинска текстура и да ги засилат. Вообичаен работен процес е прво отстранување или деблокирање на артефакти, потоа зголемување на резолуцијата, а потоа и острење со светлина само доколку е потребно. За скенирањата, нежното чистење може да му помогне на моделот да се фокусира на вистинската структура, а не на оштетувањето. Целта е да се намалат „лажните знаци за текстура“, така што лицето кое го зголемува нивото на резолуција не е принудено да прави сигурни претпоставки од бучни влезни податоци.
Зошто зголемувањето на резолуцијата на видео е потешко од зголемувањето на резолуцијата на фотографии
Зголемувањето на резолуцијата на видеото мора да биде конзистентно низ сите кадри, а не само добро на една фотографија. Ако деталите трепкаат од кадар до кадар, резултатот брзо станува одвлекувачки. Пристапите фокусирани на видео користат временски информации од соседните кадри за да ја стабилизираат реконструкцијата и да избегнат треперечки артефакти. Многу работни процеси вклучуваат и отстранување на шумот, деинтерлејсирање за одредени извори и опционално повторно воведување на зрната, така што целата секвенца се чувствува кохезивно, а не вештачки остра.
Кога зголемувањето на резолуцијата со вештачка интелигенција не е соодветно или е ризично да се потпрете на неа
Зголемувањето на резолуцијата со вештачка интелигенција најдобро се третира како подобрување, а не како доказ. Во контексти со висок ризик како што се новинарството, правните докази, медицинското снимање или форензичката работа, генерирањето „веродостојни“ пиксели може да доведе во заблуда бидејќи може да додаде детали што не биле снимени. Побезбедно врамување е да се користи илустративно и да се открие дека процесот на вештачка интелигенција реконструирал детали. Ако верноста е критична, зачувајте ги оригиналите и документирајте го секој чекор на обработка и поставка.
Референци
-
arXiv - Длабоко учење за суперрезолуција на слики: Анкета - arxiv.org
-
arXiv - Суперрезолуција на слика со користење на длабоки конволуциони мрежи (SRCNN) - arxiv.org
-
arXiv - Вистински ESRGAN - arxiv.org
-
arXiv - ESRGAN - arxiv.org
-
arXiv - SR3 - arxiv.org
-
NVIDIA развивач - NVIDIA DLSS - developer.nvidia.com
-
AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com
-
Фондацијата за компјутерски вид (CVF) Отворен пристап - BasicVSR: Потрагата по основни компоненти во видео со супер резолуција (CVPR 2021) - openaccess.thecvf.com
-
arXiv - Генеративни противнички мрежи - arxiv.org
-
arXiv - SRGAN - arxiv.org
-
arXiv - Перцептивни загуби (Џонсон и др., 2016) - arxiv.org
-
GitHub - Репозиториум Real-ESRGAN (опции за плочки) - github.com
-
Википедија - Бикубична интерполација - wikipedia.org
-
Топаз Лабс - Фото од Топаз - topazlabs.com
-
Топаз Лабс - Топаз Видео - topazlabs.com
-
Центар за помош на Adobe - Adobe Enhance > Супер резолуција - helpx.adobe.com
-
NIST / OSAC - Стандарден водич за управување со дигитални форензички слики (верзија 1.0) - nist.gov
-
SWGDE - Упатства за форензичка анализа на слики - swgde.org