Home / Tecnología / ¿Una IA soñadora puede corregir fotos digitales de baja resolución en la edición?

¿Una IA soñadora puede corregir fotos digitales de baja resolución en la edición?

¿Puede una inteligencia artificial onírica convertir fotos de baja resolución en imágenes nítidamente detalladas y de alta resolución?

Let & # 39; s Enhance es una startup con sede en Estonia que usa una llamada red neuronal "alucinada" de la IA para impulsar un servicio de mejora de fotografías freemium. En su sitio web, afirma que el software de aprendizaje "alucina los detalles que faltan para crear la imagen natural".

Lanzó la herramienta en línea a fines de octubre, recopilando cierta cobertura de prensa inicial.

Lo probé en ese momento, pero los resultados me parecieron confusos y fue difícil juzgar qué tan útil sería sin un caso de uso adecuado para probarlo.

Así que esperé mi tiempo y este mes me encontré con el tipo de desafío fotográfico digital que pensé que el servicio podría poder ayudar, en esas fotos que quería darles porque las copias enmarcadas no tienen una gran resolución para producir una impresión de tamaño decente.

¿Problemas de fotografía de baja resolución? ¡AI al rescate!

Una de las fotos fue solo una instantánea divertida para teléfonos inteligentes. Pero otros eran un poco más altos, provenientes de un matrimonio.

Y después de intentar (sin éxito) proporcionar sus versiones completas de res: las fotos de los participantes se compartieron colectivamente después del hecho a través de iCloud; y nadie podría recordar quién tomó las tomas específicas que estaba buscando (o en qué dispositivo) – Decidí ejecutarlas y el retrato más informal a través de "Mejoremos" para ver si podía aumentar la resolución y tener la oportunidad de fotografiarlas en impresiones de regalos.

El servicio es freemium y le permite limitar el número de fotos que puede ver por día. También se congela a 10 fotos gratis en total antes de ser empujado hacia uno de sus planes de suscripción. Pero como solo tenía unas pocas tomas de alto nivel, logré ejecutar todo a través de la puerta freemium sin tener que suscribirme a una suscripción ni comprar un paquete de costos (que también ofrecen).

Cada foto que carga a la IA de Let's # Enhance le es devuelta después de unos segundos (o quizás hasta uno o dos minutos) de tiempo de procesamiento en tres versiones, lo que refleja los diferentes pasos aplicados para intentar para AI-realzarlo. Por lo tanto, para las fotos obtienes tres archivos, a los que se les asignan las siguientes etiquetas: Anti-jpeg, aburrido y mágico.

Versión & # 39; anti-jpeg & # 39; de la imagen no aumenta el tamaño real, solo parece pulir ligeramente algunos artefactos de compresión. Aunque encontré sus resultados bastante sutiles, al menos en los tiros probé y comparé las imágenes anti-jpeg originales en una pantalla.

Las técnicas "aburridas" y "mágicas" siempre mejoran la imagen de 4x, así que pude transformar, por ejemplo, un archivo de fotografía digital de 520 KB con una resolución de 898 × ​​1600 en 21, 8 MB con 3492 × 6400 píxeles completos. Entonces, al menos en teoría, la versión escalada se podía imprimir en carteles

. Los resultados de las técnicas mágicas y aburridas aplicadas a esta imagen de retrato en particular parecían visualmente impresionantes en la pantalla. Aunque el retrato se ha tomado a cierta distancia y su fondo incómodo de la escalera es probablemente un lienzo bastante permisivo para ocultar las imperfecciones del aumento de escala.

Para mí, había una gran diferencia entre las dos técnicas de procesamiento aplicadas a esta imagen: la versión mágica producía un resultado ligeramente más confuso. Pero, de nuevo, para esta toma en particular, ambos archivos probablemente habrían producido una bella impresión enmarcada.

Las fotos de la boda definitivamente fueron mucho más desafiantes. Parece que dos de las tomas originales se tomaron con una cámara de teléfono inteligente de calidad bastante estándar, por lo que aunque son bellas en una pantalla, su baja resolución de solo 1024 × 577 significa que el tamaño máximo que podría razonablemente esperar para imprimirlas sería un poco & # 39; ~ 4 pulgadas.

Después de recortar una de estas tomas para eliminar un visor secundario y la ampliación a través de la imagen Vamos, la imagen vuelve con una resolución de 3408 × 2304. Por lo tanto, al menos lo suficientemente grande como para producir una impresión de tamaño adecuado.

Otro desafío con la segunda imagen fue que se había tomado a distancia, en orientación vertical, y quería un primer plano de las caras, lo que significaba más recorte en un formato horizontal más pequeño y un intento de concentración en aquellos que habían sido detalles suficientemente remotos para empezar.

Después del escalado y el recorte obtuve una imagen con una resolución de 2182 × 1684. Nuevamente, en teoría, una letra pequeña podría funcionar a esa resolución.

Sin embargo, el aumento de la IA había producido un efecto que era definitivamente mucho más vaselina que una definición sutil, sin duda debido a la toma original que no era de gran calidad para empezar.

Mejoramos al CEO Oleksandr Savsunenko me advirtió que: "Si la imagen está demasiado ampliada o pixelada, el sistema la considerará como un modelo natural y no la cambiará".

Así que realmente no estaba esperando milagros. Pero incluso la foto un poco más grande de las dos fotos no parece exactamente clara en términos de detalles después de su viaje con inteligencia artificial.

De los dos niveles de procesamiento, la perforación parece haber funcionado mejor, con la magia resultante de muchos fuzz / artefactos en ambas tomas. Incluyendo dar el borde de lo que deberían ser algunas franjas de cuero en un estilo tejido.

Esa iba a ser la IA del spot-spotter en el trabajo …

Una tercera imagen de la boda era la foto completa res, por lo que no tenía los mismos problemas de calidad. Pero de nuevo, solo estaba buscando un detalle recortado, así que utilicé Let's Enhance para mejorar el cultivo y mejorar su resolución. Esto significa que pasé de un razonable 2032 × 2355 a un generoso 8128 × 9416.

Además de ser una imagen de mejor calidad para empezar, no era un retrato tan cercano que el aumento parecía funcionar mejor aquí, especialmente a través de un paisaje / paisaje de fondo con el par que se muestra solo en el perfil. Aunque, incluso aquí, los detalles sobre la versión mágica se han vuelto un poco más esquivos que los demás.

Ahora, armado con mis archivos mejorados, y al menos con la posibilidad de algunas impresiones pasables, cargué las imágenes en una memoria USB y fui a la tienda de fotos.

Entonces, ¿cómo fueron las impresiones?

Como era de esperar, el recorte mejorado de la foto de boda original de alta resolución salió bien – en todas las versiones impresas.

La impresión de 20 x 15 cm se veía fantástica y tenía detalles vívidos y vívidos. Un no profesional no imaginaría que era solo una sección de un plano más grande. Incluso si esto se debió a la escalada sofisticada de la IA o mucho más que una resolución razonable para comenzar con una impresión de ese tamaño es menos clara.

Cuando se trataba de dos fotos originales de AI de calidad inferior, la calidad de las impresiones de ~ 6 x 4 pulgadas que recibí no fue excepcional, lo que refleja la persistencia extenuante de las versiones digitales. Algunos de los tonos de piel más oscuros tenían un tono extrañamente gris.

El menos exigente de los dos disparos sería casi pasable en un álbum de fotos. Pero tampoco fue la calidad del regalo. El retrato con detalles ligeramente más claros para comenzar con la impresión que parece casi irritante apenas borrosa. Al menos para un ojo humano.

Claramente, una inteligencia artificial alucinante no puede reemplazar un original con resolución completa.

Dicho esto, si solo tiene un complemento móvil de calidad media para empezar, debe trabajar con lo que tenemos. Y probablemente habría podido producir las mejores impresiones de calidad que podía esperar, dada la baja calidad del material original.

El chasquido aleatorio del teléfono inteligente fue mucho mejor. Una impresión de aproximadamente 8 x 6 pulgadas estaba perfectamente enmarcada y tenía detalles de fondo particularmente impresionantes.

El tamaño máximo recomendado para la tipografía para imprimir carteles en la imagen de acuerdo con el tamaño del archivo era de un metro (!). Lo que claramente lo hubiera empujado. Opté por una impresión tipo póster de ese tamaño, y la impresión resultante ciertamente no tenía detalles tan nítidos como la impresión fotográfica.

Ahora se podían ver claramente los artefactos visibles en gráficos de fondo y graffiti, así que definitivamente estaba asumiendo los límites de lo que se puede hacer con una imagen ampliada de AI en este punto …

Aún así, dado el tema desvencijado, el póster todavía está fuera con un aspecto bastante interesante. Entonces, para este caso de uso, estaba feliz.

Una red neuronal alucinante

Así es como Savsunenko explica la tecnología detrás del servicio de Mejora de Let: "El núcleo de nuestra inteligencia alucinante es una red neuronal Profundo con una arquitectura personalizada basada libremente en el moderno enfoque GAN (GAN – Generative Adversarial Network). Se descubrió hace unos años y tiene una amplia variedad de aplicaciones además de generar viajes ácidos.

"L & # 39. La idea básica de GAN es formar dos redes al mismo tiempo: una red realiza una ampliación, una critica, aprende a distinguir las imágenes reales de las de mayor tamaño. Durante el entrenamiento, la red de mejora intenta producir la imagen para engañar a la crítica y mejorar de acuerdo con sus comentarios. Esto enseña la red de mejora para producir imágenes desde un punto de vista realista. También utilizamos diferentes filtros de procesamiento previo y posterior basados ​​en el tipo y la calidad de la imagen. "

Según Savsunenko, la herramienta funciona mejor con fotos digitales de escalado e ilustraciones creadas digitalmente.

" Nos han contactado varios usuarios que comparten los resultados y nos sorprendió encontrar casos de uso muy extensos. "dijo, diciendo, por ejemplo, que los científicos y los médicos están usando la herramienta para mejorar las fotografías de rayos X y el microscopio para" ver mejor los detalles ".

Agregó que otros usaron el servicio para" salvar "el su colección de fotos digitales cuando perdieron su alta resolución original.

Otro caso de uso que mencionó es que los propietarios de e-commerce aumentan la calidad de las imágenes de los productos, especialmente cuando son "re revendedores y, por lo tanto, no pueden tomar mejores fotos de los productos mismos.

También dijo que es útil para los fotógrafos que quieren recortar partes de imágenes y aún así poder imprimirlas, un caso de uso que también he probado. Aunque he descubierto que realmente solo funciona si has tenido una imagen de buena calidad para empezar.

En pocas palabras: si su original es un poco borroso, la IA no hará milagros y lo limpiará.

dejó en claro que la red neuronal anti-jpeg está diseñada específicamente para la eliminación de artefactos JPEG. "Incluso el iPhone hace compresión JPEG: si amplía una parte de la foto de su iPhone, este combo funciona mejor", señaló al respecto.

Mejora: veredicto …

En general, fuera de la pantalla: no estaba demasiado entusiasmado con los resultados.

Let & # 39; s Enhance puede ser una herramienta útil cuando tiene instantáneas de smartphone que quiere cambiar el tamaño para uso digital. Pero no es literalmente para mejorar los detalles de las tomas originales, si están un poco borrosas o borrosas para empezar (con quizás la excepción de los artefactos Jpeg, aunque no puedo decir mis pruebas [19659005] "Let's Embiggen" podría ser un nombre más preciso para el servicio.

Dicho esto, las fotos con composiciones más permisivas pueden mejorarse con más éxito y crearse para algunas impresiones razonables en mi experiencia. Los paisajes y los retratos son probablemente una apuesta más segura. Con respecto a las bodas y otras ocasiones importantes, AI definitivamente no cuestionará a los fotógrafos profesionales todavía.

No estoy seguro de que Let's Enhance sea un servicio que considero lo suficientemente útil como para inscribirse simplemente para aumentar el tamaño del pop o dos, pero también ofrecen paquetes como 20 imágenes por $ 4.99.

El servicio parece más útil si necesita una herramienta para Imágenes digitales de gran tamaño y baja resolución, por ejemplo para fines de comercio electrónico bastante liviano. (Y de hecho, es aquí que dice Oleksandr de donde surgió la idea original: después de su padre pidió ayuda con el diseño y el contenido visual para su tienda en Internet y solo tenía imágenes para baja resolución de barrido) [19659004] De lo contrario, diría que es mejor invertir en una cámara decente y / o un fotógrafo profesional. Resulta que incluso una IA profunda no puede corregir una foto borrosa en la edición.

Sobre Willian Delgado

Check Also

Todos los equipos domésticos se han vuelto inteligentes: TechCrunch

Makula Dunbar Colaborador Otros mensajes de este colaborador Auriculares y auriculares inalámbricos para ajustarse a …

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

A %d blogueros les gusta esto: