Home / Tecnología / Krisp reduce el ruido en las llamadas con aprendizaje automático y pronto llegará a Windows – Tec …

Krisp reduce el ruido en las llamadas con aprendizaje automático y pronto llegará a Windows – Tec …

Si su suerte es algo similar a la mía, tan pronto como salta en una llamada importante, alguien decide que es un buen momento para volar algunas hojas de la acera fuera de su ventana. Krisp de 2Hz es una nueva aplicación de escritorio que utiliza el aprendizaje automático para restar ese ruido de fondo, o multitudes o incluso bebés que lloran, manteniendo su voz intacta. Ya está disponible para Mac y pronto llegará a Windows.

Conocí a los creadores de Krisp, incluido el cofundador de 2Hz Davit Baghdasaryan, al inicio del acelerador de Skydeck de este año en UC Berkeley, donde demostraron la tecnología de su prototipo. [19659002] La tecnología involucrada es compleja, pero la idea es simple: si creas un sistema de aprendizaje automático que entienda cómo suena la voz humana, en promedio, entonces puede escuchar una señal de audio y seleccionar solo esa parte, Cortando una gran cantidad de ruido de fondo.

Baghdasaryan, originalmente de Twilio, originalmente quería crear algo que funcionara en redes móviles, por lo que T-Mobile o cualquiera que esté dispuesto a borrar el ruido integrado. Este enfoque de la plataforma resultó ser demasiado lento, sin embargo, decidieron ir directamente a los consumidores.

"La tracción con los clientes fue lenta y esto fue un problema para una empresa joven", dijo Baghdasaryan en un correo electrónico posterior. Sin embargo, a la gente le encantó la idea de "silenciar el ruido", por lo que decidimos cambiar toda nuestra atención y crear un producto para el usuario. "

Este fue el período en el que hablé con ellos en persona, incidentalmente, y solo seis meses después salieron en Mac.

Es simple: ejecute la aplicación y edite tanto las señales de audio salientes como las entrantes, con la señal ruidosa normal en una dirección y una voz limpia, una concentrada que sale por la otra. Todo sucede en el dispositivo y con una latencia muy corta (aproximadamente 15 milisegundos), por lo que no hay ninguna nube involucrada y nunca se envía nada a ningún servidor, ni siquiera se almacena localmente. El equipo está trabajando para que el software se adapte y aprenda sobre la marcha, pero aún no está implementado. 19659002] Otra ventaja de este enfoque es que no necesita ningún ajuste especial para trabajar con, por ejemplo, Skype en lugar de Webex. Debido a que funciona al nivel de sonido del sistema operativo, cualquiera sea la aplicación que use, escuche Señal modificada por Krisp como si fuera p Ulit desde el micrófono.

Se lanzaron en Mac porque sentían que era más probable que el tipo de adoptante temprano estuviera en la plataforma de Apple, y la apuesta parece haber dado sus frutos. Pero viene una versión de Windows: la fecha exacta no está establecida, pero esperemos que sea tanto a finales de mes como a principios de enero. (Te avisaremos cuando esté en vivo).

Debería ser más o menos idéntico a la versión para Mac, pero habrá un enfoque especial en los juegos. Los jugadores, enfatizó Baghdasaryan, son mucho más propensos a tener GPU para ejecutar Krisp, y también tienen una necesidad real de comunicaciones claras (como un jugador de PUBG puedo hablar con la molestia de un micrófono abierto y teclas clásicas). Por lo tanto, es probable que existan algunas funciones de usuario avanzado específicas del jugador, pero aún no está tallada en piedra.

Puede que se esté preguntando, como yo lo hice, por qué no estaban buscando fabricantes de chips, tal vez para incluir a Krisp como una tecnología integrada en un procesador de audio del teléfono o la computadora.

En persona, sugirieron que esto también era demasiado lento y restrictivo. Mientras tanto, vieron que no había una competencia real en el espacio de software, que es mucho más fácil de ingresar.

"Todas las soluciones de cancelación de ruido actuales requieren múltiples micrófonos y un factor de forma especial en el que la boca debe estar cerca de uno de los micrófonos." No tenemos este requisito ", explicó Baghdasaryan. "Podemos hacerlo con un solo micrófono u operar en un flujo de audio que proviene de la red, lo que hace posible ejecutar el software en cualquier entorno deseado (borde o red) y en cualquier dirección (entrante o saliente)".

sientes curiosidad por el aspecto técnico de las cosas, como se hizo con un micrófono, o con baja latencia, y así sucesivamente, hay una buena explicación que Baghdasaryan escribió para el blog de Nvidia en este momento.

Además, una proliferación de chips centrados en la IA en los que se puede realizar fácilmente Krisp significa un fácil acceso al teléfono celular y al espacio integrado. "Ya hemos llevado con éxito nuestro DNN a las GPU NVIDIA, Intel CPU / GNA y ARM, Qualcomm está en camino", dijo Baghdasaryan.

Para continuar con este trabajo, la compañía ha recaudado $ 2 millones hasta el momento: $ 500K de Skydeck, así como amigos y familiares para un giro previo a la siembra, luego una ronda de $ 1.5M impulsada por Sierra Ventures y Shanda Group.

Espere que Windows salga más adelante este invierno, y si ya es un usuario, espere que algunas características nuevas aparezcan en la misma escala de tiempo. Puedes descargar Krisp gratis aquí.

Sobre Willian Delgado

Check Also

Ray Dalio viene a interrumpir SF

Cuando se trata de los dioses de las finanzas, pocas personas alcanzan la estratosfera de …

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

A %d blogueros les gusta esto: