{"id":151500,"date":"2024-06-18T20:26:48","date_gmt":"2024-06-18T20:26:48","guid":{"rendered":"https:\/\/es.digitaltrends.com\/?p=1030592"},"modified":"2024-06-18T20:26:48","modified_gmt":"2024-06-18T20:26:48","slug":"con-ia-se-puede-google-observa-pixeles-para-crear-bandas-sonoras","status":"publish","type":"post","link":"http:\/\/cordobadirecto.com\/index.php\/2024\/06\/18\/con-ia-se-puede-google-observa-pixeles-para-crear-bandas-sonoras\/","title":{"rendered":"Con IA se puede: Google observa p\u00edxeles para crear bandas sonoras"},"content":{"rendered":"<figure id=\"attachment_3625476\" class=\"wp-caption alignnone\" aria-describedby=\"caption-attachment-3625476\"><img onerror=\"dti_load_error(this)\" decoding=\"async\" class=\" size-large wp-image-3625476 h-lightbox is-zoomable dt-lazy-no h-lightbox is-zoomable\" src=\"http:\/\/cordobadirecto.com\/wp-content\/uploads\/2024\/06\/con-ia-se-puede-google-observa-pixeles-para-crear-bandas-sonoras.jpg\" sizes=\"(max-width: 625px) 414px\" srcset=\"http:\/\/cordobadirecto.com\/wp-content\/uploads\/2024\/06\/con-ia-se-puede-google-observa-pixeles-para-crear-bandas-sonoras-1.jpg 414w, http:\/\/cordobadirecto.com\/wp-content\/uploads\/2024\/06\/con-ia-se-puede-google-observa-pixeles-para-crear-bandas-sonoras.jpg\" alt=\"Un lobo generado por IA aullando\" data-dt-lazy-src><figcaption id=\"caption-attachment-3625476\" class=\"wp-caption-text\"><span class=\"credit\">Deep Mind de Google<\/span><\/figcaption><\/figure>\n<p><a href=\"https:\/\/es.digitaltrends.com\/computadoras\/google-gemini\/\"><strong>Deep Mind<\/strong><\/a> mostr\u00f3 el martes los \u00faltimos resultados de su investigaci\u00f3n generativa de video a audio de IA. Es un sistema novedoso que combina lo que ve en pantalla con la indicaci\u00f3n escrita del usuario para crear paisajes sonoros de audio sincronizados para un videoclip determinado.<\/p>\n<p>La IA V2A se puede emparejar con modelos de generaci\u00f3n de video como Veo,&nbsp;<a href=\"https:\/\/deepmind.google\/discover\/blog\/generating-audio-for-video\/\" target=\"_blank\" rel=\"noopener\">escribi\u00f3 el equipo de audio generativo de Deep Mind<\/a>&nbsp;en una publicaci\u00f3n de blog, y puede crear bandas sonoras, efectos de sonido e incluso di\u00e1logos para la acci\u00f3n en pantalla. Adem\u00e1s, Deep Mind afirma que su nuevo sistema puede generar \u00abun n\u00famero ilimitado de bandas sonoras para cualquier entrada de video\u00bb ajustando el modelo con indicaciones positivas y negativas que fomentan o desalientan el uso de un sonido en particular, respectivamente.<\/p>\n<p>El sistema funciona primero codificando y comprimiendo la entrada de v\u00eddeo, que el modelo de difusi\u00f3n aprovecha para refinar de forma iterativa los efectos de audio deseados a partir del ruido de fondo en funci\u00f3n de la indicaci\u00f3n de texto opcional del usuario y de la entrada visual. Esta salida de audio finalmente se decodifica y se exporta como una forma de onda que luego se puede recombinar con la entrada de video.<\/p>\n<p>Lo mejor es que el usuario no tiene que entrar y sincronizar manualmente (l\u00e9ase: tediosamente) las pistas de audio y v\u00eddeo, ya que el sistema V2A lo hace autom\u00e1ticamente. \u00abAl entrenar en video, audio y las anotaciones adicionales, nuestra tecnolog\u00eda aprende a asociar eventos de audio espec\u00edficos con varias escenas visuales, mientras responde a la informaci\u00f3n proporcionada en las anotaciones o transcripciones\u00bb, escribi\u00f3 el equipo de Deep Mind.<\/p>\n<p>Sin embargo, el sistema a\u00fan no est\u00e1 perfeccionado. Por un lado, la calidad del audio de salida depende de la fidelidad de la entrada de v\u00eddeo y el sistema se estropea cuando hay artefactos de v\u00eddeo u otras distorsiones en la entrada. Seg\u00fan el equipo de Deep Mind, la sincronizaci\u00f3n del di\u00e1logo con la pista de audio sigue siendo un desaf\u00edo continuo.<\/p>\n<div class=\"dtvideos-container\" data-provider=\"youtube\">\n<div class=\"dtvideos-details h-dtvideos-details-embed\">\n<div class=\"dtvideos-title\">V2A Claymation family<\/div>\n<\/div>\n<\/div>\n<p>\u00abV2A intenta generar voz a partir de las transcripciones de entrada y sincronizarla con los movimientos de los labios de los personajes\u00bb, explic\u00f3 el equipo. \u00abPero el modelo de generaci\u00f3n de videos emparejados puede no estar condicionado por las transcripciones. Esto crea un desajuste, lo que a menudo resulta en una extra\u00f1a sincronizaci\u00f3n de labios, ya que el modelo de video no genera movimientos de la boca que coincidan con la transcripci\u00f3n\u00bb.<\/p>\n<p>El sistema a\u00fan debe someterse a \u00abrigurosas evaluaciones y pruebas de seguridad\u00bb antes de que el equipo considere lanzarlo al p\u00fablico. Todos los v\u00eddeos y bandas sonoras generados por este sistema se incluir\u00e1n con&nbsp;<a href=\"https:\/\/deepmind.google\/technologies\/synthid\/\" target=\"_blank\" rel=\"noopener\">las marcas de agua SynthID<\/a>&nbsp;de Deep Mind. Este sistema est\u00e1 lejos de ser la \u00fanica IA generadora de audio actualmente en el mercado.&nbsp;<a href=\"https:\/\/stability.ai\/news\/introducing-stable-audio-open\" target=\"_blank\" rel=\"noopener\">Stability AI lanz\u00f3 un producto similar<\/a>&nbsp;la semana pasada, mientras que&nbsp;<a href=\"https:\/\/elevenlabs.io\/sound-effects\" target=\"_blank\" rel=\"noopener\">ElevenLabs lanz\u00f3 su herramienta de efectos de sonido<\/a>&nbsp;el mes pasado.<\/p>\n<h4 class=\"b-editors-recs-title h-editors-recs-title\"> Recomendaciones del editor<\/h4>\n<p> <span id=\"publisher-md\" itemprop=\"publisher\" itemscope itemtype=\"https:\/\/schema.org\/Organization\"> <span itemprop=\"url\" itemtype=\"https:\/\/schema.org\/Url\" content=\"https:\/\/es.digitaltrends.com\"> <span itemprop=\"logo\" itemscope itemtype=\"https:\/\/schema.org\/ImageObject\"> <meta itemprop=\"url\" content=\"https:\/\/cdn.dtcn.com\/dt\/dt-logo-small.png\"> <meta itemprop=\"width\" content=\"0\"> <meta itemprop=\"height\" content=\"0\"> <\/span> <meta itemprop=\"name\" content=\"Digital Trends Espa\u00f1ol\"> <\/span> <span itemprop=\"image\" itemscope itemtype=\"https:\/\/schema.org\/ImageObject\"> <meta itemprop=\"url\" content=\"https:\/\/es.digitaltrends.com\/wp-content\/uploads\/2024\/06\/Deep-Mind-Google.jpeg?p=1\"> <\/span> <\/span> <\/p>\n","protected":false},"excerpt":{"rendered":"<p>Deep Mind de Google Deep Mind mostr\u00f3 el martes los \u00faltimos resultados de su investigaci\u00f3n generativa de video a audio de IA. Es un sistema novedoso que combina lo que ve en pantalla con la indicaci\u00f3n escrita del usuario para crear paisajes sonoros de audio sincronizados para un videoclip determinado. La IA V2A se puede [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":151501,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":[],"categories":[18],"tags":[],"_links":{"self":[{"href":"http:\/\/cordobadirecto.com\/index.php\/wp-json\/wp\/v2\/posts\/151500"}],"collection":[{"href":"http:\/\/cordobadirecto.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/cordobadirecto.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/cordobadirecto.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/cordobadirecto.com\/index.php\/wp-json\/wp\/v2\/comments?post=151500"}],"version-history":[{"count":0,"href":"http:\/\/cordobadirecto.com\/index.php\/wp-json\/wp\/v2\/posts\/151500\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"http:\/\/cordobadirecto.com\/index.php\/wp-json\/wp\/v2\/media\/151501"}],"wp:attachment":[{"href":"http:\/\/cordobadirecto.com\/index.php\/wp-json\/wp\/v2\/media?parent=151500"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/cordobadirecto.com\/index.php\/wp-json\/wp\/v2\/categories?post=151500"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/cordobadirecto.com\/index.php\/wp-json\/wp\/v2\/tags?post=151500"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}