Google's nieuwe AI genereert geluid op basis van videopixels, ook lipsynchronisatie mogelijk

Tech Update | BNR - Een podcast door BNR Nieuwsradio

Categorieën:

Google's AI-lab Deepmind heeft een nieuwe AI-technologie gepresenteerd die audio kan genereren op basis van videobeeld. Het AI-model analyseert videopixels en kan daar zelf audio aan toevoegen. Dat lijkt ook te werken met lipsynchronisatie, is in voorbeelden te zien. De V2A (video-to-audio) technologie werkt in combinatie met het nieuwe AI-model Veo, van Google, dat video's kan genereren. Dat was tot nu toe altijd een stille video, maar daar kan nu ook audio aan worden toegevoegd. Google toont onder meer een video waarbij gitaarpingels klinken bij een video van gitaarspel. Het meest opvallende voorbeeld is met animatiefiguurtjes die tegen elkaar praten. Het AI-model kan daarbij spraak toevoegen. Volgens Google is de technologie nog niet heel goed, en moet er nog een hoop aan gebeuren.  Verder in deze Tech Update: Massaclaim tegen Oracle en Salesforce in behandeling genomen door Amsterdams Gerechtshof. Vijf miljard euro is de eis voor het onrechtmatig bundelen en verkopen van persoonsgegevens van Nederlandse internetgebruikers. De claim wordt gedaan door The Privacy Collective, maar krijgt financiele steun door de Britse partij Innsworth die 30% vangt bij een overwinning. Eurocommissaris Margrethe Verstager bevestigd een onderzoek en mogelijke aanklacht tegen Apple, door de Europese Commissie, vanwege de Digital Markets Act. Verstager spreekt over diverse 'serieuze problemen' rond Apple als marktmacht, in een interview met CNBC.  See omnystudio.com/listener for privacy information.