Nowa technologia generowania dźwięku od Google

Przewidywany czas czytania to 3 minuty.

W całym zalewie informacji, związanym z rozwijającą się sztuczną inteligencją, ciężko już zorientować się w prezentowanych nowościach. Sposoby na wykorzystanie AI mnożą się z dnia na dzień, a producenci szukają kolejnych możliwości ulepszenia technologii i wyjścia przed szereg. Większość technologicznej branży skupiona jest wokół chatbotów i technologii rozmawiającej z użytkownikiem oraz pomagającej mu w codziennych czynnościach. Warto jednak zwrócić uwagę również na inne, pojawiające się pomysły i projekty. Wśród nich znajdziemy nowość od Google, która może zmienić losy pracy z wideo.

Google – Nowy sposób generowania dźwięku

Kojarzymy technologię AI głównie z generowaniem tekstu. Wcześniej, zajmowała się obrazkami, a także materiałami wideo. Rzadko jednak, w rozmowach o sztucznej inteligencji poruszany jest temat dźwięku. Oczywiście, chociażby najnowszy Chat GPT 4-0, jest w stanie rozmawiać z użytkownikiem. Wiele firm szykuje się także do implementacji AI do asystentów głosowych. Google postanowiło natomiast zająć się dźwiękiem, grającym nie pierwsze, ale drugie skrzypce.

Nowa technologia, nazwana video-to-audio. Zajmuje się nią specjalny oddział Google, nazwany Google DeepMind. Jak sam opisuje, technologia potrafi stworzyć ścieżkę audio, dopasowaną do wyświetlanego obrazu. Odbywa się to za pomocą analizy obrazu, a także wykorzystania tekstowych sugestii, którymi można uraczyć AI.

Video-to-audio, osiągnęło obecny stan, analizując tony danych, zarówno w formie wideo, jak i specjalnych opisów ścieżek audio. Dodatkowo, w procesie wykorzystywany jest losowy szum, który później nadaje ścieżce dźwiękowej oryginalności. Trzeba przyznać, że naprawdę robi to wrażenie. Dźwięk jest w stanie oddać klimat, towarzyszącego mu obrazu, a jednocześnie wziąć pod uwagę szczegóły, obecne w kadrze. Twórcy przyznają jednak, że technologia jest obecnie dopiero w początkowej fazie powstawania. Zdarzają się liczne błędy, zwłaszcza, jeśli filmowy materiał jest nieco niewyraźny lub wybrakowany w jakikolwiek sposób. AI nie jest jeszcze w stanie poradzić sobie z tym faktem. Miejmy nadzieję, że na wszystko przyjdzie pora.

Google – Niesamowita przyszłość filmów

Technologia V2A ma przed sobą interesującą przyszłość. Przede wszystkim, może w znacznym stopniu przyspieszyć pracę nad wszelkiego rodzaju filmami, animacjami i materiałami wideo. Dodatkowo, połączona z możliwościami generowania filmu, wyniesie twory sztucznej inteligencji na nowy poziom.

Video-to-audio nie jest jeszcze dostępne dla zwykłych użytkowników. Twórcy co jakiś czas udostępniają nowe próbki umiejętności narzędzia. Nie jest ono jeszcze jednak na wystarczająco zaawansowanym poziomie, by trafić do mas. Tak naprawdę, nie jest pewnikiem, czy coś takiego kiedykolwiek się stanie.

Szymon Rzeczkowski

About the Author

Fan seriali, dobrej muzyki i dużych ilości kawy. Potrafi złapać się wielu rzeczy, jeśli akurat coś skradnie jego serce.

View Articles

Nowa technologia generowania dźwięku od Google

Przewidywany czas czytania to 3 minuty.

Google – Nowy sposób generowania dźwięku

Google – Niesamowita przyszłość filmów

Szymon Rzeczkowski

About the Author

Other stories

Gry edukacyjne – nauka przez zabawę!

Jak okraść bank, czyli przepis na bogactwo

Press ESC to close

Przewidywany czas czytania to 3 minuty.

Google – Nowy sposób generowania dźwięku

Google – Niesamowita przyszłość filmów

About the Author

Share Article:

You might also like

Other stories

Gry edukacyjne – nauka przez zabawę!

Jak okraść bank, czyli przepis na bogactwo