
07.03.2026 |
Pauza / INOVACIJE I TEHNOLOGIJE
Izvor: bljesak.info
Novi alat Voicebox omogućava kloniranje glasa na osnovu samo nekoliko sekundi snimke uz maksimalnu privatnost.
Predstavljen je novi open-source alat za kloniranje glasa pod nazivom Voicebox, koji omogućava stvaranje digitalne kopije glasa na temelju samo nekoliko sekundi snimke, a sav proces odvija se lokalno na računalu korisnika.
Prema dostupnim informacijama, Voicebox koristi model Qwen3-TTS, sustav za sintezu govora koji je razvila kineska tehnološka kompanija Alibaba.
Alat omogućava korisnicima da učitaju kratki audio zapis, nakon čega sustav generira gotovo identičan glas koji se može koristiti za stvaranje govora na različitim jezicima.
Za razliku od mnogih sličnih rješenja, Voicebox ne zahtijeva pretplatu niti slanje audio podataka u oblak.
Svi procesi obrade i generiranja glasa odvijaju se izravno na korisničkom uređaju, čime se povećava razina privatnosti i sigurnosti podataka.
Alat uključuje i napredne funkcije za audio produkciju.
Među njima su višekanalni vremenski editor nalik onima u programima za audio obradu, koji omogućava stvaranje podcasta i dijaloga s više glasova, kao i mogućnost snimanja zvuka sustava uz integriranu transkripciju pomoću modela Whisper.
Voicebox također omogućava takozvano predmemoriranje glasovnih upita, što omogućava brzo ponovno generiranje govora bez ponovnog procesiranja svih podataka.
Program je razvijen uz pomoć Tauri okvira, koji koristi programski jezik Rust, zbog čega je aplikacija znatno manja i brža od tradicionalnih rješenja temeljenih na Electron platformi.
Projekt je objavljen kao potpuno open-source softver pod MIT licencom i trenutačno je dostupan za operativne sustave macOS i Windows, dok je verzija za Linux najavljena za naredno razdoblje, piše Bljesak.info.
*Pri preuzimanju teksta s portala Akta.ba potrebno je navesti izvor i linkovati tekst.
Dojavi vijest na viber +387 60 331 55 03 ili na mail urednik@akta.ba.