Notebookcheck Logo

OpenAI prezentuje zdolność silnika Voice Engine do przekonującego klonowania głosu osoby za pomocą 15-sekundowej próbki głosu

OpenAI demonstruje możliwości silnika Voice Engine, który może sklonować głos osoby z 15-sekundową próbką. (Obraz AI Dall-E 3)
OpenAI demonstruje możliwości silnika Voice Engine, który może sklonować głos osoby z 15-sekundową próbką. (Obraz AI Dall-E 3)
Firma OpenAI zaprezentowała możliwości swojej technologii Voice Engine w zakresie przekonującego klonowania głosu danej osoby za pomocą 15-sekundowej próbki głosu. Silnik może również przenosić akcent osoby na inne języki mówione podczas tłumaczenia mowy, nieformalnie mówić nowy tekst i przywracać wyraźną mowę osobom z zaburzeniami głosu lub chorobami.
AI Software Security

OpenAI zaprezentowało aktualny stan swojej technologii Voice Engine, która może przekonująco sklonować głos osoby przy użyciu 15-sekundowej próbki głosu jako danych wejściowych. Technologia ta może również przenieść akcent danej osoby na inne języki mówione podczas tłumaczenia mowy, nawet jeśli język docelowy używa mowy nieformalnej lub slangu. W przypadku mówców z zaburzeniami głosu lub chorobami, które powodują niewyraźną mowę, takimi jak zapalenie krtani, Voice Engine może powtórzyć to, co zostało powiedziane wyraźnym głosem.

Technologia sztucznej inteligencji rozwinęła się do tego stopnia, że rozpoznaje samogłoski, słowa i inne części mowy oraz potrafi zrozumieć sedno zdań. Sztuczna inteligencja klonująca głos rozpoznaje unikalne cechy mowy danej osoby, takie jak akcent, emocje, czas i nacisk, a następnie wykorzystuje te cechy do wypowiadania tekstu jako przekonujący klon.

OpenAI zademonstrowało na swoim blogu przekonujące przykłady:

  • Klonowanie głosu
  • Tłumaczenie mowy z klonowaniem akcentu głosowego
  • Mówienie w sposób nieformalny lub w slangu
  • Mówienie dla osób niemych
  • Mówienie oryginalnym, wyraźnym głosem osoby cierpiącej na zaburzenia mowy

OpenAI nie udostępnia obecnie silnika Voice Engine publicznie ze względu na obawy o niewłaściwe użycie, pomimo wielu innych usług klonowania głosu i adaptacji głosu AI na rynku. Taka technologia była już wykorzystywana podczas amerykańskiego cyklu wyborczego do tworzenia połączeń telefonicznych "fałszywy prezydent Bidenoraz na całym świecie do wyłudzania pieniędzy od firm https://edition.cnn.com/2024/02/04/asia/deepfake-cfo-scam-hong-kong-intl-hnk/index.html i osób. Niestety, po otwarciu puszki Pandory, takiej jak technologia generatywnej sztucznej inteligencji wykorzystywana do tworzenia fałszywych obrazów papieżanie ma już odwrotu.

Zaniepokojeni czytelnicy powinni utworzyć bezpieczne słowa z członkami rodziny i bliskimi przyjaciółmi, aby zweryfikować swoją tożsamość, przeczytać, jak rozpoznać oszukańcze telefony, wyłączyć korzystanie z weryfikacji rozpoznawania głosu u dostawców usług finansowych i rozważyć użycie zmieniacza głosu w celu ochrony przed kopiowaniem głosu podczas odbierania nieznanych połączeń.

Please share our article, every link counts!
> laptopy testy i recenzje notebooki > Nowinki > Archiwum v2 > Archiwum 2024 03 > OpenAI prezentuje zdolność silnika Voice Engine do przekonującego klonowania głosu osoby za pomocą 15-sekundowej próbki głosu
David Chien, 2024-03-30 (Update: 2024-03-30)