Popularny odtwarzacz multimedialny VLC szykuje się do wprowadzenia ważnej funkcji, dzięki której oglądanie filmów i seriali wskoczy na zupełnie nowy poziom. Podczas tegorocznych targów CES 2025, gdzie sztuczna inteligencja zdominowała większość prezentacji, VideoLAN – organizacja non-profit odpowiedzialna za rozwój VLC – zaprezentowała działający system automatycznego generowania napisów w czasie rzeczywistym.
To, co wyróżnia nowe rozwiązanie VLC na tle konkurencji, to możliwość działania całkowicie offline, bez konieczności połączenia z internetem czy wykorzystywania usług chmurowych. System wspiera ponad 100 języków i pozwala na jednoczesne wyświetlanie napisów w dwóch różnych językach. Co więcej, wygenerowane napisy można zapisać w popularnym formacie SRT, co umożliwia ich późniejsze wykorzystanie.
Technologia i możliwości
Podczas prezentacji na CES, VideoLAN pokazało działanie systemu na przykładzie słynnego występu Ricky’ego Gervaisa z ceremonii Golden Globes 2020. System w czasie rzeczywistym generował napisy w różnych językach, w tym po japońsku i francusku, demonstrując wysoką jakość i precyzję tłumaczenia. Warto zauważyć, że cały proces odbywa się lokalnie na komputerze użytkownika, co jest znaczącym osiągnięciem w dziedzinie przetwarzania języka naturalnego.
Chociaż VideoLAN nie ujawniło szczegółów technicznych rozwiązania, spekuluje się, że system może wykorzystywać model Whisper od OpenAI, który jest wiodącym open-source’owym modelem do rozpoznawania mowy. Firma stanowczo odrzuca sugestie dotyczące wykorzystania usług chmurowych, podkreślając, że głównym celem jest uniezależnienie się od kosztownych operacji w chmurze.
Podobne rozwiązanie, oparte na połączeniu internetowym, funkcjonuje już od dłuższego czasu na YouTube. Niestety, platforma nie zawsze oferuje możliwość wyboru języka polskiego, co bywa frustrujące dla użytkowników. Analogiczny mechanizm został zaimplementowany w wielu serwisach, wspierając twórców w generowaniu napisów do krótkich materiałów wideo. Z pewnością spotkaliście się z takimi rozwiązaniami na TikToku czy w shortsach na YouTube.
Praktyczne zastosowania
Nowa funkcja VLC może okazać się szczególnie przydatna dla osób oglądających zagraniczne produkcje, materiały edukacyjne czy archiwalne nagrania bez dostępnych napisów. Do tej pory użytkownicy musieli polegać na wbudowanym narzędziu do pobierania napisów lub przeszukiwać często podejrzane strony internetowe w poszukiwaniu plików SRT.
Funkcja ma zostać udostępniona w ramach VLC 4.0, choć dokładna data premiery nie została jeszcze ogłoszona. Warto również zauważyć potencjalne implikacje tej technologii dla branży – możliwe, że w przyszłości zobaczymy rozwój automatycznego dubbingu AI, choć należy pamiętać, że sztuczna inteligencja wciąż nie dorównuje ludzkim aktorom w przekazywaniu emocji.