Strona główna › Pytania INF.10 › Pytanie 168
INF.10 · pytanie #168
W programie typu "test to speech" (TTS) zastosowanie znaczników SSML umożliwia
- Akonfigurację sposobu wypowiadania wybranej części tekstu.
- Bpoprawę wymowy za pomocą dedykowanych słowników.
- Ckonfigurację sposobu wyświetlania tekstu w programie.
- Dokreślenie formatu pliku wyjściowego.
Poprawna odpowiedź: A. konfigurację sposobu wypowiadania wybranej części tekstu.
Kliknij odpowiedź, którą uważasz za poprawną.
Wyjaśnienie
SSML, czyli Speech Synthesis Markup Language, to taki specjalny język znaczników, który pozwala sterować w szczegółowy sposób tym, jak syntezator mowy (TTS) odczytuje tekst. I moim zdaniem, to jest właśnie esencja pracy z profesjonalnym TTS-em – nie tylko wrzucamy tekst, ale faktycznie możemy decydować o tym, jak on zabrzmi. Dzięki SSML możemy np. ustawić pauzy, zmienić ton głosu, podkreślić wybrane frazy, a nawet sterować tempem i głośnością. To wszystko ma ogromne znaczenie, zwłaszcza kiedy zależy nam na naturalności lub chcemy, by komunikaty były bardziej zrozumiałe dla użytkowników. Wyobraź sobie system informacyjny na dworcu albo książkę audio: bez SSML głos byłby monotonny i często nienaturalny. A tak, przy pomocy chociażby tagów (pauza), (zmiana tempa czy wysokości głosu) czy (podkreślenie), dokładnie ustawiamy, jak mają zabrzmieć konkretne fragmenty tekstu. W praktyce, to jest standard branżowy wspierany przez najpopularniejsze narzędzia TTS: Google Cloud Text-to-Speech, Amazon Polly, Microsoft Azure TTS i wiele innych. Dobrym zwyczajem jest testowanie różnych ustawień SSML, żeby znaleźć najbardziej naturalny sposób przekazania tekstu – szczególnie w projektach, gdzie doświadczenie użytkownika odgrywa kluczową rolę. Takie możliwości daje właśnie SSML – precyzyjna kontrola nad wypowiadaniem tekstu, a nie tylko sucha konwersja znaków na mowę.
🤖 Wyjaśnienie generowane przez AI – weryfikuj w oficjalnych źródłach.