Я тоже очень не люблю голосовые, слушаю их только от семьи и близких друзей, да и то не всегда сразу. Но...
Во-первых, Телеграм в тыщу раз пижже убогого ватсапа. Хотя для любителей седой старины и лаптей приходится держать и ватсап. Но всю работу стараюсь вести в ТГ.
Во-вторых, в Телеге есть Премиум (искать в настройках). Стоит 300 р. в месяц или 2000 (две тыщи, а если быть более точным 1 999) в год. Один раз в месяц не попить кофе - и у тебя есть Премиум.
А Премиум позволяет расшифровывать аудио в текст, довольно точно причём.
Тыкаем пикчу -> А и аудио превращается в текст, даже с некоторыми знаками препинания
В итоге сейчас я к голосовым отношусь гораздо спокойнее. Если человек записывает войсы в ватсап и человек мне важен, то просто пишу ему в ответ просьбу написать текстом или записать аудио в ТГ.