Транскрибация речи стэндап-комика с дефектами речи
60 минут видео + 6 текстовых документов
LabelMe.ru
Лицензия:
Юзабилити:
Теги:
транскрибация речи, speech transcription, voice to text,
публичный датасет
6/10
Описание
Провели транскрибацию речи на 6909 слов из интервью и выступлений стендап-комика с дефектами речи. Использование датасета в коммерческих целях допускается только с согласия правообладателя (manager@labelme.ru)
Подробно
Провели транскрибацию видео с выступлениями и интервью стендап-комика с дефектами речи. Сергей Кутергин (Сергеич) родился с диагнозом ДЦП, что в том числе отразилось и на функциях речевого аппарата. В целях усовершенствования алгоритмов автоматической
генерации субтитров, мы расшифровали 60 минут живой речи комика.

Датасет состоит из 6 текстовых файлов, содержащих дословные расшифровки, и 6 видео — источников. В общей сложности извлекли 6909 слов.
Образец файла
transcription of speech Sergeich's (demo).rar
Good design is obvious. Great design is transparent.
Статус:
Скачать датасет «transcription of speech Sergeich's» с портала Labelme.ru
Размер: (11.4 Гб)
проверено
606 Мб
Размер: