Транскрибация речи стэндап-комика с дефектами речи
60 минут видео + 6 текстовых документов
LabelMe.ru
транскрибация речи, speech transcription, voice to text,
публичный датасет
Юзабилити:
Лицензия:
Теги:
6/10
Описание
Провели транскрибацию речи на 6909 слов из интервью и выступлений стендап-комика с дефектами речи. Использование датасета в коммерческих целях допускается только с согласия правообладателя (manager@labelme.ru)
Подробно
Провели транскрибацию видео с выступлениями и интервью стендап-комика с дефектами речи. Сергей Кутергин (Сергеич) родился с диагнозом ДЦП, что в том числе отразилось и на функциях речевого аппарата. В целях усовершенствования алгоритмов автоматической
генерации субтитров, мы расшифровали 60 минут живой речи комика.

Датасет состоит из 6 текстовых файлов, содержащих дословные расшифровки, и 6 видео — источников. В общей сложности извлекли 6909 слов.
Образец файла
transcription of speech Sergeich's (demo).rar
Good design is obvious. Great design is transparent.
Скачать датасет «transcription of speech Sergeich's» с портала Labelme.ru
Размер: (11.4 Гб)
проверено
Статус:
606 Мб
Размер: