Транскрибация речи

Подготовка датасета для машинного обучения, в котором живая речь из аудиозаписей и видео переводится в текстовый формат.
Услуга транскрибации текста относится к разделу NLP (Natural Language Processing). Ее суть заключается в обработке и автоматизации работы с живой речью. Главное преимущество транскрибации речи с помощью людей — соблюдение всех орфографических и пунктуационных норм или разметка дополнительных метаданных. Автоматические алгоритмы до сих пор допускают в этом ошибки.
Услуги → Labelme.ru

Какие цели достигаются с помощью транскрибации речи

Транскрибация речи - перевод записи живой речи в текстовый формат для последующего обучения нейросети

Виды транскрибации

Разметка по количеству спикеров
Для повышения точности машинного обучения, важно правильное аннотирование. Например, если на записи более одного спикера, мы не только точно переведем запись в текст, но и разметим спикеров по разным классам. Без этого нейросеть сможет переводить голос в текст, но не сможет отследить смену спикера. Это может быть критическим недостатком при решение определенных задач.
Разметка по качеству записей
В нашей практике были случаи, когда заказчик предоставлял записи с низким качеством. Посторонние шумы, трения микрофона, речь на заднем плане — мы научились справляться со всем этим.
Для решения каждой из этих проблем были добавлены скрипты и функции, улучшающие качество записей. Это позволяет нашим разметчикам точно перевести каждое слово. А там, где не справляются технологии, нам помогают лингвисты. Они подбирают заглушенные слова и восстанавливают контекст сказанной фразы.
Разметка речи на разных языках
Важно, чтобы разметчик владел языком на уровне носителя (Mother Tongue) и знал грамматические, лексические и орфографические нормы. В противном случае он не сможет правильно транскрибировать запись речи. Через локальные СМИ и сети партнеров мы находим разметчиков носителей языка.
На данный момент LabelMe оказывает услуги по извлечению именованных сущностей на английском, русском, французском, немецком языках.

Примеры применения по отраслям

Мы в LabelMe размечали данные для самых разных областей бизнеса:
  • Разметка для голосовых ассистентов
    Для создания и повышения точности голосовых ассистентов нужны терабайты верно аннотированных данных. Помимо извлечения сущностей для понимания смысла речи, нужна транскрибация. Она позволяет распознавать и понимать форму: комбинации звуков, букв, слогов, которые складываются в слова и предложения. Только так машина сможет правильно декодировать человеческую речь.
  • Разметка для автоматизации колл-центров
    Мы уже транскрибировали записи человеческой речи для создания интерактивных голосовых систем (IVR). Данная технология подразумевает создание роботов, генерирующих человеческую речь, а также автоматический перевод всего диалога в текстовый формат. Последнее значительно упрощает работы по сбору и аналитике клиентского поведения для проведения маркетинговых исследований.
  • Разметка данных для Speech-to-Text систем
    Отличный пример использования этой функции — автоматический перевод голосовых записей в текстовые сообщения в ВКонтакте. Однако, даже сейчас конкретная модель допускает ошибки и некорректно транскрибирует некоторые слова и фразы. Чтобы избежать этого - нужно обрабатывать речь людей с самой разной манерой речи и особенностями произношения.

    Среди наших заказов есть кейсы, где наша команда помогла предусмотреть эту проблему: заказчик предоставил слишком "чистые" данные, и мы помогли разнообразить датасет.
  • Разметка для стриминговых сервисов
    Транскрибация речи лежит в основе создания автоматических субтитров и генерации метаданных для мультимедийных ресурсов. То, что раньше нужно было делать людям, теперь можно поставить на автопилот. Это особенно актуально для прямых трансляций или интерактивных совещаний, в которых спикеры говорят на разных языках.
    Мы подготовим для вас обучающий датасет с транскрибацией на русском, английском, французском, немецком и других языках.

Проверка разметки уже включена в стоимость

У нас любой вид разметки проходит дополнительный этап валидации. Вам не придется искать ошибки — их не будет.

Адаптация производительности

Можем легко масштабировать количество исполнителей, чтобы вы получили даже большой датасет в срок.

Личный менеджер

Он будет держать вас в курсе выполнения заказа и ответит на все интересующие вопросы.

Бесплатный тестовый датасет

Так вы сможете оценить качество, а мы произвести замеры по сложности, длительности и стоимости выполнения заказа

Любые инструменты разметки

Работаем как с собственными инструментами, так и c партнерскими платформами разметки. Обучаем наших разметчиков, прежде чем допустить к работе.

Почему стоит заказать разметку в LabelMe

Открытые датасеты от LabelMe

Услуги LabelMe