24.01.2020      1810      13
 

Нужен ли сервис транскрибации видео с youtube в уникальный текст


транскрибация текста

Всем привет.

Так как в последнее время по основной своей деятельности начали часто работать с нейронными сетями, и в частности со средствами распознавания речи, в голове все время крутится одна и та же мысль: а не создать ли на основании всех полученных результатов сервис, который будет переводить видео с youtube в адекватный осмысленный и, что самое главное, уникальный текст.

И делать это не на основе субтитров, присутствующих у роликов, которые в большинстве случаев преобразуются в полотно нечитаемого текста, а именно на основе вычленения слов и составления из них осмысленного текста со связными предложениями.

Например, можно было бы использовать это для получения уникального контента для своих информационных сайтов. Или чего-нибудь еще. Напишите, пожалуйста, свои мысли по этому поводу в комментариях — был бы вам интересен подобный сервис? Для чего бы его использовали и как часто? Сколько готовы бы были за такое платить?

Спасибо.


Об авторе: Ложкин Иван

Всю осмысленную жизнь занимаюсь интернет-маркетингом. Создаю сайты, продвигаю сайты и зарабатываю на сайтах. Если тебе нужен совет, консультация или тебе есть, о чем мне рассказать пиши мне ВК.

Обсуждение: 13 комментариев
  1. субтитры гугла автоматические — печальное зрелище…

    Ответить
  2. Заказываю транскрибацию гайдов по играм на кворке.
    Думаю сервис что ты предлагаешь будет пользоваться спросом.
    Уже есть пару таких сервисов но они или кривые или заброшенные создателями.

    Ответить
    1. Гуд, про сервисы вкурсе. А по ценам сможешь сориентировать примерно — сколько за транскрибацию гайдов отдаешь?

      Ответить
      1. 500 руб. за 60 минут и отформатирован текст.

        Ответить
  3. gavs:

    с помощью какого движка думаешь делать распознование?
    если занят щас с нейронками и нлп — не попадались ли тебе нормальные системы озвучки книг?

    Ответить
    1. Движок свой. Упомянутый ниже в комментарии SpeechKit от Яндекса пробовали использовать, но система оказалась чрезвычайно закрытой и негибкой. Есть доступ к LSTM сети, которая обучалась на сериалах, твитах и т.п. добре.

      По книгам интересная идея, кстати. Не копал в этом направлении.

      Ответить
  4. Алё гараж:

    Яндекс SpeechKit и другие облачные решения уже изобретены. Вы сможете дать лучшее качество или цену? Сомневаюсь.

    Ответить
    1. Основная проблема SpeechKit — ее закрытость. Я хочу более гибкую и простую систему. Нейронки открывают много новых возможностей, на самом деле. Это уж как ее обучишь.

      Ответить
  5. Какой смысл? Есть же бесплатные сервисы. Я тот же https://speechpad.ru юзал

    Ответить
    1. Проблема в том, что там куча ошибок. И текст приходится править, причем достаточно серьезно. Ну, то есть легче самому все перевести в текст, чем пользоваться данным сервисом.

      Ответить
  6. YB:

    Если сделаешь распознаватель лучше чем у ютуба, то просто продай его ютубу и озолотишься))

    Долго ли занял вход в машинное обучение? На питоне делаешь?

    Ответить
    1. Пока только учимся этому всему. Процесс проходит не быстро, так как это все таки не основная моя специализация, а побочная. Да, конечно питон, тут без него никак)

      Ответить
  7. Айнур:

    Думаю не пойдет. Качество субтитров зависит от дикции говорящего. Текст у видео, сделанного например, на профессиональном телеканале распознается Ютубом отлично. Сервис не сможет так хорошо распознать текст и исправить орфографические и пунктуационные ошибки. Легче будет взять субтитры и нанять корректора за копейки.
    А вы думаете откуда блогеры берут контент для своих видео?!

    Ответить

Ваш комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Для отправки комментария, поставьте отметку, что разрешаете сбор и обработку ваших персональных данных . Политика конфиденциальности


Обо мне
Мои услуги

Я в социальных сетях:
Вконтакте
Инстаграм
Твиттер
Телеграм

Моя электронная почта:
mail@lozhkinivan.ru

Подпишись на группу в ВК, там интересно:
Здесь я публикую то, о чем не принято писать на блоге: