транскрибация текста

Всем привет.

Так как в последнее время по основной своей деятельности начали часто работать с нейронными сетями, и в частности со средствами распознавания речи, в голове все время крутится одна и та же мысль: а не создать ли на основании всех полученных результатов сервис, который будет переводить видео с youtube в адекватный осмысленный и, что самое главное, уникальный текст.

И делать это не на основе субтитров, присутствующих у роликов, которые в большинстве случаев преобразуются в полотно нечитаемого текста, а именно на основе вычленения слов и составления из них осмысленного текста со связными предложениями.

Например, можно было бы использовать это для получения уникального контента для своих информационных сайтов. Или чего-нибудь еще. Напишите, пожалуйста, свои мысли по этому поводу в комментариях — был бы вам интересен подобный сервис? Для чего бы его использовали и как часто? Сколько готовы бы были за такое платить?

Спасибо.

Поделитесь Вашим мнением
  1. Никита

    Включи заметки на андройде например, выбираешь запись голосом и включаешь видос. Он в текстовик сам все транскрибирует. Это если кому-то не много текстов надо сделать, хороший способ. А вот если массово, то уже надо что-то писать кодом.

  2. seoonly.ru

    субтитры гугла автоматические — печальное зрелище…

  3. ЛутМастер

    Заказываю транскрибацию гайдов по играм на кворке.
    Думаю сервис что ты предлагаешь будет пользоваться спросом.
    Уже есть пару таких сервисов но они или кривые или заброшенные создателями.

    1. Ложкин Иван

      Гуд, про сервисы вкурсе. А по ценам сможешь сориентировать примерно — сколько за транскрибацию гайдов отдаешь?

      1. ЛутМастер

        500 руб. за 60 минут и отформатирован текст.

  4. gavs

    с помощью какого движка думаешь делать распознование?
    если занят щас с нейронками и нлп — не попадались ли тебе нормальные системы озвучки книг?

    1. Ложкин Иван

      Движок свой. Упомянутый ниже в комментарии SpeechKit от Яндекса пробовали использовать, но система оказалась чрезвычайно закрытой и негибкой. Есть доступ к LSTM сети, которая обучалась на сериалах, твитах и т.п. добре.

      По книгам интересная идея, кстати. Не копал в этом направлении.

  5. Алё гараж

    Яндекс SpeechKit и другие облачные решения уже изобретены. Вы сможете дать лучшее качество или цену? Сомневаюсь.

    1. Ложкин Иван

      Основная проблема SpeechKit — ее закрытость. Я хочу более гибкую и простую систему. Нейронки открывают много новых возможностей, на самом деле. Это уж как ее обучишь.

  6. Евгений Молдовану

    Какой смысл? Есть же бесплатные сервисы. Я тот же https://speechpad.ru юзал

    1. Ложкин Иван

      Проблема в том, что там куча ошибок. И текст приходится править, причем достаточно серьезно. Ну, то есть легче самому все перевести в текст, чем пользоваться данным сервисом.

  7. YB

    Если сделаешь распознаватель лучше чем у ютуба, то просто продай его ютубу и озолотишься))

    Долго ли занял вход в машинное обучение? На питоне делаешь?

    1. Ложкин Иван

      Пока только учимся этому всему. Процесс проходит не быстро, так как это все таки не основная моя специализация, а побочная. Да, конечно питон, тут без него никак)

  8. Айнур

    Думаю не пойдет. Качество субтитров зависит от дикции говорящего. Текст у видео, сделанного например, на профессиональном телеканале распознается Ютубом отлично. Сервис не сможет так хорошо распознать текст и исправить орфографические и пунктуационные ошибки. Легче будет взять субтитры и нанять корректора за копейки.
    А вы думаете откуда блогеры берут контент для своих видео?!

  9. vyborexperta.ru

    Таки нужен, бесплатные сервисы как гугл переводчик, все делают через пятую точку , а на платных и ценник не маленький

  10. Промокоды Hoff

    У ютуба же есть уже такой сервис

    1. Ложкин Иван

      Хм. Не знал. Как называется?

  11. seoonly.ru

    под дорвеи норм пойдет

  12. irmaseo.ru

    Главное нужный результат

Ваш комментарий

Ваш адрес email не будет опубликован.

Еще записи из этой же рубрики

Что будем искать? Например,Заработок в интернете

Минуту внимания
Мы используем файлы cookies, чтобы обеспечивать правильную работу нашего веб-сайта, а также работу функций социальных сетей и анализа сетевого трафика.