24.01.2020      15501      19
 

Нужен ли сервис транскрибации видео с youtube в уникальный текст


транскрибация текста

Всем привет.

Так как в последнее время по основной своей деятельности начали часто работать с нейронными сетями, и в частности со средствами распознавания речи, в голове все время крутится одна и та же мысль: а не создать ли на основании всех полученных результатов сервис, который будет переводить видео с youtube в адекватный осмысленный и, что самое главное, уникальный текст.

И делать это не на основе субтитров, присутствующих у роликов, которые в большинстве случаев преобразуются в полотно нечитаемого текста, а именно на основе вычленения слов и составления из них осмысленного текста со связными предложениями.

Например, можно было бы использовать это для получения уникального контента для своих информационных сайтов. Или чего-нибудь еще. Напишите, пожалуйста, свои мысли по этому поводу в комментариях — был бы вам интересен подобный сервис? Для чего бы его использовали и как часто? Сколько готовы бы были за такое платить?

Спасибо.


Об авторе: Ложкин Иван

Всю осмысленную жизнь занимаюсь интернет-маркетингом. Создаю сайты, продвигаю сайты и зарабатываю на сайтах. Если тебе нужен совет, консультация или тебе есть, о чем мне рассказать пиши мне ВК.

Обсуждение: 19 комментариев
  1. Никита:

    Включи заметки на андройде например, выбираешь запись голосом и включаешь видос. Он в текстовик сам все транскрибирует. Это если кому-то не много текстов надо сделать, хороший способ. А вот если массово, то уже надо что-то писать кодом.

    Ответить
  2. субтитры гугла автоматические — печальное зрелище…

    Ответить
  3. Заказываю транскрибацию гайдов по играм на кворке.
    Думаю сервис что ты предлагаешь будет пользоваться спросом.
    Уже есть пару таких сервисов но они или кривые или заброшенные создателями.

    Ответить
    1. Гуд, про сервисы вкурсе. А по ценам сможешь сориентировать примерно — сколько за транскрибацию гайдов отдаешь?

      Ответить
      1. 500 руб. за 60 минут и отформатирован текст.

        Ответить
  4. gavs:

    с помощью какого движка думаешь делать распознование?
    если занят щас с нейронками и нлп — не попадались ли тебе нормальные системы озвучки книг?

    Ответить
    1. Движок свой. Упомянутый ниже в комментарии SpeechKit от Яндекса пробовали использовать, но система оказалась чрезвычайно закрытой и негибкой. Есть доступ к LSTM сети, которая обучалась на сериалах, твитах и т.п. добре.

      По книгам интересная идея, кстати. Не копал в этом направлении.

      Ответить
  5. Алё гараж:

    Яндекс SpeechKit и другие облачные решения уже изобретены. Вы сможете дать лучшее качество или цену? Сомневаюсь.

    Ответить
    1. Основная проблема SpeechKit — ее закрытость. Я хочу более гибкую и простую систему. Нейронки открывают много новых возможностей, на самом деле. Это уж как ее обучишь.

      Ответить
  6. Какой смысл? Есть же бесплатные сервисы. Я тот же https://speechpad.ru юзал

    Ответить
    1. Проблема в том, что там куча ошибок. И текст приходится править, причем достаточно серьезно. Ну, то есть легче самому все перевести в текст, чем пользоваться данным сервисом.

      Ответить
  7. YB:

    Если сделаешь распознаватель лучше чем у ютуба, то просто продай его ютубу и озолотишься))

    Долго ли занял вход в машинное обучение? На питоне делаешь?

    Ответить
    1. Пока только учимся этому всему. Процесс проходит не быстро, так как это все таки не основная моя специализация, а побочная. Да, конечно питон, тут без него никак)

      Ответить
  8. Айнур:

    Думаю не пойдет. Качество субтитров зависит от дикции говорящего. Текст у видео, сделанного например, на профессиональном телеканале распознается Ютубом отлично. Сервис не сможет так хорошо распознать текст и исправить орфографические и пунктуационные ошибки. Легче будет взять субтитры и нанять корректора за копейки.
    А вы думаете откуда блогеры берут контент для своих видео?!

    Ответить
  9. Таки нужен, бесплатные сервисы как гугл переводчик, все делают через пятую точку , а на платных и ценник не маленький

    Ответить
  10. У ютуба же есть уже такой сервис

    Ответить
    1. Хм. Не знал. Как называется?

      Ответить
  11. под дорвеи норм пойдет

    Ответить
  12. Главное нужный результат

    Ответить

Ваш комментарий

Ваш адрес email не будет опубликован.

Для отправки комментария, поставьте отметку, что разрешаете сбор и обработку ваших персональных данных . Политика конфиденциальности

Ложкин Иван

Привет всем. Меня зовут Ложкин Иван. Я разработчик, предприниматель и вебмастер с опытом больше 12 лет.

Являюсь директором компании ЛДБИТ. Мы занимаемся разработкой онлайн-сервисов, стартапов и различных систем автоматизации бизнес-процессов. То есть помогаем компаниям зарабатывать больше, а "париться" меньше.

Если вы хотите заказать разработку или получить консультацию относительно вашего бизнеса или заработка в интернете, пишите на почту mail@lozhkinivan.ru.

Подписывайтесь в социальных сетях:
Вконтакте
Инстаграм
Твиттер
Телеграм

Подпишись на группу в ВК, там интересно:
Здесь я публикую то, о чем не принято писать на блоге: