Всем привет.
Так как в последнее время по основной своей деятельности начали часто работать с нейронными сетями, и в частности со средствами распознавания речи, в голове все время крутится одна и та же мысль: а не создать ли на основании всех полученных результатов сервис, который будет переводить видео с youtube в адекватный осмысленный и, что самое главное, уникальный текст.
И делать это не на основе субтитров, присутствующих у роликов, которые в большинстве случаев преобразуются в полотно нечитаемого текста, а именно на основе вычленения слов и составления из них осмысленного текста со связными предложениями.
Например, можно было бы использовать это для получения уникального контента для своих информационных сайтов. Или чего-нибудь еще. Напишите, пожалуйста, свои мысли по этому поводу в комментариях — был бы вам интересен подобный сервис? Для чего бы его использовали и как часто? Сколько готовы бы были за такое платить?
Спасибо.
Включи заметки на андройде например, выбираешь запись голосом и включаешь видос. Он в текстовик сам все транскрибирует. Это если кому-то не много текстов надо сделать, хороший способ. А вот если массово, то уже надо что-то писать кодом.
субтитры гугла автоматические — печальное зрелище…
Заказываю транскрибацию гайдов по играм на кворке.
Думаю сервис что ты предлагаешь будет пользоваться спросом.
Уже есть пару таких сервисов но они или кривые или заброшенные создателями.
Гуд, про сервисы вкурсе. А по ценам сможешь сориентировать примерно — сколько за транскрибацию гайдов отдаешь?
500 руб. за 60 минут и отформатирован текст.
с помощью какого движка думаешь делать распознование?
если занят щас с нейронками и нлп — не попадались ли тебе нормальные системы озвучки книг?
Движок свой. Упомянутый ниже в комментарии SpeechKit от Яндекса пробовали использовать, но система оказалась чрезвычайно закрытой и негибкой. Есть доступ к LSTM сети, которая обучалась на сериалах, твитах и т.п. добре.
По книгам интересная идея, кстати. Не копал в этом направлении.
Яндекс SpeechKit и другие облачные решения уже изобретены. Вы сможете дать лучшее качество или цену? Сомневаюсь.
Основная проблема SpeechKit — ее закрытость. Я хочу более гибкую и простую систему. Нейронки открывают много новых возможностей, на самом деле. Это уж как ее обучишь.
Какой смысл? Есть же бесплатные сервисы. Я тот же https://speechpad.ru юзал
Проблема в том, что там куча ошибок. И текст приходится править, причем достаточно серьезно. Ну, то есть легче самому все перевести в текст, чем пользоваться данным сервисом.
Если сделаешь распознаватель лучше чем у ютуба, то просто продай его ютубу и озолотишься))
Долго ли занял вход в машинное обучение? На питоне делаешь?
Пока только учимся этому всему. Процесс проходит не быстро, так как это все таки не основная моя специализация, а побочная. Да, конечно питон, тут без него никак)
Думаю не пойдет. Качество субтитров зависит от дикции говорящего. Текст у видео, сделанного например, на профессиональном телеканале распознается Ютубом отлично. Сервис не сможет так хорошо распознать текст и исправить орфографические и пунктуационные ошибки. Легче будет взять субтитры и нанять корректора за копейки.
А вы думаете откуда блогеры берут контент для своих видео?!
Таки нужен, бесплатные сервисы как гугл переводчик, все делают через пятую точку , а на платных и ценник не маленький
У ютуба же есть уже такой сервис
Хм. Не знал. Как называется?
под дорвеи норм пойдет
Главное нужный результат