Онлайн видео-дикторы на основе искусственного интеллекта
Новости IT
13/12/2020

Онлайн видео-дикторы на основе искусственного интеллекта

Реклама

Автор: Камиль Г.

Будущее наступило с AI

Искусственный интеллект (или AI - Artificial intelligence) начинает захватывать все больше и больше профессий. В скором будущем с экранов телевизоров и мониторов в ютубе будут вещать только автоматизированные дикторы, которые созданы с помощью ИИ.

Всемирная паутина развивает технологии глубокого обучения и нейронных сетей

Все мы видели несколько лет назад как собаки-роботы от Boston Dynamics учились ходить и у них это еле получалось. Сегодня же все чаще появляются новости, что ту или иную профессию заменят искусственным интеллектом: таксистов, копирайтеров, дизайнеров, программистов и др.

Последние несколько лет компания Cинтезия (Synthesia) и Mail.ru Group активно разрабатывали искусственный интеллект, который человекоподобным голосом озвучивает написанный текст. Также в разработке, помимо синтеза речи, была работа над созданием видео составляющей говорения человека. Теперь можно скормить текст ИИ и получить видео фрагмент, где созданный AI в виде человека озвучивает новость, сценарий, причем все это выглядит довольно естественно. Каждый такой созданный диктор в AI видео файле использует, как и человек, губы для своей речи. Здесь также трудится ИИ, чтобы движение губ совпадало с тем, что озвучивает бот.

Сайты Synthesia (https://www.synthesia.io/) и mail.ru Group Диктор (https://dictor.mail.ru/)

Synthesia

Synthesia - компания-разработчик программного обеспечения, основанная в 2017 году группой исследователей и предпринимателей из Калифорнийского университета в Лос-Анджелесе, Стэнфорда, TUM и Кембриджа. Их миссия - возглавить использование искусственного интеллекта и видеосинтеза для создания нового поколения инструментов создания контента. При этом компания очень тщательно следит за этичной составляющей свой работы. По мнению компании, возможность генерировать аудиовизуальный контент посредством искусственного интеллекта является одним из самых интересных достижений в области глубокого обучения.

У Синтезии нет возможности бесплатно опробовать их сервис, но есть новогоднее поздравление, которое позволяет создать видео с Санта Клаусом для всех желающих абсолютно бесплатно!

Платная версия же стоит 30$ за 10 видео в месяц.

Скрин сайта со стомостью продукта от Синтезии (Synthesia): 30$ за 10 видео в месяц

Mail.ru Group

Про саму компанию mailru, думаю, мне рассказывать нечего. Вы и так отлично знаете ее. Относительно недавно они создали ИИ помощника Марусю, которая разговаривала человеческим языком и могла понимать человеческую речь и давать ответы на вопросы в реальном времени. И вот в 2020 году mail.ru Group представила mail Диктора. Диктор может озвучить любой текст, который вы ему передадите. Вы можете сделать новостной выпуск, сделать презентацию чего-либо, а также можно разнообразить контент данной статьи:

Как сделать новогоднее поздравление деда мороза?

Переходим на сайте Санты Синтезии и вы увидите простую форму для заполнения:

Перейдите на сайт Санты Клауса, чтобы заполнить простую форму для генерации поздравления — https://www.synthesia.io/santa
  1. Выбираем Санту, а точнее антураж вокруг него.
  2. Пишем текст поздравления до 250 символов. Поддерживается русский и английский языки.
  3. Пишем свой email, куда вам через некоторое время придет готовое видео.

Как сделать свой репортаж с помощью mail.ru Диктора?

Софт от mail Диктора гораздо мощнее, чем предлагает Синтезия.

  1. Переходим на сайт создания mail диктора
  2. Выбираем диктора, который будет озвучивать наш текст На первой странице сайта выбираете диктора
  3. Выбираем план: На второй странице выбираете план ведущего, с которым будет озвучен текст: сидя или стоя
  4. Выбираем студию: На третьей странице выбираете студию для озвучки
  5. Вставляем текст для озвучки до 1 000 символов. Нажимаем на кнопку Стоп, чтобы диктор сделал паузу в речи, и в сложных словах можем вставить ударную букву соответствующей кнопкой. Для этого надо выделить гласную букву и нажать на кнопку Ударная. На четвертой странице вписываете свой текст
  6. Дальше начинается процесс генерации видео в реальном времени При переходе на следующую страницу начинается генерация видеоряда
  7. Открывается окно редактирования полученного видеоряда: На пятной странице видим окно редактирования полученного видеоряда для добавления титров, изображений и другой дополнительной информации

Здесь мы можем добавлять изображения, титры, вставлять аудиофайлы и многое другое. Двойным нажатием на дорожку открывается окно дополнительных настроек.

Итог

Все больше компаний и энтузиастов разрабатывают интересные нейронные сети, которые облегчают нашу работу или веселят нас. Машинное обучение все глубже и глубже будет проникать в нашу жизнь. Как минимум низкоквалифицированные профессии, где всю деятельность человека можно будет заменить программным кодом, в скором будущем исчезнут с рынка труда. Творческие же профессии, как мне кажется, заменят не скоро. Поэтому можно сделать вывод, что нужно развиваться в сторону творчества и программирования. Это позволит вам в ближайшие десятилетия быть на плаву и чувствовать себя относительно неплохо!

Вконтакте
Класснуть
Отправить
Вотсапнуть

Реклама