title image

«Рынок NLP сегодня очень перспективен». Инсайты от CEO стартапа Lingvanex

«Мы вырастили большой дуб из маленького желудя», — говорит про компанию Lingvanex её CEO Алексей Рудак. Без внешних инвестиций он с командой запустил переводчик, работающий на всех мыслимых платформах, и собрал больше 100 000 активных пользователей. Алексей рассказал, почему надо идти на рынок машинного перевода, как найти свою нишу и какие вакансии открыты в его команде.  

Что такое Lingvanex

Стартап Lingvanex решил превзойти конкурентов функциональностью. Команда делает переводчики максимально доступными: создает приложения для мобильных платформ, умных часов, голосовых ассистентов Amazon Echo и Google Home, дополнения к браузерам, клиенты для Windows и Mac. 

Кроме того, у Lingvanex есть чатботы для мессенджеров, клавиатура с переводом и перевод надписей на изображении, голосовой переводчик для конференций и другие решения, которые пока не вышли на рынок.  

Такое разнообразие нужно для поиска наиболее удобных сценариев применения переводчика пользователями и для дальнейшего масштабирования проекта. Все платформы обращаются за переводом к одному API компании Google, который поддерживает наибольшее количество языков.  

Малый масштаб позволяет команде Lingvanex быстро внедрять изменения в свои продукты и тестировать смелые гипотезы. В этом конкурентное преимущество стартапа. Сейчас команда идет дальше и строит свою систему перевода, чтобы не зависеть от Google и зарабатывать больше.  

Lingvanex

Алексей Рудак питчит проект сети бизнес-ангелов Angels Band, фото: Глеб Соколовский

Почему именно переводчик

— Я сделал больше шестисот простых приложений для iOS для проверки бизнеса в разных нишах. Они были очень простые: одна конкретная функция и пара кнопок, которые для нее нужны. Так я сделал спортивные, музыкальные, образовательные и другие приложения. 

Приложения я продвигал с помощью оптимизации названий и ключевых слов под высокочастотные поисковые запросы. Покупной трафик не использовал. За три года приложения скачали больше 10 млн раз. 

В приложениях была встроена реклама, инструменты для внутренних покупок, так я мог оценить lifetime value каждого пользователя в разных нишах и конверсию в них. Самыми востребованными и прибыльными нишами оказались музыкальные приложения, GPS-трекеры, фитнес, переводчики, рисование.

Переводчики мы выбрали потому, что поисковые запросы распределены равномерно по большому числу низкочастотных запросов. Это дает возможность конкурировать с крупными игроками без больших бюджетов на маркетинг. 

В нише музыкальных или спортивных приложений такой возможности нет. Пианино можно назвать еще фортепиано или роялем, трафик по всем этим запросам может скупить крупная компания с большим бюджетом, когда захочет зайти в хорошую нишу. 

Переводчик люди в целом не ищут просто как «переводчик», они ищут его как перевод с одного языка на другой. В мире сотни языков и таких запросов очень много. Даже если крупные компании будут продвигаться по словам «переводчик», «словарь», то можно собрать достаточно пользователей с запросом «перевод на хинди».

Второй причиной стало активное развитие технологий обработки естественного языка (NLP). Технологические лидеры отрасли активно делятся своими наработками, чтобы привлечь в нее больше стартапов и так ускорить развитие. 

Конкуренция с гигантами

Область машинного перевода сегодня намного менее развита, чем, например, обработка изображений. Крупным компаниям почти неоткуда брать «свежую кровь» новых решений и быстрых команд. Чтобы расти, они делятся технологиями и активно поддерживают стартапы. Сегодня для успеха важно создать и возглавить мощное сообщество разработчиков.

Google, Microsoft, Samsung для нас не конкуренты, а партнеры. Также как и более нишевые игроки этого рынка: Systran, Promt и другие. Они выкладывают в открытый доступ свои последние разработки, приглашают обращаться за советом, проводят крупные конференции.

За стартапами, которые делают NLP-продукты, внимательно наблюдают. Когда у кого-то получится заметно улучшить качество продукта и бизнес-показатели, эту компанию купят за хорошие деньги.

Сегодня рынок NLP очень активно растет. Год назад мы были на конференции в Париже, которую организовал Systran. Там собралось около 30 команд, в том числе ребята с eBay и Booking. Они тоже делают свои системы перевода для того, чтобы не покупать его у Google или каких-то своих нужд.

То есть интерес к теме сейчас большой и рынок NLP-решений будет активно расти. Сегодня, я думаю, в мире около 50 сильных команд работают в той же области, что и мы. Но через пару лет их будет в разы больше.

Мы начали намного раньше, у нас уже большой опыт и сотни тысяч пользователей. Это наше преимущество. Если бы я стал заниматься технологиями машинного зрения или дополненной реальности, то был бы вынужден конкурировать с сотнями других стартапов, которые уже работают на этом рынке.

Бизнес-модель

Мы начинали с простых приложений, которые монетизировались за счет рекламы. Когда количество установок приложений перевалило за 5 млн, а месячная аудитория достигла 100 000 пользователей, затраты на покупку API перевода у Google стали слишком высоки.

Чтобы свести юнит-экономику, мы добавили больше рекламы и разблокировку части функций в платной версии. Это оказалось не лучшим решением, так как часть пользователей из-за этого ушла. А выручка от оставшихся не всегда покрывала затраты на покупки API Google, он достаточно дорогое.

Мы нашли баланс рекламы и получаем стабильный доход, который вкладываем в развитие. Чтобы расти, нам нужно сделать свое API перевода, чтобы не платить за это корпорации.

С ним можно пойти тремя путями: продавать API другим компаниям, сделать более качественные приложения для конечных пользователей и лучше монетизировать их, либо же продать компанию. Ведь команда с работающим, прибыльным NLP продуктом будет интересна многим. Уже интересна.

Сейчас мы развиваем и продукты, и технологию. Если в создании своей «переводящей машины» достигнем успехов, то уйдем в B2B. Как говорят инвесторы, перспективы там гораздо больше, чем в B2C-сегменте.

Фото: Глеб Соколовский

Куда двигаться дальше

Самым главным челленджем для нас сегодня остается создание своей системы перевода. Это вопрос одновременно данных и вычислительных мощностей.

Сегодня мы используем домашний «обогреватель» на двух видеокартах RTX 2080 Ti для проверки небольших моделей.  Если учесть стоимость серверов аналогичной производительности у AWS, то оборудование окупилось за две недели беспрерывного использования.

Чтобы сделать следующий шаг, нам нужно на два порядка больше вычислительной мощности. Планируем использовать машины NVIDIA DJX-2, их можно взять в лизинг, если иметь юрлицо в США. На сегодняшний день это лучшее предложение по соотношению цена/производительность.

Пока мы готовим данные для обучения большой сети. Их нужно много-много. Мы используем открытые источники и свои наработки.Также есть способы добиться более высокого качества перевода с малым объемом данных. Этими способами делились специалисты Systran на мастер-классе в Париже. Когда закончим с данными, просто возьмем в аренду DJX-2 или купим более дешевый вариант. И уже там будем делать более качественные переводы.

Но сейчас наша приоритетная задача — сделать уже работающие продукты лучше. У нас много приложений и клиентов. Нужно дать им удобный и бесперебойно работающий переводчик, доступный на любой платформе.

Сегодня поддержкой всех работающих сервисов занимается команда из 10 человек и этого нам явно не хватает. Поэтому мы планируем привлечь seed-раунд инвестиций, чтобы усилить команду и доработать продукты.

Мы развиваем перевод между основными европейскими языками:, испанским, немецким, французским, русским, итальянским. На них приходится примерно половина запросов на перевод. То есть уже очень много. На все остальные языки, их 150 в мире, приходится вторая половина. Так что важно для начала сделать основные и закрыть половину потребностей. А потом идти в другие.

Вакансии в стартапе

Команда Lingvanex ищет двух, а лучше трех опытных product-менеджеров, которые прошли огонь и воду запуска успешных продуктов минимум трижды. 

Также всегда нужны хорошие маркетологи. Даже если не будет такой вакансии, то всегда готовы взять толкового человека и помочь ему вырасти вместе с компанией.

Нам очень нужен специалист по data-sciense. Знающий Python, TensorFlow и, в идеале, C++.  

Предлагаем зарплату на уровне рынка и приятный опцион. Пишите сюда!

Заглавное фото: Глеб Соколовский

Интересно? Поделитесь с друзьями!
  •  
  •  
  •  
  •  
  •  
  •  

Похожие статьи

Imaguru Video

Популярное