«Живи в будущем и делай то, чего еще нет»
Расскажите, в чем суть вашей разработки? Чем она отличается от сотни других приложений-переводчиков?
Это словарь и переводчик с абсолютно новой механикой. Работает это так: показываешь пальцем на незнакомое слово прямо в книге, наводишь камеру и видишь перевод на экране.
Конечно, похожая технология есть в Google Translate и многих других переводчиках. Но проблема в том, что Google Translate переводит весь текст, который попал в обзор камеры, а не то слово, которое тебе нужно. Это удобно, допустим, если тебе нужно перевести вывеску или надпись на дорожном знаке. Но в случае с книгой — это крайне неудобно.
Для меня инсайтом стало понимание, что нет такого инструмента, который сделал бы процесс перевода естественным и незаметным. Я начал думать над вариантами, как можно это реализовать. И придумал перевод пальцем — это максимально естественный жест для человека.
Суть в том, чтобы взаимодействовать не столько с интерфейсом в телефоне, сколько с физическим миром. Тактильно наша механика позволяет создавать именно то ощущение, которое мы хотим получать от печатной книги. Она стройно ложится в этот процесс чтения и позволяет не отвлекаться на телефон.
С чего вообще все началось, как вы пришли к такой идее?
Как и все хорошие идеи, она появилась случайно, как естественная потребность. Есть такая известная формула от Пола Грэма, программиста и предпринимателя, основавшего знаменитый акселератор Y Combinator: «live in the future and do what is missing» — «живи в будущем и делай то, чего еще нет». То есть нужно просто понять, чего не хватает лично тебе и твоим друзьям — и сделать именно это.
В моем случае получилось именно так. Я, конечно, не могу сказать, что читать печатные книги на английском значит жить будущим. Возможно, весь этот проект — попытка закрыть детский гештальт. Я учился в 610 гимназии, знаменитой тем, что там школьники изучают древнегреческий и латынь. Мы читали на латыни «Записки о Галльской войне» Юлия Цезаря — и это очень сложный текст, с военной тематикой. Тогда еще не было смартфонов, и читать приходилось со словарем.
Часто бывало, что встречалось какое-нибудь незнакомое слово в тексте в несловарной форме, а найти его перевод не так-то просто. Например, в древнегреческом слово в прошедшем времени вообще меняет свой вид, так что его не узнать. Все это выливалось в бесконечное листание словаря, просто часами. Видимо, это отложилось где-то в моем сознании и трансформировалось в такое решение, которое может облегчить жизнь нынешним студентам и ученикам.
Когда мне пришла идея с пальцем, я был уверен, что кто-то это уже сделал. Все хорошие идеи вызывают это ощущение: «Не может быть, чтобы этого не придумали до меня». Это был процесс на несколько дней: погуглил, посмотрел несколько десятков переводчиков из App Store, поискал по ключевым словам — и ничего не нашел. Сразу стало понятно, что нужно делать. Точнее, что не сделать просто нельзя.
Помимо перевода пальцем, у нашего приложения есть еще одна уникальная функция — «sleep mode», то есть режим сна. Обычно процесс взаимодействия с телефонным переводчиком весьма неудобен: нужно взять телефон, разблокировать его либо своим пальцем, либо с Face ID, запустить приложение, вбить слово в переводчик, затем заблокировать телефон и снова положить на стол. И так каждый раз.
Мы же придумали решение, при котором наше приложение остается запущенным, но переходит в режим сна, когда вы кладете телефон на стол. То, что телефон бездействует, оно определяет с помощью акселерометра, камера затемняется, так как лежит на поверхности. В таком режиме все фоновые процессы и вычисления прекращаются, яркость экрана сокращается, и на нем появляется список последних переведенных слов. Так телефон становится чем-то вроде шпаргалки, при этом почти не тратит заряд аккумулятора. Когда пользователь снова берет телефон в руку, приложение мгновенно активируется — получается идеальный workflow. Можно сравнить его с лупой для чтения, которая лежит рядом, не отвлекает, но при этом всегда готова к использованию.
«Нам пришлось перепридумывать и делать все самим»
Сколько времени у вас заняла разработка?
От момента появления у меня этой идеи до создания первого работающего прототипа прошло около полугода. Первые два месяца я просто прорабатывал идею: делал ее более детальную концепцию, изучал рынок, продумывал бизнес-стратегию, думал, есть ли спрос, можно ли на этом заработать. Ведь продукт изначально и задумывался как коммерческий. Понятно, что перевод — это чаще всего бесплатная штука, но мы хотим за счет уникальности со временем все-таки начать ее продавать.
В течение четырех месяцев мы делали само приложение. Самым сложным и долгим этапом оказалась разработка технологии распознавания пальца и слежения за ним. Сразу выяснилось, что для нашего случая нет ни готового датасета, ни даже большого количества картинок в открытом доступе, которые можно было бы использовать для машинного обучения. Поэтому мы стали собирать датасет сами. Нам нужно было несколько тысяч фотографий разных пальцев: при разном освещении, с разным цветом кожи, в перчатках, с маникюром и без. Мы набрали около тысячи фотографий моих пальцев, пальцев моих друзей, родственников, знакомых — но этого было мало. Поэтому я разместил объявление для тех, кто ищет заработок в Интернете, и за 50 долларов получил 5000 фотографий.
Потом оказалось, что не было и готовой модели, которая решала бы нашу задачу. У нас задача заключалась в том, чтобы найти кончик пальца, то есть понять не то, где весь палец целиком, а понять, куда он показывает, найти точку на его кончике. У такой задачи чуть-чуть другая специфика, чем у наиболее распространенных нейронных сетей, которые умеют идентифицировать объекты и их классы. Нам пришлось перепридумывать и делать все самим, что заняло у нас где-то полтора месяца. Это было сложно, но помогало то, что у меня в ИТМО был небольшой курс по машинному обучению, который вела Ольга Большакова, за что ей огромное спасибо.
Параллельно работе над алгоритмом мы делали и прототип приложения, разрабатывали его дизайн. Еще два месяца ушло на доведение продукта до состояния продакшн: чтобы все кнопки стояли на местах, были правильного цвета, шрифты не съезжали, и вообще все было бы красиво и работало бы правильно, без багов.
Кто еще работает над приложением, кроме вас?
В нашей команде четыре человека. Мой коллега, бэкенд-разработчик Антон Югов, сейчас он учится на втором курсе бакалавриата в ИТМО. Его я нашел по объявлению в интернете. Он искал работу, а нам нужен был человек, который помог бы нам сделать серверную часть приложения на Python: поднять инфраструктуру, продумать схему API, сделать парсинг ответов из внешнего формата в наш, внутренний.
У нас есть iOS -разработчик, Лаки Ийнбор — он, кажется, закончил Политех. Его мне посоветовал знакомый, что было весьма кстати, ведь iOS-разработчиков очень мало. Дизайнер Егор Дубовицкий — коллега с моей бывшей работы, он занимался интерфейсом приложения. Я же делаю все по чуть-чуть: программирую — часть с машинным обучением я сделал полностью сам, —занимаюсь маркетингом, продвижением, организационными моментами.
«Это было моей мечтой — сделать продукт, который станет массовым»
Вам пришлось уйти с работы, чтобы полностью посвятить себя работе над проектом?
На самом деле я уже несколько лет в «свободном плавании». Мне не нравится слово «фрилансер», потому что предполагается, что он делает кусочек работы, я же делал проекты полностью «под ключ». Так что я себя называю single-handed студией. Это как полноценная студия, которая отвечает за конечный результат, но только ты все делаешь один.
До этого я накопил уже достаточно много опыта: я уже с первого курса работал программистом, правда, в сфере интерактивных инсталляций. Там специфическое программирование — инструмент, на котором мы это делали, назывался vvvv.org. Это интересный визуальный язык программирования, с его помощью можно очень быстро делать сложные вещи, например, анимацию, которая будет реагировать на движение руки с помощью популярного тогда контроллера Xbox kinect.
С третьего курса у меня начала очень быстро развиваться карьера в цифровом агентстве Deasign — это питерский филиал шведской компании. К ним я пришел как дизайнер — дизайном я увлекался с 15 лет, но больше в качестве хобби. Потом я у них же стал работать фронтенд-разработчиком и начал там делать сайты, что удачно совпало с учебой, где мы как раз проходили такой курс. В начале четвертого курса мне предложили стать креативным директором этого агентства. Эта работа требовала уже полной занятости, поэтому я больше не мог посещать занятия в ИТМО.
Я проработал арт-директором несколько лет, понял, что у меня уже накопилось достаточно знаний: я могу сам нарисовать сайт как дизайнер, написать его как программист и договориться о проекте с заказчиком. Я понял, что я могу сделать что-то для себя, свой личный проект. И я просто ждал идею, над которой я буду готов работать, которая будет близка мне по духу — классная, инновационная и нужная. Это было моей мечтой — сделать продукт, который станет массовым. Когда ты делаешь вещь, которая оказывается на тысячах и сотнях тысяч устройств, это такой восторг.
Вы не жалеете, что не доучились в ИТМО?
Я очень тепло отношусь к ИТМО и очень благодарен за все те знания, которые я там получил. Я помню совершенно потрясающий курс по программированию Ольги Большаковой и Юрия Чуйко, они тогда работали в Яндексе и давали очень актуальные знания из первых рук. У них я всегда учился с огромным удовольствием и до сих пор испытываю большую благодарность. Еще большое спасибо Татьяне Васильевне Родиной, которая вела у нас математический анализ — это было трудно, но полезно.
Вообще, знания, которые можно получить в университете, крайне важны. В ИТМО было очень много классных курсов, особенно по программированию, матанализу, матлингвистике и алгебре. Мы делали действительно крутые вещи, которыми, очевидно, никогда в жизни не будем больше заниматься — например, писать на Swift какой-то компилятор или интерпретатор кода Java, лексические разборы, другие сложные программистские задачи, с которыми в реальной работе ты не сталкиваешься.
Но они выводят тебя на высокий уровень понимания, а это очень важно. Но диплом я все же считаю формальностью. В современном мире очень важны знания, но не важны формальности и бумажки — но это сугубо мое личное мнение.
«Я бы хотел, чтобы у меня была такая штука, когда я учился»
Как вы думаете, насколько популярным станет ваше приложение? Ведь оно рассчитано на тех, кто предпочитает печатные книги электронным — таких ведь меньшинство.
На данный момент мы уже два с небольшим месяца находимся в App Store, и у нас чуть больше 15 тысяч пользователей. Пока что мы растем органически, без рекламы: те пользователи, что есть сейчас, узнали о нас либо из статьи, либо от своих знакомых.
Меня часто спрашивают: мол, печатными книгами никто не пользуется, никто их не читает. Конечно, рынок печатных книг в последнее время стал намного меньше, но эту ситуацию можно сравнить с виниловыми пластинками: несмотря на обилие стриминговых сервисов, тысячи людей продолжают слушать музыку на виниле — и это отдельный огромный рынок. Хотя, конечно, технически винил не нужен. То же самое и с книгами.
На самом деле у них очень много преимуществ, и многие люди предпочитают их электронным устройствам. Кому-то, например, просто нравится иметь физическую вещь, получать тактильные ощущения. Для некоторых — например, айтишников вроде меня — очень важно читать именно с печатных страниц, а не с экрана компьютера, за которым и так сидишь с утра до вечера. А программистам приходится очень много читать книг или документации на английском: ведь все передовые знания и технологии появляются сначала в английском сегменте, а к моменту перевода на русский уже теряют свою актуальность.
Еще одна значительная аудитория — студенты, в частности те, кто учит язык. Почти все преподаватели английского, с которыми я общался, говорят, что качественное изучение языка невозможно без печатных носителей: распечаток, учебников, книг. Считается, что полноценно выучить язык в смартфоне невозможно — нельзя достаточно долгое время фокусироваться на процессе, не отвлекаясь на соцсети, оповещения.
Чтение на иностранном языке и его изучение с нашим приложением из принудительного процесса превращается в увлекательное занятие: ведь постоянно заглядывать в словарь или печатать слова для перевода в каком-то другом приложении часто бывает утомительно и неудобно. Я бы хотел, чтобы у меня была такая штука, когда я учился.
Почему вы сфокусировались именно на iOS платформе? Этот выбор чем-то обусловлен? Планируете ли вы сделать версию под Android?
На самом деле никакого принципиального выбора не было, просто я всю жизнь пользуюсь устройствами на iOS и очень хорошо знаю как эту систему, так и привычки ее пользователей. Я знаю, как сделать на iOS хороший дизайн, чтобы он понравился людям. И это подтверждается на практике: нас уже отметили Apple, и сам App Store нас активно продвигает. То есть мы получились прямо в духе Apple.
Плюс наше приложение должно быть нативным. У нас много нагруженных функций: например, механика распознавания текста у нас непростая, наша нейронная сеть требует определенной скорости вычислений. Поэтому мы не можем использовать фреймворки для разработки кроссплатформенных приложений вроде React Native. Естественным образом мы упираемся в человеко-часы: если бы мы сразу стали делать приложение и на Android, и на iOS, мы бы потратили гораздо больше времени.
В будущем мы в принципе хотим сделать андроид-версию и сейчас ищем команду с опытом разработки андроид-приложений. Но сначала мы хотим укрепиться на рынке, понять, что наше приложение работает и «заходит» пользователям. Следующее, что нам нужно понять — сможем ли мы на этом заработать.
Как вы планируете коммерциализировать свой проект?
Наша основная стратегия сейчас состоит в том, что мы начнем масштабироваться, добавлять европейские языки — французский, испанский, итальянский, немецкий, португальский. Тот темп роста, который мы сейчас показываем, позволяет нам предположить, что через несколько месяцев у нас будет в районе 200-300 тысяч пользователей. И чем больше мы будем добавлять языков, тем проще ему будет расти за счет расширения географии.
Дальше наша задача — начать обкатывать монетизацию. В отличие от многих словарей, мы пока что предоставляем подробный перевод, показываем словарную статью. То есть мы даем несколько вариантов перевода каждого слова. Скорее всего, позже эти подробные переводы станут функционалом платной версии. Также мы будем добавлять в платную версию новые функции, например, перевод целых фраз и предложений, в том числе устойчивых выражений, идиом — мы уже работаем над этой механикой. Еще мы хотим добавить привязку к «Википедии»: например, ты не знаешь какой-то специфический термин — на своем языке или на иностранном — ты можешь показать на него пальцем, и откроется соответствующая статья в «Википедии».
Нам пока что сложно предсказать, в каком направлении мы будем развиваться дальше. Возможно, потом мы углубимся в сторону изучения языка и будем делать механики, которые помогут учить слова, грамматику. А возможно, станем такой энциклопедией, справочником. Мы посмотрим, что будет пользоваться большим спросом у пользователей.