Президент и генеральный директор группы компаний ABBYY о том, как и почему надо вести передовые разработки
Один из лидеров российского IT-рынка ABBYY, президент и генеральный директор группы компаний ABBYY
Сергей Андреев написал очень увлекательную статью в HBR, в этой части текста о глобальной конкуренции, с с компанией Google:
Теряли надежду и меняли вектор
Конкуренция в России, а потом выход на зарубежные рынки отвлекли нас от перевода, но мы продолжали
думать об этой задаче и внимательно смотрели, как устроены
существующие программы — не только в России, но и в мире. Везде
применялись довольно упрощенные подходы с невысоким потолком качества.
Мы стали присматриваться к научным концепциям и заделам работ и
обратили внимание на лингвистический подход. Он основан на полном
анализе предложения: от морфологии и синтаксиса переходит к семантике.
Разбирает, как слова связаны друг с другом, а потом приводит эти
слова к понятиям, которые за ними стоят.
И получается некое
семантическое дерево, которое универсально, то есть мало зависит от
выбранного языка.
Было немало рисков, которые были нам вначале не ясны
и требовали исследований. Например, можно ли решить проблему
комбинаторного взрыва при анализе, ведь чем длиннее предложение, тем
больше, соответственно, количество возможных деревьев. Можно ли
погасить этот взрыв? Для начала мы постарались оценить реализуемость
разных подходов и концепций и поручили относительно небольшой группе
людей выстроить архитектуру всей будущей системы. За несколько лет
было подтверждено, что она жизнеспособна, и тогда мы подошли к стадии
производства, что означало более масштабное и точное описание языков.
В 2006—2007 году мы начали набирать лингвистов и людей из смежных
областей под этот проект (его назвали Compreno). Мы были уверены, что
этот подход приведет к качественному машинному переводу, который можно
использовать в коммерческих целях.
В те же годы свои разработки,
основанные на совсем другом, статистическом подходе, начал вести
Google, который накопил очень большую базу параллельных текстов
(оригинал и перевод). Без такой базы «статистический» перевод
построить нельзя, а была она только у Google. У статистического
подхода есть существенные ограничения: приемлемое качество перевода
получается, только когда у интересующей вас языковой пары есть очень
много параллельных текстов. Например, в интернете много англо-русских
текстов общей тематики, и их перевод с помощью статистической системы
получается вполне пристойным. Но если переходишь в специализированную
область, где параллельных текстов меньше, качество перевода падает
очень быстро. А если работаешь с непопулярной парой языков, то перевод
плох всегда. Русско-немецких переводов в десять раз меньше, чем
русско-английских, и поэтому Google, когда переводит с немецкого на
русский, делает это в два этапа: сначала c немецкого на английский, а
потом с английского на русский. Появляется много смешных ошибок — как
в игре в испорченный телефон.
Тем не менее для массового пользователя
все это не так важно, ведь Google Translate — бесплатный сервис. И мы
поняли, что наша бизнес-логика ломается, так как объем
платежеспособного спроса бесплатный аналог выжигает, как напалмом.
Даже если ваш продукт лучше, вы не выручите столько денег, сколько
нужно для поддержания разработки. Мы проанализировали, сколько еще
усилий нам потребуется, чтобы люди захотели платить за нашу программу,
имея бесплатный Google Translate, и оказалось, что экономика не
срабатывает. Так несколько лет назад мы поняли, что это не самое
интересное дело с точки зрения бизнеса. Но мы задумывались над тем,
что будет, если переводчик не выстрелит еще раньше. И знали, что
положение наше неплохое, потому что наша базовая технология
универсальна.
Казалось бы, шансов выжить нет, но наличие цели, смысла, настойчивость дает решение и компания меняется:
Научились извлекать смысл
Расчет был на то, что если ты подобрался к смыслу, который стоит за
словами и буквами, то, конечно, сможешь использовать этот анализ не
только для перевода. Объем информации в современных ИТ-системах растет
с непостижимой скоростью, и пользоваться ею все труднее. Притом, если
работать со структурированной информацией хоть как-то научились, то с
неструктурированной (а ее в корпоративных системах около 80%) провал
полный. Даже найти документ внутри одной компании довольно сложно, не
говоря уж о том, чтобы извлечь или сопоставить разные сведения.
Известные всем поисковики помогают мало. Они используют данные по
предыдущим запросам и ранжируют результаты в зависимости от того, на
что больше кликали. Это хороший трюк, если тебя интересует то же
самое, что большинство людей, но для содержательных исследовательских
целей он не срабатывает. Чтобы не утонуть в информации, человечеству
придется рано или поздно подняться над статистикой и обратиться к
смыслу, стоящему за словами.
Убежденность в этом поддерживала нас все это время. Мы отчетливо
видели коммерческую логику в направлении, которое можно назвать
управлением знаниями или интеллектуальной обработкой информации. Здесь
много разных задач, и одна из простых — автоматическая сортировка.
Допустим, к вам идут платежки, в которых написано: «оплата по договору
номер Х за электроэнергию в апреле», или «плата за подключение
мощности Y», или «аванс за Z», и ваши бухгалтеры разносят их
постатейно. Почему бы не классифицировать платежи автоматически,
сэкономив на ручном труде и ускорив процесс? Наша программа
справляется с этим отлично.
Мы ведем пилотный проект с Госдумой: здесь требуется распределить по
департаментам обращения граждан. Люди часто адресуют их не тем
специалистам, и, чтобы выбрать правильного «ответчика», надо прочитать
и понять текст обращения. Технология делает это быстрее. Ее применяют
и службы технической поддержки разных компаний. К ним поступает много
однотипных запросов, и система, получив и проанализировав письмо
клиента, определяет, требует ли вопрос внимания специалиста или ответ
уже был когда-то дан и его можно извлечь из базы.
Банкам, чтобы принять решение о выдаче кредита какому-нибудь
предприятию, нужно собрать о нем все сведения: от службы судебных
приставов, из Высшего арбитражного суда и судов общей юрисдикции, из
СМИ и социальных сетей. ИТ-решение умеет извлекать и анализировать
разные сведения и тем самым экономит часы, а то и дни рутинной работы
и уменьшает финансовые риски банка.
Наше движение от массового рынка в сторону корпоративного совершенно
закономерно: как заказчик организация внятно формулирует, что она
хочет делать со своей информацией. Рынок B2B гораздо проще понять и
занять новой технологией. К тому же на него редко проникают
«бесплатники»: они в основном ориентируются на усредненную массу.
Вначале наша Compreno воспринималась, как первые самолеты. Люди видели
волшебство, но сообразить, что это будущий бизнес, могли не все.
Этажерка братьев Райт тоже не выглядела как бизнес, но история
показывает, что, если что-то взлетает, оно постепенно собирает всю
нужную инфраструктуру. Сейчас у нас в России более 25 пилотных
проектов. Перспективы и задачи бизнеса понятны.