«Яндекс» открывает направление по работе с большими данными. Презентация проекта, названного Yandex Data Factory, прошла во вторник в Париже, на конференции LeWeb. Компания будет предлагать свои собственные технологии, созданные для обработки больших массивов данных, для решения задач других компаний. Для «Яндекса» это редкая попытка предложить b2b-сервис, совсем не ориентированный на широкого потребителя.

Крупнейший русский поисковик разработал множество производительных алгоритмов для собственных нужд, объясняет руководитель проекта Евгения Завалишина, и они могут быть применены к самым разным данным, будь то в розничной торговле, телекоммуникациях или даже эксплуатации нефтепроводов. Природа данных не так важна, как взаимосвязи между ними. В какой-то момент в компании решили, что технологии должны найти прибыльное применение, и запустили проект. В первые месяцы сотрудники фабрики еще не знали, чем конкретно они могут быть полезны крупному бизнесу. «Мы приходили и говорили: здравствуйте, у нас нет продукта, но зато есть замечательные сотрудники и технологии. Давайте вместе подумаем, что бы мы могли совместно​ сделать».

Рынок больших данных оценивают по-разному (IDC предсказывает его рост к 2018 году до $60 млрд), но в любом случае это десятки миллиардов долларов, напоминает Завалишина. А у «Яндекса» есть два преимущества на этом рынке. Первое – это собственная Школа анализа данных и факультет в Высшей школе экономики, поставляющие профессиональные кадры: в Data Factory, благодаря им, работает уже пять стажеров. Второе – алгоритмы: «Самые большие инвестиции в разработку собственной технологии мы уже сделали».

Завалишина вернулась в «Яндекс» после того, как сдала дела в предыдущем своем проекте – «Яндекс.Деньги», проданном полтора года назад «Сбербанку». Первые сотрудники Data Factory были наняты в начале года, а к декабрю компания уже завершила шесть проектов. В работе, говорят в «Яндексе», находится еще двадцать; в течение года сотрудники фабрики попытались продать свои услуги 200 компаниям по всему миру.

Один из первых успешных проектов был выполнен для крупного розничного банка (его название, как и других партнеров, в компании пока не называют). Задача состояла в том, чтобы повысить эффективность рекламных рассылок клиентам. «У нас не было гарантии, что (программа) Matrixnet, формирующая релевантность поисковой выдачи, поможет в решении маркетинговых задач за пределами интернета, – говорит Завалишина, – но оказалось, что это так».

Помимо банка, Фабрика данных сотрудничала с африканским сотовым оператором (оценивая вероятность оттока клиентов), дорожно-эксплуатационной службой (предсказывая места возможных аварий) и «крупной авиатехнической корпорацией» (износ деталей). Вместе с Accenture, Data Factory запустила совместный проект по предотвращению неавторизованного доступа к нефтепроводам. Американская компания запускает инфраструктуру, включая беспилотные летающие устройства, которые курсируют над трубой и снимают окрестности, а созданная в «Яндексе» технология распознавания образов определяет, есть ли поблизости люди или автомобили. Сотрудничество с системными интеграторами позволяет Data Factory сфокусироваться на технологиях и не заниматься инфраструктурой.

Инвестиции в фабрику — незначительны для бюджетов «Яндекса»: компания фактически переупаковывает свои программы под цели клиентов. Штат сотрудников, которые трудятся над проектом, составляет около 30 человек, говорит Завалишина. Фабрика готова заниматься проектами в самых разных отраслях, но главные надежды связаны с розничными предприятиями, по своей природе ценящими эффективность. «Розничный бизнес совершенно открытый. Если ты готов повысить эффективность продаж на три процента, все будут счастливы», – объясняет Завалишина. В не самые прозрачные отрасли, вроде здравоохранения, Data Factory пока не идет.

Алгоритмы «Яндекса» готовы попробовать справиться с любой задачей, но только в том случае, если можно измерить результат. Если сделать этого нельзя, то «машинное обучение просто не будет работать». В остальном она готова браться за любые данные, если их достаточное количество, и самые разные задачи. «Все стартапы, которые я видела, начинались с продукта. У нас как раз пока нет продукта, но [есть] сильные пилотные проекты и убеждение, что мы многое можем сделать», – говорит Завалишина. Пока это только убеждение – Data Factory еще предстоит получить первую оплату за выполненные проекты.