«Частной жизни больше нет», — говорит Роман Карачинский, цитируя основателя Facebook Марка Цукерберга. 10 августа россиянин представит виртуальному миру новостной агрегатор нового поколения — News360. Ресурс существует уже почти год, но новый вариант программы, утверждают ее создатели, должен изменить то, как люди привыкли читать новости. Подборка news будет сугубо индивидуализирована и основана на информации, которую пользователь сам обнародовал в различных социальных сетях, а Карачинский со своими коллегами внимательно проанализировал. The New Times встретился с 25-летним создателем News360 и поговорил о его программе и мире, в котором за комфорт надо платить полной открытостью
Почему вы делаете англоязычный ресурс?
Потому что для нас сейчас важно взять самый большой рынок и на нем стать первыми. В 2013-м мы сделаем версию на русском языке, равно как и на других. Нам интересны, например, японцы, которые очень много читают новостей и очень много ездят в поездах, с iPad практически все, поэтому там очень большая аудитория, которая могла бы нам быть полезна.
Персональный мир
Но ваша программа основывается на лингвистическом анализе. Ей все равно, какой язык?
Методики одинаковые, и вопрос адаптации языка довольно тоже простой. То есть просто надо взять морфологию, прикрутить методы разбора структуры предложений — и все. Самая основная работа — это составить онтологию, потому что в Японии совершенно другой мир, там совершенно другие политики, совершенно другие компании, совершенно другие интересы у людей. И основная работа — это составить правильную модель их понимания мира. Но если есть методика, то это все делается довольно быстро. Что касается России, то здесь пока мало у кого есть iPhone, iPad и прочие подобные устройства, и новости в большинстве своем не такие интересные.
А почему вы решили делать именно новостной агрегатор?
Потому что Google News, как в 2001 году его сделали, так практически и не улучшали с тех пор, и он уже безнадежно устарел. Он хорошо работает, когда задается вопрос из серии «вообще»: что происходит в мире или в Америке сейчас, но когда ищешь информацию по более узким темам, он работает очень плохо, сразу видна куча ошибок, плохо выбирает новости и ужасный интерфейс. Google+ классно они сделали — привлекли товарища, который сделал первый макинтош, но все остальные продукты у них страдают. А у нас уже была платформа — «Медиалогия», мы ее заново переписали на английский язык и с учетом огромного англоязычного контента, потратили на это пять месяцев, в октябре 2010-го выпустили первое свое приложение для iPhone и сделали приложение для App Store. Мы думали: выпустим тихо, посмотрим, как народ прореагирует, и потом начать его как-то продвигать. Но уже через две недели после выпуска приложения нас поместили на главную страницу App Store. Мы стали получать огромное количество позитивного и конструктивного фидбека от пользователей. В марте выпустили приложение для iPad, который тоже через неделю Apple поставил на главную свою страницу: средняя оценка пользователей 5 из 5.
У Angry Birds**Суперпопулярная игра для i-гаджетов столько же.
Ну да, а в нашей новостной категории единственное приложение, которое имеет тоже 5 из 5 — это Flipboard… Так вот дальше мы выпустили приложение для Windows Phone 7, два месяца назад — для Андроидных таблеток и три недели — для Андроидных смартфонов. Наша цель — покрыть все основные мобильные платформы, и буквально сейчас мы выпускаем еще веб-версию, которая все это свяжет. Мы хотим сделать самый лучший новостной навигатор: мы посмотрели на Google News, посмотрели на все мобильные приложения тоже в этой сфере и подумали, что мы можем сделать намного лучше. И как мне кажется, нам удалось сделать лучший агрегатор новостей. А сейчас, в августе, мы делаем еще один принципиальный шаг: агрегатор персональных новостей.
Новости нон-стоп
Разве другие до вас это не делали?
Делали. Десятки лет уже разные компании пытаются разными способами это делать, но это ни у кого никогда не получалось сделать хорошо. Мы использовали другой подход. Мы первые, кто делает персонализацию новостей на основе глубокого семантического анализа, где мы очень хорошо понимаем, о чем текст. Обычно тот же Google делает анализ новостей, но на статистической основе, то есть он смотрит на похожесть двух статей или похожесть двух пользователей, и потом делает выводы на основе этого: если мне нравится статья А и статья Б похожа на статью А, то, значит, мне должна понравиться статья Б.
Ну как Last.fm музыку подбирает.
Да. Фильмы рекомендуют, на Ozone — ботинки. Но с контентом, с текстом это работает хуже, потому что, во-первых, новость — это очень времязависящая вещь, то есть нет времени набрать статистику: через час с момента выхода новости, она уже не такая интересная, через три часа — вообще неинтересная. Люди хотят на мобильных устройствах, в интернете видеть новость — своего городка или глобальную — моментально. Если ресурс этого предоставить не может, им просто перестают пользоваться. Таким образом, нам надо было сделать программу, которая очень быстро могла бы проводить контент-анализ. Второе, она должна понимать, насколько та или иная статья действительно новая, и отсекать шум вокруг новости. Алгоритмы такого семантического анализа сложны, но известны. Важно набрать то, что мы называем онтологией. Онтология — это картина мира: люди, которые участвуют в новостях, компании, темы, кто кем владеет, какой профиль у той компании или иной компании. Короче, сейчас в нашей онтологии 700 тыс. разных понятий. Google для того, чтобы предоставить такие персонализированные новости, какие будет давать News360, потребуется полгода заходов на ресурс пользователей. Мы же используем ту информацию в интернете о себе и своих интересах, которую люди оставляют уже пару лет в Facebook, год-полтора в Twitter, в Google Reader — естественно, для этого пользователи должны дать нам разрешение на доступ к их аккаунтам.
И третье, что важно, — это то, что мы хотели сделать персонализацию полностью прозрачной для человека, чтобы он понимал, как мы составили профиль его интересов. В Америке есть такой политический активист Илай Парисер (Eli Pariser), и он в этом году выпустил книгу под названием The Filter Bubble. Короче, история такая: как-то он на двух разных компьютерах одно и то же забил в Google и обнаружил, что результат поиска на одном компьютере оказался совершенно другим, чем на втором. Решил разобраться, почему и как это работает. Собрал 100 своих друзей по всей Америке и в других странах, попросил их поискать какие-то одни и те же вещи — в частности, про нефтяную компанию BP. Оказалось, разным людям Google рекомендует читать разные вещи. Республиканец, живущий в Нью-Хемпшире, получает по BP информацию, как инвестировать в BP, а демократ, живущий в Нью-Йорке, получает ссылки на скандал про разлив нефти в Мексиканском заливе. Вывод Парисера: Google за кулисами чего-то там подстраивает — может и с хорошими намерениями дать человеку то, что он ищет, но в результате это искажает картину мира, не дает человеку объективного знания о проблемах этого мира. А это плохо для демократии. Короче, мы хотим, чтобы пользователь News360 понимал, что мы ничего не подкручиваем за его спиной, мы просто внимательно проанализировали то, что он сам определил как свой круг интересов в социальных сетях — Facebook, Twitter и на таких утилитарных ресурсах, как Google Reader, и в Evernote — это для начала, потом добавятся и другие ресурсы.
Можете привести пример, как, используя мои два абзаца в Facebook или 140 знаков в Twitter, вы определите, какие новости меня интересуют?
Скажем, вы написали, что Барак Обама вам смертельно надоел, почему он не может разобраться с этим потолком госдолга, какого черта, да?! Для нас это индикатор: в сфере ваших интересов политика, госэкономика, будущие выборы. Да и еще Обама вам не слишком симпатичен…
…и если вы определили, что я не люблю Обаму или Путина, то вы мне будете показывать только негатив на них?
Нет, наша идея как раз состоит в том, что мы даем точки зрения от разных СМИ плюс то, что в YouTube, на телеканалах, фотографии плюс историю в развитии.
Так вот, мы смотрим не только ваши комментарии, но и ваши лайки**В Facebook пользователь может не оставлять комментария, а просто отметить — like (понравилось) — пост приятеля по Сети. То есть любой текст, который вы пишете, любая оценка, которую вы даете, изменение в вашем профиле в социальной сети, короче, все, чем вы делитесь с другими, программа берет на заметку, то есть проводит через лингвистический процессор. В Twitter мы тоже смотрим на его данные о себе, которые он заполнил и позволил нам увидеть, что он твиттит, за чьими сообщениями следит, кого заносит в свой список предпочтений.
Смотрящие
Вы говорите, «мы смотрим»? Это что значит?
Грубо говоря, у нас есть такой робот, который после того, как вы нам дали доступ в ваш Facebook, идет туда, смотрит на ваш профиль, смотрит на все, что вы писали, смотрит на все, что вы комментировали, на все, где вы нажимали Like, складывает это в один текст…
И какой объем информации обо мне вы набираете?
В машинных терминах не так много — несколько десятков мегабайт. И потом это анализируем. И на выходе получим 50–100 ключевых для вас терминов, из которых складывается «дерево» ваших читательских интересов.
Другими словами, если я хочу воспользоваться таким удобным сервисом, как ваш News360, то за это я расплачиваюсь тем, что открываю вам свою жизнь — как минимум в социальных сетях.
Да, во всяком случае ту ее часть, о которой вы решили рассказать в своем Facebook, например.
Хорошо, я вам дал разрешение сканировать мой Facebook или Twitter. А плохой человек, Большой Брат, может это сделать без моего разрешения?
Ну, наверное, по решению суда. Или можно каким-то сложным шпионским образом как-то зафрендить меня или получить доступ к аккаунту моего друга, тогда через моего друга можно полностью прочить все, что интересно про меня.
Государство — оно может следить за всеми своими гражданами?
Если захочет, наверное, сможет. У спецслужб есть способы мониторинга телефонов, почты. Тот же Google следит сейчас за всеми своими пользователями — сколько их, допустим, миллиард. Почему государство не может это делать? Тоже может, если поставит себе такую цель. Мощности для этого уже существуют. Вопрос, что подразумевается под «следить». Можно пытаться для всех пользователей интернета составить какой-то там сложный профиль и пытаться по каким-то статистическим признакам отфильтровать опасных, или несогласных, или еще что-то. Но это возможно, только если государство имеет контроль над всеми телекоммуникационными сетями, как в Китае. В Америке, например, это намного сложнее, просто потому, что там телекоммуникационная инфраструктура приватизирована. И есть довольно хорошее законодательство, которое предотвращает доступ государства к этим телекоммуникациям без сложных процедур.
Выбор
Частная жизнь умерла?
Да, частной жизни больше нет. Если человек пользуется интернетом, он должен быть к этому готов. И много людей, особенно на Западе, вот такую открытость делают своей идеологией: мне нечего скрывать. Если вы задумаетесь, то это форма такого внутреннего освобождения.
Отсутствие страха дает свободу.
Да.
Но это также означает, что защита частной жизни становится элитарным продуктом, который требует больших денег, так?
До какой-то степени. Скажем, политики, которым есть что скрывать, или бизнесмены, которым не надо, чтобы информация о их финансовых делах стала публичной. Или просто людям, которые не хотят быть заметными. Я знаю людей, которые взяли за правило: ничего не постить в информации, ни с кем и ничем по интернету не делиться, ничего не лайкать — они просто читают, ведут себя как наблюдатели. Но и они, наверное, так или иначе оставляют за собой, как мы это называем, «хлебные крошки». Это такое обязательное зло — плата за пользование технологиями, за удобство.
Возвращаясь к News360, сколько человек у вас сейчас работает?
20.
И как вы собираетесь на этом зарабатывать?
Сейчас — никак, сейчас нам главное нарастить аудиторию. Нашим сервисом уже пользуется около полумиллиона человек. И это только начало. Что касается денег, то все идет к тому, что люди будут платить за качественный контент.
Роман Карачинский
Родился 28 августа 1986 году в Москве. В 2001-2006 годах учился в University of Waterloo (Канада), изучал информатику (computer science). После окончания обучения вернулся в Россию, до 2010 года руководил проектными продуктами в компании Медиалогия. С 2010 года занимается News360. В начале августа 2011 года переезжает в Пало-Альто, Калифорния, чтобы открыть отделение News360 в Силиконовой долине
Tweet