Как менялся Google
Сегодня Google исполнилось 19 лет. За время своего существования поисковая система достигла по-настоящему выдающихся достижений. Например, по статистике за 2017 год поисковый сайт ежедневно обрабатывает порядка 41,34 миллиардов запросов и ежемесячно индексирует свыше 25 миллиардов веб-страниц (а за все время проиндексировано было более 60 триллионов веб-документов). Множество сетевых продуктов компании – от Google Maps до Google Translate – пользуются огромной популярностью. Надо также заметить, что интерфейс программы поддерживает около 200 языков.
В 2016 году в рамках форума Google Performance Summit корпорация назвала примерное количество поисковых запросов, которые она обрабатывает по итогам года. Несмотря на то, что предельно точной информации от Google CEO-сообщество так и не получило, то, что было озвучено, позволило сделать поражающий вывод. По сведениям официальных представителей Google, поисковый гигант ежегодно обрабатывает «триллионы поисковых запросов». Эксперты предположили, в свою очередь, что речь может идти как минимум о двух триллионах запросов (и это еще самые пессимистичные предположения). Такие предположения основаны на официальных данных за 2012 год, которыми Google поделился с общественностью. Тогда стало известно, что этот показатель равнялся 1,2 триллиона. За четыре года работы поисковая система, скорее всего, увеличила этот показатель как минимум в два раза.
Однако вспомним, как менялись показатели с конца прошлого века. Тенденция роста наблюдается за поисковой системой с 1999 года, когда в год обрабатывалось порядка одного миллиарда поисковых запросов (корпорации с момента регистрации домена на тот момент было только два года). Через год, в 2000 году, число обрабатываемых запросов выросло в 14 раз, и цифра составила 14 миллиардов. В период 2001-2003 годы поисковая система обрабатывает более 55 миллиардов запросов, а в 2004-2008 годы показатель достиг отметки в 73 миллиарда. Резкий скачок происходит в 2009 году, когда число обрабатываемых запросов в год превышает 365 миллиардов, а с 2012 года счет идет на триллионы. В 2013 году, по официальной статистике Яндекса, поисковая система обрабатывала 250 миллионов поисковых запросов в день (что составляет 127 750 миллиардов запросов в год). И, наконец, в 2016 году цифра перевалила за два триллиона.
Основываясь на вышеприведенных цифрах, эксперты говорят о том, что Google обрабатывает в секунду 63 тысячи поисковых запросов, в минуту – 3,8 миллиона; в час – 228 миллионов; в день – 5,5 миллиарда; в месяц – 167 миллиардов.
А как же визуально менялся поисковик? Надо заметить, на большинстве видео о том, как менялся Google, невооруженным глазом видно, что тяготеют разработчики компании к минимализму. Однако именно минимализм становится как предметом любви к поисковой системе, так и предметом раздражения.
Охват пользователей
Перенесемся в рунет. Весной 2016 года СМИ сообщили о том, что Google стал лидером рунета, однако отрыв от конкурентов был незначительный. Есть также мнение, что Google выиграл у Яндекса в рунете еще в 2015 году. Тогда аналитики Morgan Stanley основывались на анализе результатов мониторинга, сделанного в период с 2012 по 2014 годы. Банк в течение указанного периода дважды в год проводил опросы интернет-аудитории, последний из которых пришелся на декабрь 2014 года. В исследовании участвовали 30 000 респондентов, а вывод экспертов был сделан на основе изучения поведения 1 500 пользователей. Надо отметить, что в этот же период, по данным TNS Gallup Media, поисковик Яндекса существенно превосходил Google по ежемесячному охвату аудитории. У Яндекса 62 миллионов пользователей против 49,4 миллионов у интернет-гиганта. Примечательно, что долгое время компания учитывала только тех пользователей, которые заходили в интернет с персональных компьютеров и ноутбуков.
Согласно отчету, Google доминировала среди пользователей мобильных устройств и приложений. Эксперты связывают такую тенденцию с работой браузера Chrome. Кроме того, Google более популярен среди российской молодежи, 88% из которой пользовались сервисами «Корпорации добра» и только 64% — Яндексом.
В 2016 году Google вновь стал самым популярным интернет-сервисом в России и обошел Яндекс по совокупной месячной аудитории (этот факт TNS признали). Из статистики TNS за апрель 2016 года хотя бы раз в месяц сайтом Google и приложениями для мобильных устройств пользуются 20,5 миллионов человек (у Яндекса показатель составил 20,4 миллиона).
Алгоритмы – залог успеха
Сила поисковой системы Google (как и Яндекса, и других поисковых систем) – в ее алгоритмах, которые она использует для поиска данных. И обыватели, и IT-профессионалы часто говорят о том, что предпочитают Google потому, что он лучше справляется с определенными задачами – например, с поиском авиабилетов. Но в то же время с поиском товаров лучше работает Яндекс.
«На некоторых тематических направлениях поиска алгоритмы Google дают более точный результат, а на некоторых менее точный. Есть у компании Google Knowledge Graph – база знаний, с помощью которой они улучшают поиск по фактам, событиям, именам, по географическим названиям. Плюс есть Google Scholar и ряд других сервисов, привлекающих аудиторию. Здесь стоит обратить внимание на глобальные сервисы цитирования, которые у Google, возможно, срабатывают эффективнее. В то же время у разных поисковых систем неодинаковый доступ к данным – к некоторым документам, к которым есть доступ у Яндекс, у Google его нет», – объясняет руководитель международной лаборатории «Интеллектуальные методы обработки информации и семантические технологии Университета ИТМО Дмитрий Муромцев.
В 2012 году Ринат Сафин, руководитель московской команды качества поиска Google, рассказал читателям в официальном блоге компании Google, как меняются алгоритмы. Для того, чтобы улучшить качество поиска, по словам представителя компании, ежегодно проводится более 50 тысяч экспериментов и запускается более 500 изменений поисковых алгоритмов. Часть из них – это изменения в интерфейсе, которые можно легко заметить. А многие – просто влияют на порядок результатов так, чтобы ссылка на страницу, которая содержит нужную вам информацию, была первой и пользователь как можно быстрее нашел то, что нужно. Каждое изменение проходит тщательную проверку и обсуждается. За первые 120 дней 2012 года, по словам Рината Сафина, было внесено более 150 дополнений в свои поисковые алгоритмы, и это – показатели пятилетней давности.
Какие же алгоритмы отвечают за быстрый и удобный поиск Google? Известно, что практически ежемесячно Google выкатывает апдейты алгоритмов (это только те, которые подтверждены официально). Посмотрим, какие алгоритмы в последние годы сделали поиск наиболее эффективным. Алгоритм «Панда» запускается впервые в 2011 году, он призван понизить позиции сайтов с низкокачественным контентом. Примечательно, что изначально «Панда» не был частью основного алгоритма, а работал только в качестве фильтра Google (затрагивал определенную долю сайтов при каждом своем апдейте). В январе 2016 года «Панда» был официально включен в основной алгоритм ранжирования. Теперь апдейты стали настолько частыми, что не анонсируются компанией Google.
Алгоритм «Пингвин» был запущен весной 2012 года и сейчас обновляется в режиме реального времени. «Пигвин» понижает в ранжировании сайты со спамными ссылочными профилями и сайты, манипулирующие ссылочной массой. Под санкции алгоритма попадают, как правило, покупные ссылки и те, которые ведут к низкокачественным сайтам.
Антипиратский апдейт (Google's Pirate Update) компания запустила летом 2012 года и обновила только через два года. Цель этого алгоритма – понижать в ранжировании сайты, которые регулярно получают жалобы за содержание пиратского (защищенного авторским правом) контента. Большинство из затронутых алгоритмом сайтов содержали фильмы, музыку или книги, доступные для скачивания или просмотра.
Алгоритм Колибри (Hummingbird) запустили летом 2013 года с целью предоставлять пользователям поисковика более релевантные результаты, основываясь на смысловой составляющей поискового запроса. По словам экспертов, именно этот алгоритм внес значительные коррективы в область интерпретации поисковиком запросов пользователей. Дело в том, что с запуском этого алгоритма основной акцент стал делаться на предоставлении результатов, основанных на понимании намерений пользователя, а не на простом вхождении ключевых слов, как это было прежде.
Другой алгоритм с птичьим названием Голубь (Pigeon) запустили через год, летом 2014 года. Он призван предоставлять более релевантные результаты локального поиска. Этот алгоритм повлиял на результаты выдачи, в которых имеет значение местонахождение пользователя.
Алгоритм Mobile Friendly Update, появившийся в апреле 2015 года, стал работать с повышением оптимизированных для мобильных устройств страниц в результатах поиска на мобильном устройстве. А RankBrain, запущенный в этот же период, отвечает за предоставление пользователю лучших результатов, основанных на релевантности и машинном обучении.
Алгоритм Опоссум (Possum) начал свою работу в сентябре 2016 года и стал предоставлять более релевантные результаты локальной выдачи, основываясь на местонахождении пользователя, а алгоритм Фред (Fred) запустили в марте 2017 года, чтобы он отфильтровывал низкокачественные страницы из результатов поиска (чьей целью является прибыль от размещения рекламы и ссылок на другие сайты).