Что такое Web of Science и InCites

Web of Science — инструмент для проведения научных исследований. Помогает в поиске литературы, наиболее активно работающих авторов и организаций, а также в поиске журналов для публикации статей. Его вы используете практически ежедневно как ученые: вы ищете, что написано по вашей предметной области, что из этого хорошо цитируется и на чем вам строить свои исследования, а также кто еще активно работает по вашей тематике.

InCites — инструмент для анализа, оценки и сопоставления. Помогает проводить анализ тенденций, сопоставлять авторов и организации, а также при помощи более удобных индикаторов он позволяет делать анализ научной результативности.

Раз в год компания Clarivate Analytics, владеющая базами Web of Science и InCites, публикует список высокоцитируемых авторов. Он довольно активно используется в международных рейтингах университетов, в частности, составителями Шанхайского рейтинга, но, помимо этого, его можно использовать и для других целей, в том числе для рекрутмента и налаживания связей с ведущими зарубежными учеными.

Web of Science. Источник: clarivate.com
Web of Science. Источник: clarivate.com

Почему важно отслеживать высокоцитируемые публикации

Для начала необходимо разобраться, что такое высокоцитируемые публикации. Это документы Web of Science, которые были опубликованы за последние десять лет и попали в 1% наиболее цитируемых статей для своей предметной области и года публикации. Так делается потому, что очевидно: есть как более, так и менее цитируемые предметные области, а работы, опубликованные девять лет назад, скорее всего, были процитированы большее количество раз, чем статьи, опубликованные вчера.

Зачем необходимо отслеживать высокоцитируемые публикации

Составление рейтингов

Высокоцитируемые публикации — это прекрасный показатель с точки зрения библиометрии. Дело в том, что их конечное количество. Каждый год в Web of Science попадает примерно 2 млн новых публикаций от ведущих международных журналов и крупнейших научных конференций. И если мы попробуем понять по общему количеству публикаций в Web of Science, кто в мире является самым цитируемым автором, скорее всего у нас не получится это сделать. Это настолько большие данные, что обработать их какими-то внятными алгоритмами не получается пока даже у нас.

Да, теоретически можно натренировать нейронную сеть, которая будет кластеризовывать авторов по фамилиям, предметным областям, в которых они работают, по тому, в каких журналах они публикуются. И мы всем этим занимаемся, но пока в такой кластеризации нет стопроцентной достоверности. На это влияет и наличие однофамильцев, и путаница в транслитерации на английский многих фамилий, и другие факторы.

Но если мы возьмем 1% наиболее высокоцитируемых публикаций (а это примерно 20 тыс. от 2 млн ежегодно размещаемых в Web of Science документов), то с этим массивом данных уже можно работать: в компании есть команда аналитиков, которая каждый год рассчитывает, кто и в каких областях опубликовал больше всего высокоцитируемых работ. Новый список будет опубликован в течение ближайшего времени, он же пойдет в Шанхайский рейтинг для того, чтобы его составители ранжировали университеты, учитывая в том числе этот показатель.

Отслеживание актуальных тенденций в современной науке

Анализ высокоцитируемых документов важен не только для рейтингов, но и для понимания того, что происходит в современной науке. Это прекрасный показатель объема прорывных исследований университета. Помимо базы Web of Science, существует также такой аналитический инструмент, как InCites. Именно в этой оболочке становится доступен анализ высокоцитируемых публикаций, кроме того, здесь удобнее отслеживать высокоцитируемые статьи. Они помечаются значком кубка, вы можете фильтровать их и, например, посмотреть, какие высокоцитируемые публикации и ученые есть в вашем вузе.

Павел Касьянов
Павел Касьянов

Почему еще важно анализировать высокоцитируемые публикации? В InCites есть такой инструмент, который называется «исследовательские фронты». Это группы высокоцитируемых публикаций, кластеризованных при помощи нашего алгоритма и указывающих на наиболее горячие направления в сегодняшних научных исследованиях.

На основе подсчета высокоцитируемых документов каждый год мы предсказываем лауреатов Нобелевской премии. В этом году угадали четверых — двоих по физиологии и медицине и двоих по экономике. Всего с 2002 года, как только этот проект запустился, компания сделала 50 верных прогнозов.

Также у нас есть собственная награда — Citation Awards. Как мы выбираем ее лауреатов? Мы берем нашу методологию, определяем высокоцитируемых авторов — тех, кто больше всех опубликовали высокоцитируемых работ в своих предметных областях — и переносим ее на Россию. Один из постоянных обладателей этой награды — Сергей Морозов, соавтор Андрея Гейма и Константина Новоселова. Полный список высокоцитируемых авторов можно посмотреть по адресу. Здесь можно посмотреть либо список, либо полный отчет со всей методологией и интерпретацией, а также провести поиск по фамилиям авторов, по аффилиации или по интересующим предметным областям.

Встреча с Павлом Касьяновым в Университете ИТМО
Встреча с Павлом Касьяновым в Университете ИТМО

А зачем вообще нужен список высокоцитируемых авторов и как с ним работать?

У многих авторов, которые попали в список, есть профили в ReceacherID, ORCID или Publons, там же могут быть указаны их координаты. Кроме того, большинство из них имеет профили на страницах своих организаций — с контактами, областями научных интересов, биографией и списком читаемых курсов.

Эта информация будет наиболее полезна тем, кто занимается академическим рекрутментом, а также тем, кто в целом интересуется библиометрией. Работая с этим списком, прежде всего вы должны понять, кто из этих высокоцитируемых ученых представляет для вас интерес и какой интерес представляете для них вы. Далее можно определить, готов ли исследователь сотрудничать с университетом в России и, если да, то в каком формате. Выступить с лекцией? Приехать на временный исследовательский проект? Возглавить лабораторию? Все детали можно обсудить уже в личной переписке.

Перспективные авторы: почему стоит обратить внимание на восходящих научных звезд

Но у предыдущего способа есть и свой очевидный недостаток. Проведу спортивную аналогию: у всех крупных спортивных команд, особенно у тех, кто обладает внушительными бюджетами, есть так называемая селекционная служба, которая занимается поиском игроков с максимальным потенциалом. Представьте, что Highly Cited Researchers — это такие Роналду и Месси от науки, поэтому, скорее всего, их будет очень сложно к нам привезти. Но, даже если мы их привезем, далеко не факт, что у нас они будут выдавать такие же результаты. Поэтому, возможно, имеет смысл переключиться с самых цитируемых и «дорогих» ученых и подходить к этому чуть более креативно — искать молодых авторов с большим потенциалом.

Источник: shutterstock.com
Источник: shutterstock.com

Как это можно сделать? Есть два способа.

Способ №1. Искать авторов, которые публикуют удовлетворяющие критериям цитируемости публикации, но чуть-чуть не дотягивающие по количеству этих публикаций.

Возьмем для примера узкую, но достаточно актуальную тематику — доставку лекарств к тромбам. Соответствующий поиск можно провести благодаря базе Web of Science и расширению InCites. Используя эти сервисы, мы увидим, что из тех 1360 публикаций, в которых содержится фраза «доставка лекарств к тромбам», 16 являются наиболее высокоцитируемыми, то есть они попали в тот самый 1% публикаций для своей тематики и года. Отфильтровав и посмотрев подробнее эти публикации, мы можем также получить как минимум контакт первого автора, чтобы связаться для дальнейшей беседы.

Надо понимать, что в этом случае есть свои тонкости: так как тема является новой, то здесь пока нет достаточно высокоцитируемых авторов. В таких сферах есть свои «чемпионы», у которых по две высокоцитируемые статьи — и это действительно круто для новой области, но, тем не менее, пока они не входят в глобальные списки Highly Cited Researchers. С другой стороны, если они уже сейчас успешно работают в расширяющейся и набирающей актуальность предметной области, вполне возможно, что они смогут войти в эти списки в будущем и продолжат развивать свои результаты.

Разумеется, вряд ли каждый университет в мире ежедневно просматривает списки высокоцитируемых статей. Тем не менее, те вузы, которые полагаются в вопросах рекрутмента на библиометрию, могут успешно использовать и эти инструменты.

Источник: shutterstock.com
Источник: shutterstock.com

Способ №2. Искать авторов, публикующих достаточно большое количество работ, в среднем чуть не дотягивающих до 1% наиболее цитируемых в мире.

Что если мы поменяем подход и расширим зону поиска до 3, 5, 10% наиболее высокоцитируемых работ?

Здесь важно помнить о еще одном библиометрическом показателе — нормализованной средней цитируемости. Что это значит? Если я скажу, что моя работа в определенной области была процитирована 20 раз, много это или мало? Вам это ничего не скажет. Если это работа по истории, написанная в прошлом году, это очень круто. Но если я окажусь микробиологом, который написал эту работу в девяностых годах, то результат довольно слабый. Поэтому все, во-первых, зависит от предметной области, во-вторых, от года публикации, а также от вида работы — статья это или обзор. В некоторых областях обзорные работы цитируются в четыре раза лучше, чем оригинальные исследования просто потому, что такова специфика этой области.

Уже порядка десяти лет специалисты по библиометрии умеют нормализовывать цитируемость. Если разобрать это на примере работы с 20 цитированиями, то необходимо взять дробь: в числителе поставить цитируемость публикаций (то есть 20), а в знаменателе поместить среднюю цитируемость для всех документов того же типа, опубликованных в той же предметной области и в том же году. Прелесть InCites в том, что вам не нужно подсчитывать это самостоятельно, все делается автоматически.

Если средняя нормализованная цитируемость больше 1, то можно говорить о том, что документ цитируется лучше среднемирового уровня, если меньше, то, соответственно, хуже. То же самое можно сделать для группы публикации, таким образом мы можем рассчитать нормализованную цитируемость для автора, для вуза в целом и наконец для России. Стоит отметить, что, в отличие от 90-х годов, когда нас сильно недоцитировали, сейчас Россия подтягивается к среднемировому показателю и находится уже очень близко к этому значению, что, безусловно, очень хороший тренд.

Научные журналы. Источник: livejournal.com
Научные журналы. Источник: livejournal.com

Нормализованная средняя цитируемость является показателем ваших исследований. Все рейтинги, кроме Шанхайского, как раз используют именно это показатель: им практически все равно, сколько публикаций вы сделали, главное, чтобы они хорошо цитировались. В отличие от того же индекса Хирша, он позволяет сопоставлять авторов, работающих в разных областях, а также это один из немногих показателей, который подходит для анализа в динамике.

Если вернуться к задаче поиска перспективных ученых для сотрудничества, стоит отметить, что в InCites есть показатель не только по проценту или количеству работ, попавших в 1% самых цитируемых в своей предметной области. Мы также можем расширить область поиска до 10%, сегментировать ученых по странам и отсортировать их по показателю нормализованной цитируемости.

Эти данные мы можем выгрузить в Excel и уже там задать порог — допустим, мы хотим рассмотреть все публикации, которые попали в 10% наиболее цитируемых в своей предметной области. У нас останется массив данных, для которого в выгрузке присутствует идентификатор этих публикаций в Web of Science, затем мы можем скормить базе этот список в окне расширенного поиска, получить искомые документы по тем фильтрам, которые мы задавали, и смотреть уже их авторов.

Таким образом, мы получили список людей, которые не попали в список Highly Cited Researchers, не появляются при обычном поиске в Web of Science по высокоцитируемым публикациям по предметным областям, но в то же время эти исследователи публикуют работы, которые уже хорошо цитируются и имеют перспективы. Это еще один способ, как присмотреться к начинающим звездам с хорошим потенциалом и наладить сотрудничество с ними.

Финальные рекомендации

Безусловно, по аналогии с футболом, можно «накупить звезд» — высокоцитируемых авторов просто ради рейтингов, но важно понимать, что качество исследований от этого может и пострадать.

Поэтому гораздо правильнее и эффективнее найти авторов, кто обладает потенциалом и занимается теми исследованиями, в которых у вас с ним может возникнуть дополнительная синергия.

И наконец, ни в коем случае не стоит забывать, что вы растите свои таланты. Помните, кто автор самого большого количества высокоцитируемых работ в вашем университете и поддерживайте этих ученых.