У кого Хирш больше

Федоров П.П., Попов А.И.
(«ХиЖ», 2107, №5)

pic_2017_05_31.jpg

Писатели-фантасты иногда оказываются пророками — их идеи со временем воплощаются в реальность. Например, процедура печати бумажного экземпляра книги по запросу (Станислав Лем, «Возвращение со звезд») осуществилась совсем недавно. Братья Стругацкие в повести «Хромая судьба» придумали фантастическую машину, которая после анализа художественного текста выдает единственное число — «наивероятнейшее количество читателей», принимаемое за количественную оценку как таланта, так и успешности автора. Мы дожили и до реализации этой фантазии, правда, пока только применительно к научным трудам.


Чему равен ваш h?

Вопрос, вынесенный в заголовок статьи, волнует сегодня всех членов российского и мирового сообщества. Индекс Хирша — это один из самых «модных» способов измерения научной продуктивности ученого, выраженной в количестве и популярности его публикаций. Понятно, что количество и популярность — вещи разные, но хотелось бы иметь какой-то обобщенный параметр. Такой параметр и предложил в 2005 году аргентино-американский физик Хорхе Хирш; ныне он именуется «индекс Хирша», или проcто «Хирш», и обозначается h.

По определению, ученый имеет индекс h, если h из его Np статей цитируются как минимум h раз каждая, в то время как оставшиеся (Np — h) статей цитируются не более чем h раз каждая. Так, если у человека опубликовано 100 статей, на каждую из которых имеется лишь одна ссылка, его h равен 1 — как и у того, кто опубликовал одну статью, на которую сослались 100 раз. В проигрыше и тот, кто публикует много никому не интересных статей, и тот, кто публикуется мало, даже когда статьи его имеют огромный успех. Если же у исследователя одна статья с девятью цитированиями, две статьи с не менее чем восемью цитированиями (включая уже упомянутую с девятью), три статьи с не менее чем семью цитированиями... девять статей с не менее чем одним цитированием каждой из них, то его h равен пяти — на пять его статей сослались по пять раз или более.

В принципе индекс Хирша — надежная и удобная характеристика известности (иногда заслуженной, а иногда и нет) того или иного специалиста в определенной области науки. Гораздо реже и с существенно большей осторожностью индекс Хирша можно применять для оценки достижений в современной технике. Большая часть публикаций специалистов в этой области — патенты или книги, а их цитируемость, в отличие от цитируемости журнальных статей и некоторых монографий и сборников, в большинстве библиографических баз данных не отслеживается.

Сам по себе индекс Хирша — не универсальное мерило личного научного вклада, о котором надо судить по совокупности многих параметров. Этот индекс в наукометрии играет примерно такую же роль, как, скажем, температура тела в медицинской диагностике: никакой квалифицированный врач по одной только температуре без учета иных симптомов диагноз ставить не будет, но отклонение температуры от нормы обязательно вызовет у него настороженность. При этом надо понимать, что «нормальный» индекс Хирша может быть неодинаковым для ученых одного и того же уровня в различных областях человеческого знания и в разные времена.


Замедляющийся рост

Три года назад мы опубликовали небольшое исследование о том, как индекс Хирша связан с индексом цитируемости, то есть общим количеством упоминаний работ автора, отреферированных в библиографических базах данных («Вестник РАН», 2014, 84, 3, 28—38). Мы воспользовались сведениями Web of Science-Core Collection. (Тогда эта база данных называлась просто Web of Science — в отличие от более полной и разнообразной, но не до конца очищенной от повторов базы Web of Knowledge, которая впоследствии была переименована в Web of Science-All Databases.)

На примере современных библиометрических данных для специалистов в области материаловедения и неорганической химии мы установили простую зависимость между индексом Хирша h и индексом цитирования N: чаще всего индекс Хирша примерно равен половине квадратного корня из индекса цитирования: h = 0,5N0,5. При этом значение показателя степени было выведено, а коэффициент — эмпирическая величина. Нам показалось интересным проверить достоверность нашего вывода и посмотреть, как с течением времени за последние три года изменились библиометрические характеристики для тех же самых авторов.

pic_2017_05_32.jpg

1. Зависимость индекса Хирша h от индекса цитирования N для 75 ученых. Черные точки — данные на январь 2014 года, красные точки — данные на февраль 2017-го. Кривая — уравнение h = 0,57N0,48, коэффициент корреляции — 98%

На рис. 1 представлены данные о публикационной активности 75 российских и зарубежных ученых, работающих (или работавших) в области химии, физики, науки о материалах, причем учтены подвижки, произошедшие за три года. Видно, что точки двигаются вдоль одной и той же аппроксимирующей кривой, причем разброс редко превышает две-три единицы. Из этой зависимости следует, в частности, что подъем Хирша — тяжелая работа и чем дальше, тем труднее: для увеличения h на единицу необходимо увеличение общего числа цитирований N на 8h.


Третья цель

Много было сказано об индексах цитирования и индексе Хирша. Вот что, например, написал британский ученый Питер Лоуренс («Ethics in Science and Environmental Politics», 2008, 8, 9—11 doi: 10.3354/esep00079):

«Всегда в науке было три цели публикации: распространить новую информацию для усвоения людьми и для дальнейшего развития науки, лишь в-третьих — чтобы поддержка ученого, финансовая или иная, могла быть оправдана в глазах заинтересованных сторон. Эта третья причина была вспомогательной (хотя с самого начала, от Кеплера и Галилея, она была важна. — Примеч. авт.), но теперь это не так — опубликование стало главной целью, это путь выживания ученого. Кардинальная смена приоритетов нанесла вред научной практике, трансформировала мотивацию исследователей, изменила способ представления результатов и уменьшила точность и доступность научной литературы. Снова и снова работы представляются в журналы преждевременно, а проекты либо срочно слепляются друг с другом, либо специально конструируются, чтобы “сделать статьи” до истечения сроков. Ученые учатся правильно упаковывать свои работы, чтобы они могли быть поданы сначала в журналы, а потом в утробы грантовских агентств.

В настоящее время стратегия должна состоять в игнорировании или скрытии конфликтов. Их открытое рассмотрение может быть опасным, так как, возможно, какой-то из рецензентов может быть раздражен, ибо он участвовал в получении этих результатов. Растущее использование h-индекса — который, будучи основанным на числах цитирований, пытается дать количественное выражение сразу и продуктивности, и влиятельности ученого, — ведет к зависимости от цитирования и к одержимости им. Использование численных измерений поощряет агрессивное, стяжательское и эксплуататорское поведение».

На примере индекса Хирша можно проследить проявление закона сакрализации, придания священного характера собственным творениям, который как действовал в архаических сообществах, так продолжает действовать и сейчас (Федоров П.П. Архаическое мышление: вчера, сегодня, завтра. М.: УРСС, 2009).


Не цитируют, но читают?

Недавно появилась новая информация, которая позволяет более реально оценить весомость этого индекса. Издательство «Шпрингер» обнародовало информацию не только о числе цитирований каждой конкретной статьи, опубликованной в журналах этого издательства, но и о том, сколько раз эту статью скачали. Это официальное число скачиваний, за которое издательство тем или иным образом получило деньги (широко распространенное пиратство и получение текстов из других источников этой статистикой не учитывается). Надо полагать, именно последнее число отражает действительный интерес научного сообщества к опубликованной информации (поскольку за нее хоть немного, но уплачено). Соответственно и анализ соотношения «цитируемость — скачиваемость» представляет интерес. То, что издательство «Шпрингер» публикует переводы на английский язык большинства российских журналов, говорит об их востребованности.

pic_2017_05_33.jpg

2. Сопоставление числа цитирований (по горизонтали) и числа скачиваний (по вертикали)

Для анализа выбраны данные о публикациях одного из авторов этой заметки, имеющего индекс Хирша h = 31 по Web of Science — Core Collection, в журналах «Журнал неорганической химии», «Неорганические материалы», «Кристаллография», «Доклады РАН», «Физика твердого тела», «Электрохимия». Эти сведения доступны в базе ResearcherID.com (идентификатор B-9438-2012). Учтены только статьи, опубликованные в 2005—2015 годах, — более поздние статьи могли просто не успеть процитировать. Всего 100 публикаций (рис. 2).

Общие выводы таковы. Корреляция между цитированием и скачиванием составляет только 9%, другими словами, число цитирований статьи весьма слабо связано с числом скачиваний текста. Что и неудивительно, ведь цитирование и скачивание — это разные информационные действия (распространение и получение информации). Видны несколько разительных несоответствий, когда цитирование одно, а скачиваний — 114, или цитирований два, а скачиваний — 253, или цитирований ноль, а скачиваний — 87 или 61. Таким образом, индекс Хирша или индекс цитирования слабо связаны с использованием результатов коллегами-учеными. С другой стороны, отсутствие цитирований вовсе не означает, что публикация прошла незамеченной и не оказала влияния на развитие науки. Российские журналы, по-видимому, совсем не так плохи, как о них говорят и думают на основе низких импакт-факторов (хотя, конечно, проблем у них более чем достаточно): за ними следят, их внимательно читают.


Рыночный характер науки

Что касается изменений в научной среде, связанных с необходимостью поиска грантов, о которых упоминал Питер Лоуренс, то, вообще говоря, грантовая система финансирования — болезнь современной науки.

Вот как художественно описал ситуацию Грегори Бенфорд, американский астрофизик и писатель-фантаст, профессор кафедры физики и астрономии Калифорнийского университета в Ирвайне: «Нужно было соблюсти кучу формальностей. Это называлось “наполнить содержанием внешнюю форму” — невообразимую путаницу перекрестных вопросов, на которые приходилось отвечать ученому, прежде чем браться за разработки. Нужно было представить подробные тезисы и анализ вида и содержания научных разработок. Представить доказательства необходимости исследования, показать практические выгоды от его результатов, обосновать научную новизну и полезность. Объяснить, почему для научной работы нужны именно такое лабораторное оборудование и компьютерное обеспечение и можно ли обойтись уже имеющимися ресурсами, если их как-то подновить или переоборудовать. Чтобы заявка прошла наверняка, ученым приходилось выполнять большую часть работы прежде, чем ее писать. В итоге все исследования оказывались в основном хорошо продуманными заранее, и результат их был вполне предсказуем».

Составление заявок и отчетов не только занимает недопустимо большое количество времени, оно иссушает разум и душу. Научное знание превращается в товар, выставляемый на рынок, и таким образом выхолащивается существо научного исследования. Понятие истины подменяется понятием даже не пользы, а рыночной стоимости той или иной идеи или разработки. Весомость работы определяется ценой, за которую ее можно продать. «Проблема не в том, существует или нет тот механизм, о котором вы говорите. Проблема в том, кто его купит», — довелось услышать одному из авторов недавно от крупного ученого, нашего соотече ственника, живущего за границей уже более 20 лет.

Рыночный характер науки влечет за собой жесткую необходимость рекламы, в том числе саморекламы, и пиара, чтобы завернуть залежавшийся товар в новую яркую оболочку и придать ему вид новизны. Примеры высокого искусства формирования новых сегментов и рынков сбыта научной продукции — у всех перед глазами. Критическое обсуждение исчезает. Поскольку истина не так важна, как финансирование, дискуссия становится опасной и неприличной, выходит из моды и осуждается как неполиткорректное поведение.

Именно с этой точки зрения следует рассматривать проблему цитирования научных работ. Во-первых, требование новизны, как одного из критериев оценки товара, заставляет игнорировать старые работы, которые по глубине постановки проблем и дотошности анализа и обсуждения результатов сплошь и рядом превосходят современные скороспелки. По этой причине в публикациях зачастую повторяется то, что давным-давно твердо установлено. Причем без ссылок, хотя во многих случаях очевидно, что именно авторы читали и откуда что заимствовали. Во-вторых, это приводит к игнорированию работ реальных или потенциальных конкурентов, самоцитированию и цитированию работ коллег из своего клана.

Таким образом, цитирование не говорит о реальной значимости работ: возможно как дутое цитирование, так и замалчивание важных работ. Индексы цитирования, в том числе индекс Хирша, отражают прежде всего степень вхождения автора в научное сообщество. Этой характеристикой можно пользоваться для информации, но нельзя использовать ее для административных выводов или в качестве единственного критерия научной ценности работ исследователя.

Разные разности

20.06.2018 10:00:00

«Концепция ложных новостей стала основой политических дискуссий с момента избрания Дональда Трампа президентом США и уже привела к делегитимизации средств массовой информации. Понимание общего и различного в восприятии ложных новостей политическими группами поможет разработать стратегию снижения политической поляризации в наших демократических сообществах», — так сформулировали цель своего исследования доктор Крейг Харпер и профессор Том Багули из Ноттингемского университета.

>>
04.06.2018 10:00:00

...землетрясение 2017 года в Южной Корее, второе по мощности в новейшей истории страны, случилось из-за геотермального завода...

...новый стартап «Mammoth Biosciences» в США объявил своей целью проведение любых ДНК- и РНК-тестов методом CRISPR в амбулаторных и домашних условиях...

...миниатюрный сенсор в переднем зубе может передавать по беспроводной связи сведения о состоянии полости рта и о том, что человек ест...

...создан камуфляж для инфракрасной области спектра, работающий по принципу кожи кальмара...

...экспериментально подтверждено, что викинги могли определять положение солнца в пасмурные дни с помощью «солнечных камней», поляризующих свет — кальцита, кордиерита или турмалина...


>>
28.05.2018 10:00:00

Как сделать максимально безболезненным для людей переход от личного автотранспорта к общественному? За счет создания дешевой службы электрических такси-роботов. Такой вывод следует из результатов моделирования, проведенного Гордоном Бауэром из университета Беркли и его коллегами из Лоуренсовской национальной лаборатории Минэнерго США.

>>
23.05.2018 10:00:00

Исследователи из нескольких институтов Великобритании, США и Франции проанализировали изотопный состав кислорода вулканических гор на дне океана и в тех образцах, что экспедиции НАСА привезли с Луны. Как оказалось, составы очень похожи, словно лунные породы — это и есть земные.

>>
30.04.2018 10:00:00

...NASA откладывает запуск космического телескопа Джеймса Уэбба (JWST) почти на год, до мая 2020 года...

...в Баксанской нейтринной обсерватории ИЯИ РАН планируется создание нейтринного детектора на основе жидкого сцинтиллятора, который можно будет использовать как часть мировой сети таких детекторов для изучения внутреннего строения Земли...

...аэрозоль электронных сигарет вызывает повреждения ДНК в клетках легких, мочевого пузыря и сердца мышей, а также подавляет репарацию ДНК в легких...


>>