![]() КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Цитирование, библиографическое сочетание, социтированиеПринцип цитирования[28] был использован Институтом научной информации США, основанным в 1958 г. Ю. Гарфилдом, для создания принципиально нового вида информационного обслуживания. При поиске информации он взял в качестве индексов библиографические ссылки в документах. В выпускаемых им указателях цитированной литературы, называемых также "индексами цитирования", эти ссылки располагаются по алфавиту фамилий авторов цитированных работ с указанием сведений о документах, в которых они упоминаются. Произведения, использованные при написании статьи, составляют как бы координатную сетку для ее поиска. Если статья написана по совсем новой проблеме, не нашедшей рубрики в классификации наук, с еще не устоявшейся и малоизвестной терминологией, найти ее в потоке мировой литературы другими методами очень трудно. Указатель цитированной литературы можно представить себе как многоуровневую систему библиографических описаний документов, находящихся в обратной связи друг с другом. Указатели цитированной литературы позволяют искать информацию по совершенно новым межотраслевым или комплексным проблемам под фамилиями пионеров и наиболее известных специалистов каждой из таких проблем. Например, для поиска литературы по цитированию достаточно знать фамилию Ю. Гарфилда, так как почти в каждой работе по этой проблеме есть упоминание о нем и его статьях. Фамилии авторов найденных работ могут в свою очередь служить входами в указатель, и за 1–5 таких итераций (последовательных поисков) все сведения об отраженной в указателе литературе по проблеме оказываются найденными. Индексы цитирования предоставляют уникальную возможность проследить за всеми случаями применения какой-либо идеи или метода, за их критикой и обсуждением, оценить информационный вклад того или иного ученого или научной школы, степень и динамику популярности их работ. Известны случаи, когда по этим указателям предсказывали нобелевских лауреатов. Институт научной информации США выпускает указатели цитированной литературы по точным, естественным и прикладным наукам (с 1964 г.), по общественным наукам (с 1969 г.), по искусству и гуманитарным наукам (с 1976 г.), для чего просматривается около 6 тыс. научных журналов и ежегодно до 1,5 тыс. названий книг. Большинство указателей распространяется не только в обычном (бумажном), но и в машиночитаемом виде (на магнитной ленте, дискетах, оптических дисках). Нужно ли говорить о том, что осуществление принципа, положенного в основу этих изданий, стало возможным лишь благодаря компьютерам. Ведь речь идет о ежегодном библиографировании почти 10 млн ссылок. В двух статьях E и F, например, (см. рис. 10) имеются библиографические ссылки, которые устанавливают прямую библиографическую связь между ними (цитирующими документами) и статьями A, B, C и D, которые в них упоминаются (цитируемыми документами). В указателе цитированной литературы эти ссылки, по алфавиту которых упорядочивается его массив ("цитации" по терминологии Г. Я. Узилевского, которому принадлежит данный пример), обозначают цитируемые документы, а под ними располагаются "библиограммы", т. е. описания цитирующих документов. A C E E B F E D F F Понимание потенциальных возможностей комплексирования документов по признаку общих ссылок и стремление максимально использовать накопленный массив в машиночитаемой форме повели к поискам новых путей применения метода цитирования. Еще в 1963 г. М. Кесслер в Массачусетском технологическом институте предложил считать связанными по смыслу документы, авторы которых ссылаются на одни и те же работы, а числом совпадающих ссылок измерять степень такой связанности. Этот метод, который он назвал библиографическим сочетанием документов, долгое время не имел широкого практического применения, но в 1968 г. Ю. Гарфилд использовал его для создания ретроспективной поисковой системы на компакт‑дисках.
Библиографическое сочетание
![]()
Рис. 10. Схема цитирования, социтирования
По-другому подошли к этой проблеме сотрудник Института научной информации США Г. Смолл и тогдашняя аспирантка ВИНИТИ И. В. Маршакова. Они одновременно и независимо друг от друга в 1972 г. предложили считать связанными по смыслу и тематике работы, на которые совместно ссылаются авторы нескольких документов. Этот метод, чаще всего называемый социтированием, имеет другую коммуникационную основу. В каждой исследовательской области имеется некоторый набор важных работ, отражающих познавательную основу этой области. Данные работы цитируются многими исследователями и поэтому принадлежат к числу высоко цитируемых. Больше того, они часто цитируются вместе, образуя таким образом социтирование. Другими словами, социтированием принято называть одновременное упоминание любых двух или большего числа публикаций в какой-либо последующей. Для лучшего представления разницы в этих методах выше приведена схема, на которой E и F являются цитирующими документами текущего года, а A, B, C и D – цитируемыми документами более ранних годов. Сплошными стрелками показаны связи по цитированию, т. е. E цитирует A, B и C, а F цитирует B, C и D . Тогда между цитирующими работами E и F образуется библиографическое сочетание, а между цитируемыми работами B и C – социтирование (обозначено пунктиром). Для простоты и наглядности степень связанности на схеме минимальная, хотя на практике она значительно больше (т. е. для признания библиографического сочетания между двумя работами или кластера социтирования в каждом отдельном случае устанавливается определенный минимальный порог, который тем выше, чем интенсивнее цитирование). Между характером этих методов установления связи и областью их применения имеется существенная разница. Библиографическое сочетание – это однократно произошедший факт, поскольку E и F были однажды опубликованы со своими ссылками, и с ними в дальнейшем ничего уже произойти не может. Именно поэтому данный метод применяется для ретроспективного поиска документов, связанных между собой единством тематики, исследовавшейся их авторами. Совсем по-другому обстоит дело с социтированием, так как связь между цитируемыми B и C может сохраняться (увеличиваться или уменьшаться) в последующие годы в зависимости от того, насколько часто они будут попарно цитироваться в новых работах. Частое социтирование указывает на их концептуальную близость, поскольку они используются как единый комплекс. Между этими работами как бы возникают невидимые связи, которые после наглядного их выражения образуют смысловые сгустки (кластеры). Совокупность таких кластеров ключевых работ, отражающих исследовательские области, представляют собой как бы карту определенной научной области, а совокупность карт – атлас науки на данный момент. При регулярном выпуске подобных атласов (выходили атласы по биологии, биохимии, геологии, математике, вычислительной технике) появляется возможность регулярно следить за динамикой развития научных дисциплин, школ, направлений, коллективов, а, следовательно, и целенаправленно воздействовать на это развитие, т. е. управлять им. В последние годы методы цитирования стали широко применяться для оценки значимости, влиятельности научных журналов. Введенные в системе SCI показатели "impact factor" и "immediacy index" являются тонкими количественными оценками научного статуса журнала, отражающими, по сути, качество работ, публикуемых в журнале, через оценку двух аспектов журнала – продуктивности (числа опубликованных в нем работ) и цитируемости (количества ссылок на него, т.е. его научной популярности). Impact factor можно рассматривать как показатель влиятельности журнала (обозначим его Ih,), который рассчитывается как отношение числа ссылок, которые получил журнал в текущем году на статьи, опубликованные в этом журнале в предшествующие два года, к числу статей, опубликованных в этом журнале в эти же два предшествующих года. Поясним это примером. Американский социологический журнал "American Journal of Sociology" получил в 2008 г. всего 2599 ссылок; из них число ссылок на статьи, опубликованные в этом журнале в 2007 и 2006 тт., составило соответственно 73 и 120; число статей, опубликованных в журнале в эти годы, соответственно равно 61 и 72. Следовательно, показатель влиятельности равен: 73 + 120 Ih=———= 1 ,451. 61+72 Таким образом, показатель влиятельности Ih является мерой, определяющей частоту, с которой цитируется среднецитируемая статья журнала. Реально в системе SCI этот показатель рассчитывается по данным предшествующих двух лет и отражает, насколько актуальны научные работы, опубликованные в конкретном журнале, в течение последних двух лет. Дело в том, что высокие абсолютные (и относительные) показатели цитирования журнала не всегда отражают реальную картину актуальности работ, опубликованных в нем. Эти показатели могут иметь высокие значения из года в год за счет цитирования какой-то одной важной статьи, опубликованной в журнале 5-10 лет назад, в то время как показатель влиятельности Ih более динамичен и отражает использование статей журнала научным сообществом в последние два года. Проиллюстрируем эту мысль следующим примером. Три советских журнала ("Квантовая электроника", "Успехи физических наук" и "Журнал технической физики") получили в 1982 г. соответственно 2053, 1625 и 1428 ссылок каждый. Показатели влиятельности этих журналов следующие: 0,706 ("Квантовая электроника"), 1,814 ("Успехи физических наук") и 0,277 ("Журнал технической физики"). Из всех названных журналов наименьшее число статей было опубликовано в 1980-1981 гг. в журнале "Успехи физических наук" – 896, а показатель влиятельности этого журнала был наибольшим. Immediacy index можно рассматривать как показатель быстроты отклика на журнал (обозначим его I0). Этот показатель равен отношению числа ссылок, полученных журналом на статьи текущего года, к числу статей, опубликованных в нем в том же году. Например, журнал " American Journal of Sociology " в 2008 г. получил 13 ссылок на статьи, опубликованные в 2008 г.; общее число статей, опубликованных в журнале в 2008 г., было равно 53. Следовательно, Io = — = 0,245. Для журнала "Научно-техническая информация" (серия 1 и 2) эти показатели соответственно равны: 0,012 и 0,038. | Судя по этим цифрам, видно, что в 2002 г. из серии 2 было процитировано больше работ 2008 г., чем из серии 1 того же сборника. Показатель быстроты отклика на журнал I0 является мерой скорости, с которой появляются ссылки на среднецитируемую статью журнала текущего года. Методы библиографического сочетания и кластеризации социтирования моделируют содержательные отношения между документами, используя практику цитирования, сложившуюся при публикации научных работ. Но это не единственный возможный подход к установлению таких связей между документами, заложенных в их библиографических элементах и фрагментах текстов. В следующей лекции об информационных системах вы познакомитесь с методом логико-смыслового моделирования, а теперь мы перейдем к более традиционным видам информационно-поисковых языков.
|