Среди разных атрибутов, описывающих специфику сайтов, особый интерес представляют способы их взаимодействия с внешней средой – своего рода коммуникативные модели поведения, объективно складывающиеся в процессе эволюции. Очевидно, что в настоящее время, в силу объективно-исторических причин, еще преждевременно говорить о каких-то осмысленных «стратегиях» развития библиотечного интернета и о достижении каких-либо заранее намеченных целей. Прежде всего стоит отметить, что только единицы сайтов декларируют понятную и ясно сформулированную «политику» развития. Очевидно, что ее реализация – это вопрос особый, и в рамках данной статьи мы его разбирать не будем. Но помимо этого есть еще одно обстоятельство, препятствующее выработке долговременной стратегии, – быстрая эволюция самой сети. Вместе с ней меняются инструменты, технологии, условия привычного бытования сайтов. В результате любые попытки постулировать некую устойчивую «стратегию» развития библиотечного веба устаревают так же быстро, как и появляются. Рациональный взгляд на проблему подсказывает, что в данный момент можно стремиться лишь к тому, чтобы выработать более эффективные подходы к развитию интернета в библиотеках. В данном случае большую практическую пользу могла бы принести типологизация существующих моделей библиотечных сайтов. Рассматривая такое моделирование как основу для создания планов в условиях неопределенности, можно корректировать цели сетевого развития, повышать эффективность его отдачи. При этом для изучения количественных и качественных аспектов управления веб-ресурсами можно привлекать весь арсенал имеющихся и новых средств вебометрики, ориентированной на технологии будущего. С учетом названных обстоятельств, начиная с осени 2015 г. мы проводили разностороннее исследование библиотечных сайтов с целью собрать различные метрики их развития (открытые данные о размере и динамике обновления, источниках и структуре трафика, аудитории, посещаемости, времени и глубине просмотра страниц и пр.). Затем, после выявления некоторых закономерностей развития, можно было создать примерную типологию библиотечных сайтов, основываясь на определенных критериях и схожести характеристик. Для сбора данных использовались бесплатные инструменты SEO-анализа и вебометрики, позволяющие по единой схеме провести массовую оценку индикаторов сразу у многих сайтов. В частности, привлекались онлайновые инструменты XTool (xtool.ru), позволяющие проводить регулярный мониторинг и SEO-аудит сайтов. Средства XTool взаимодействуют с инструментами «Яндекса» и получают от него информацию об индексации ресурсов (визуализируется на графиках), о скорости обновления страниц, показателях тИЦ (тематического индекса цитирования) и других метриках (табл.1). XTool может извлекать и воспроизводить сведения о ключевых словах, приводящих пользователей на сайты. Таблица 1
по данным XTool и Яндекса на 25.01.2018 г.
Кроме того, XTool в режиме онлайн проверяет внешние ссылки (backlinks) с любого сайта и генерирует полный список с указанием позиций ссылок, URL доноров и акцепторов, тИЦ доноров, уровня вложенности страниц и анкоров. Одновременно система оценивает степень доверия к сайту и «авторитетность» ресурсов (траст XT). Хорошие, «трастовые», ресурсы получают XT = 8-10, «середняки» – 4-7, а некачественные и откровенно плохие сайты – ниже 3. Правда, надо подчеркнуть, что эта оценка – чисто технологическая, то есть связанная исключительно с процедурами SEO-оптимизации. Она имеет мало общего с критериями библиотечной оценки контента. Самая существенная часть показателей внешнего трафика, посещаемости и веб-аудитории была получена с помощью вебометрической платформы SimilarWeb, созданной еще в 2009 г. Этот инструмент позволяет структурировать трафик сайтов по его источникам – прямому, ссылочному (реферальному) и поисковому, а также по заходам из социальных сетей и почтовых рассылок. Во всем мире SimilarWeb широко используется для выполнения разнообразных бизнес-исследований и глубокого вебометрического анализа данных. О возможностях системы говорит хотя бы тот факт, что она обрабатывает до 5 миллиардов событий в сутки без существенного ущерба для точности данных. В процессе работы по сбору вебометрических данных о сайтах библиотек мы сформировали две выборки. В первую вошли сайты центральных научных библиотек, извлеченные из top-10 «Яндекс-Каталога» (представлены в табл.1). Во второй выборке были собраны 26 сайтов региональных библиотек Сибири и Дальнего Востока, выявленные из самых разных источников, включая и профессиональный справочник ГПНТБ СО РАН «Научные библиотеки Сибири и Дальнего Востока (областные, краевые, национальные, окружные универсальные)» [1]. Отдельно по каждой выборке определялись максимальные и минимальные значения показателей, а затем в границах найденных интервалов каждая выборка делилась на четыре группы, сходные по параметрам развития. Таким образом стало возможно, хотя бы в первом приближении, получить типологию библиотечных сайтов, сгруппированных по некоторому способу существования этих сайтов в веб-среде. Разумеется, включение каждого сайта конкретно в одну из «моделей развития» очень условно и, как будет показано ниже, не лишено изъянов. Тем не менее проведенное нами деление позволяет судить как о некоторых важных тенденциях, так и о свойствах сайтов, полезных для их самоидентификации. В качестве главного критерия группировки был выбран способ взаимодействия сайтов с внешней средой – то есть преобладающие для каждого сайта структура и источники веб-трафика, включая трафик из социальных сетей. Понятно, что метрики, полученные от сайтов центральных библиотек, заметно отличаются от таковых же у небольших и сравнительно молодых региональных сайтов Сибири и Дальнего Востока. Так, например, сильно разнятся имеющиеся данные о размерах сайтов. Даже у центральных библиотек число страниц на сайтах может различаться на порядки (от полутора сотен у ЦНМБ до 8 млн у РНБ (см. табл.1). Кроме того, бросается в глаза большой разброс цифр в индексах поисковых систем по каждой библиотеке в отдельности. Причины такой нестабильности подробно разобраны в аналитической статье по вебометрике академических институтов РАН [1, с.1018-1021]. В таблице 2 представлены критерии группировки и отнесения сайтов к некоторым моделям развития, выработанные в процессе исследования. Точного совпадения проектированной схемы с реальностью, естественно, не получилось, особенно у региональных библиотек. Да и трудно было ожидать чего-то другого в таком изменчивом деле, как развитие интернета. Однако данный шаблон послужил некоторым ориентиром в проведенной работе. Таблица 2
Весьма условная группировка и дальнейший анализ позволили разработать четыре ведущих модели библиотечных сайтов:
У первых двух отчетливо видны противоположные подходы к генерации трафика с точки зрения открытости и закрытости представленной информации. У остальных наблюдается сбалансированное распределение визитов по всем источникам трафика. Из них развитая социальная модель эволюционирует, главным образом за счет продвижения ресурсов в социальных сетях, уделяя большое внимание созданию новых продуктов и услуг. А диверсифицированная модель, по существу, является переходной ступенью от открыто-закрытых форм сайтов (№ 1-2) к развитой социальной модели (№ 3). В рамках первой модели доминирующим источником трафика является органический поиск, то есть приход пользователей из поисковых выдач «Яндекса», «Гугла» и других поисковиков. Ресурсы таких сайтов свободно индексируются поисковыми машинами и без излишне затянутых процедур (аутентификации, настройки сессий) предоставляются всем пользователям. Это и позволяет назвать эту модель открытой, так как она базируется на открытой индексации страниц, статическом коде и сессиях вида open access. Вторая модель опирается на пользователей, приходящих на сайт преимущественно по ссылкам. Главным источником трафика для подобного «закрытого» сайта [2], как и главным фактором роста его посещаемости, являются известные, тематически близкие ему «доноры» ссылок. Как правило, сайты такого типа сокращают до минимума ту часть своего трафика, которая связана с поисковыми и социальными источниками. В то же время постоянно растущую часть визитов (до 20-50% и более) начинают занимать рефералы [3] и прямые заходы на сайт с «домашних» страниц, закладок и вводов URL. Сайт как будто «изолируется» от внешнего мира, переходя в автономный режим «только для своих», хорошо знакомых гостей. Третья модель носит самый продвинутый характер. Ее можно охарактеризовать как открытую общественную модель с развитой ссылочной частью трафика и очень высокой долей визитов из социальных сетей. Библиотечные сайты этого типа являются результатом длительного и устойчивого развития. Они отличаются большой клиентской базой, стабильным и надежным трафиком, широкими технологическими возможностями, разнообразными веб-ресурсами с большим количеством специализированных баз данных и коллекций полнотекстовых документов. Наконец, четвертая модель характеризуется распределенной и не всегда устойчивой структурой всех видов трафика – прямого, ссылочного, поискового и социального [4]. При этом крупные, давно существующие сайты центральных библиотек способны сохранять относительную стабильность в течение долгого времени, тогда как региональные сайты часто мигрируют в соседние группы – к более продвинутой социальной (№ 3) или к абсолютно «закрытой» реферальной (№ 2) модели. По многим материально-техническим и организационным причинам им трудно поддерживать длительную устойчивость, поэтому их показатели наиболее изменчивы. Разбиение десятки сайтов центральных научных библиотек по источникам трафика выделило по три поисковых и переходных модели и по две реферальных и социальных (табл.3). Таблица 3
Подчеркнем еще раз, что распределение сайтов по названным группам весьма условно и относится только к одной стороне их функционала, а именно, к структуре трафика. При этом границы групп крайне размыты и непостоянны. Длительный мониторинг за ряд лет выявил способность сайтов не только наращивать, но и терять накопленный «вес» показателей. Тем не менее результаты выполненной работы позволяют видеть некоторые закономерности и прогнозировать будущие тенденции (переходы сайтов от одного типа развития к другому). Более детальный анализ показателей посещаемости, несмотря на некоторый разброс цифр в пределах групп, показывает схожесть ключевых характеристик по каждой модели (табл.4). Таблица 4
библиотек по оценке SimilarWeb от 25.01.2018 г.*
Последняя оценка метрик посещаемости с помощью SimilarWeb от 25.01.2018 г. не позволила получить данные по трем сайтам (БЕН РАН, ЦНМБ и Отделения ГПНТБ СО РАН). По этой причине в таблицу 4 включены более ранние замеры сайтов за октябрь 2017 г. В каком-то смысле, они должны быть менее полными, чем январские, так как, например, данные SimilarWeb по источникам трафика у Отделения ГПНТБ СО РАН за 25.01.2018 г. заметно улучшились, что позволило сайту переместиться из группы поисковых (1-я модель) в группу диверсифицированных (4-я модель). Показатели поискового трафика prometeus.nsc.ru за три месяца снизились на 2,76% (с 75,9 до 73,14%). В то же время реферальный трафик увеличился на 1,71% (с 9,2 до 10,91%), а социальный – на 2,7% (с 0,82 до 3,52%). Исходя из этой оценки, все показатели, внесенные в таблицу 4 по трем названным библиотекам, также должны были улучшиться. Здесь бросаются в глаза высокие метрики глубины просмотра и времени присутствия у сайтов 3-й (социальной) модели и низкий уровень отказов у 2-й (реферальной) модели. Оба результата вполне объяснимы с точки зрения способов, по которым идет развитие. «Социальные» сайты РНБ и ГПИБ располагают большим объемом качественных полнотекстовых ресурсов, отличаются скоростью обновления и эффективным продвижением в социальных сетях (табл.1, 3). С другой стороны, специфика сайтов «реферального» типа (БЕН РАН, ЦНМБ), выраженная в их ресурсной базе, навигации и веб-аудитории, усиливает прямой и ссылочный трафик (табл.3), а он, в свою очередь, подразумевает множественность переходов, не связанных с одной страницей. Во второй выборке сайтов региональных библиотек Сибири и Дальнего Востока исследование выявило намного более пеструю и малопредсказуемую картину, чем у центральных библиотек. Сбор показателей, как и по первой выборке, производился с интервалом в три месяца – 30.10.2017 и 25.01.2018 г. Но данные за январь обнаружили не только значительные колебания по ряду параметров, но и совершенно необъяснимые «всплески» значений отдельных метрик, прежде всего в сфере социального трафика. Известно, что взаимодействие с социальными сетями крайне противоречиво и может быть как позитивным, так и негативным, что, по мнению С.Ю.Комарова, может исказить картину доступов к сайтам научных библиотек [2]. Вместе с тем согласимся, что «сегодня социальные сети постепенно превращаются в своеобразные поисковые системы, так как многие пользователи с их помощью проводят поиск информации» [3, с.11]. Для развития сайтов социальный трафик считается наиболее перспективным. В нашей схеме критериев группировки (табл.2) его высокий уровень определяет отнесение сайтов к 3-й социальной модели. С учетом влияния этого фактора, а также того, что работа библиотек, а следовательно, и отражающая ее веб-статистика в январе не носят репрезентативного характера, было решено провести группировку сайтов региональных библиотек по более стабильным данным, полученным 30.10.2017 г. (табл.5). Таблица 5
Востока по данным SimilarWeb от 30.10.2017 г.
Из таблицы 5 видно, что для сайтов научных библиотек Сибири и Дальнего Востока не существует правил без исключений. Так, Национальная библиотека Республики Тыва (lib.rtyva.ru) попала во вторую (реферальную) группу с необычайно высоким поисковым трафиком, а Омская областная научная библиотека (omsklib.ru) в той же самой группе отличилась высоким показателем социального трафика. Следовательно, в отношении региональных сайтов отбор, сделанный по какому-то одному формальному признаку (например, по доминированию одного из источников трафика) совершенно не исключает присутствия аномальных значений по другим параметрам – вопреки схеме, представленной в таблице 2. В каждой группе можно выделить, условно говоря, типичных представителей своего направления. Для поисковой модели – это Тюменская областная библиотека (tonb.ru), для реферальной – Национальная библиотека Республики Саха (Якутия) (nlrs.ru), для социальной – Иркутская областная библиотека (irklib.ru) и для «смешанного» типа – библиотеки Владивостока (pgpb.ru) и Красноярска (kraslib.ru). Сильная зависимость региональных сайтов от организационно-технических условий и административных решений обусловливает большую изменчивость метрик и непрерывную миграцию сайтов из одной группы в другую. При этом генерация новых ресурсов как бы уходит на второй план, не играя решающей роли для развития большинства из региональной выборки. Более того, проведенные замеры обнаружили, что некоторые сайты, видимо, даже не архивируют свой контент и периодически избавляются от части страниц. При очередных замерах размер таких сайтов оказывался меньше предыдущего. Наверное, последующий мониторинг может принести еще немало сюрпризов. В завершение статьи отметим, что моделирование развития библиотечных сайтов показало возможности вебометрики для создания типологии сайтов, основанной на анализе структуры их трафика. Будущие прогнозы развития сайтов библиотек могут опираться на выявленные тенденции перехода сайтов от простых поисковых и «закрытых» реферальных моделей ко все более сложным и открытым социальным моделям. Выработанный подход и использованные инструменты позволят разрабатывать конкретные меры для развития и продвижения новых библиотечных ресурсов и услуг, достигая при этом наиболее эффективных результатов.
Посещение N 2393 с 04.06.2018 |