Инструменты поиска. Поисковые инструменты

Сервисов для организации процесса работы в команде сегодня столько, что за месяц не разобраться. Если испытывать все популярные и подходящие инструменты, на этой уйдет много времени, которого и так не хватает, особенно в условиях запуска стартапа.

Это до гениальности простой инструмент, созданный для управления задачами. Потребуется совсем немного времени, чтобы начать его использовать. Вся наша команда без проблем его освоила.

Самое приятное – он бесплатный!

Для организации мы используем методологию scrum:

  • у нас недельные спринты;
  • каждую субботу подведение итогов и планирование следующего этапа;
  • релизы запускаются по готовности.
Несколько наших бордов:

  • Борд «HADI» (Hypothesis, Action, Data, Insights)
  • Это интересная методология. В начале недели мы ставим гипотезы, которые относятся к определенным метрикам. В течение недели эти гипотезы проверяются, анализируются. В итоге делаем вывод: гипотеза верна или нет? Чтобы начать работу над задачей, перекидываем ее в другой борд (продукт, продвижение и др.).
  • Борд «Продукт»
  • Делим доску на листы: задачи на неделю, в процессе, сделано за неделю, баги, сделано за месяц и др.
  • Борд «Продвижение».
  • Здесь представлен наглядный план продвижения проекта. По времени, каналам, целям и т.д.
  • И др.
На Цукерберг Позвонит мы публиковали статью «Как организовать работу над SaaS-проектом в Trello ». Обязательно почитайте, мы там развернуто описали свой подход для управления задачами и метриками. И то, как мы его реализовали с помощью Trello.

Ниже как раз изображен борд «HADI». Как вы видите, каждой метрике, на которую влияет задача, соответствует свой цвет. Это сделано для того, чтобы при переносе задачи в другие борды, сохранялась понимание того, какую метрику мы хотим улучшить.

А вот так выглядит борд «Продукт». Сюда задачи попадают из борда «HADI», и каждая из них выделена определенным цветом. Мы видим, на какую метрику эта задача повлияет. Соответственно, проверять гипотезы и анализировать эффект от изменений становится намного проще.

Здорово, что как только у нас что-то меняется в процессе – придумываем новые фишки управления, или понимаем, что что-то не “совершенно” – мы тут же меняем это в трелло и начинаем использовать. Цена изменений - 3,5 секунды.

2. RealtimeBoard - управляем изменениями в интерфейсе
В онлайн-сервисах интерфейс – одна из главных составляющих продукта. Работа над дизайном постоянно кипит. Любое изменение или планирование изменений должно обсуждаться всей командой. Как-никак, в стартапе мнение каждого игрока в команде на вес золота.

Дизайнер видит задачу с точки зрения дизайна (как лучше выделить ключевые элементы, расставить акценты и т.д.), product owner с точки зрения клиента (что важно для пользователя, какие элементы забыты или что лишнее), разработчик с точки зрения технологий (не все фантазии дизайнера можно реализовать за короткий отрезок времени).

Если с обдумыванием идей и задач все просто, то как обсуждать сам дизайн? Как это обычно бывает: «Вон та штука справа внизу, нужно сделать ее чуть правее и цвет обводки сделать зеленее». Какая штука, какая обводка, что значит зеленее? Нас это не устраивало. Дизайн нужно обсуждать визуально – то есть рисовать, черкаться, видеть предыдущие итерации.

Решения должны приниматься быстро, поэтому времени на специальные встречи и обсуждения нет.
Мы используем сервис RealtimeBoard . Обсуждаем весь дизайн в нем. Сервис для этого подходит идеально. В одном месте можно держать версии всех страниц, концепции, комментарии.

Вот пример того, как мы обсуждали процесс разработки карточки пользователя:

У каждого комментария есть свой цвет:

  • желтый - просто обсуждение, вопрос, пояснение;
  • красное - необходимо изменение в данном месте;
  • зеленое - решенный вопрос (обычно красный превращается в зеленый).
Вот пример описания сценариев жизни пользователя.

Мы совместно строили цикл жизни пользователя и определяли когда какие письма и сообщения отправлять.

3. Carrot Quest - понимаем пользователей и общаемся с ними
Может и не скромно говорить о собственном сервисе, но он идеально подходит для нас. В нем мы организуем всю аналитику и общаемся с пользователями (осуществляем поддержку, делаем маркетинг, возвращаем пользователей).

Итак, пользователь зарегистрировался. Разумеется мы тут же автоматически отправляем письмо с благодарностью за регистрацию и инструкциями (как, куда установить код на сайт и т.п.).

Если мы знаем, сколько времени прошло с момента регистрации, то можем предположить, какая информация сейчас актуальна для пользователя и за счет чего вовлечь его дальше.

Мы разбиваем зарегистрировавшихся пользователей на сегменты по времени их регистрации в сервисе, чтобы помогать им на всех этапах триала (тестового периода) и вовлекать в дальнейшую работу.

Пример:

  • Прошло 2 дня триала – мы успеваем проанализировать сайт пользователя и определить, чем мы можем помочь;
  • Прошло 3-7 дней – предлагаем ряд инструкций и кейсов, которые подробно рассказывают о каждом инструменте (как настроить и эффективно использовать);
  • Прошло 7-12 дней – ежедневно присылаем статистику, которую мы собрали с помощью Carrot Quest (пример показан ниже);
  • Прошло 12 дней – мы напоминаем, что до конца триала периода осталось 2 дня и чтобы продолжить работу, необходимо оплатить. Переводим клиента на страницу с тарифными планами.
В сервисе мы смотрим подробную статистику по рассылкам (сколько отправлено за период, % прочитавших, % ответивших и т.д.). Еще важно, что мы знаем, какие именно пользователи совершили действия в письме. Так мы выбираем тех, кто письмо прочитал и если они не ответили, то интересуемся: “что пошло не так?”

Вот пример автоматического приветственного письма, которое мы отправляем сразу после регистрации.

А вот пример письма со статистикой о пользователях подключенного сайта:

Про процесс анализа действий пользователей, поддержку и активацию мы напишем в следующих статьях.

4. Slack - общаемся в команде

Стандартные мессенджеры обычно отвлекают от работы и дезорганизуют команду (skype, vk). Отказаться от них мы не можем, но считаем, что для рабочего общения нужен специальный сервис, в котором нет внешних раздражителей (друзей, знакомых, родственников). Поэтому мы используем Slack. Он отлично подходит для коммуникации внутри команды. В нем есть все необходимое.

В Slack мы делим беседы по каналам, т.к. поток информации в команде очень высокий. Если все держать в одном месте, ни к чему хорошему это не приведет. Вот наши каналы:

  • General (обсуждаем все основные моменты по проекту);
  • Design (обсуждаем дизайн);
  • Read-me (делимся полезным контентом: статьями, видео, презентациями);
  • Bugs (собственно, здесь обсуждаем баги);
  • Ideas (собираем и обсуждаем всевозможные идеи, как наши, так и наших клиентов);
  • И еще несколько других каналов. О двух из них я расскажу чуть подробнее.

Канал «Task»
Мы настроили интеграцию Trello со Slack. Теперь мы в режиме реального времени видим, какие изменения произошли в Трелло. Это помогает оперативно реагировать и понимать, на каком этапе работы мы в данный момент находимся.

Интеграция различных сервисов со Slack - штука очень классная, позволяет контролировать процессы в одном месте, не жертвуя контекстом и временем.

Канал «Notifications»

Мы интегрировали Carrot quest со Slack. Теперь мы получаем уведомление, если пользователь совершил ряд действий. Можно выбирать те действия, о совершении которых вам важно знать и получать своевременное уведомление.

К примеру, одно из действий, которое мы сами мониторим – это шаги регистрации. Как только пользователь начал регистрироваться, мы моментально получаем уведомление что за сайт он подключил. И если есть время, из уведомления в slack переходим на карточку пользователя и через чат помогаем пользователю настроить сервис.

Эти 4 сервиса помогают нам эффективно выстраивать работу и улучшать свой продукт. Мы постоянно пробуем что-то новое и постараемся делиться своим опытом.

Будет интересно узнать, как вы работаете с подобными сервисами и какие решения используете для задач подобного типа.

Работайте эффективно!

Тема 1.1
Поисковые инструменты. Организация поиска

С егодня Интернет объединяет множество разных сетей, миллионы компьютеров, более 300 миллионов пользователейвсех континентов, и, по разным оценкам, число таких пользователей увеличивается на 15-80% ежегодно. Интернет предоставляет оперативный доступ к огромным объемам информации по любой тематике, помогает осуществлять поиск и интерактивное общение с партнерами, практически, по любой специализации и в любом регионе земного шара. У пользователя появляется необходимость найти сведения по какому-либо вопросу. На языке теории информационного поиска это называется информационной потребностью . Интернет предоставляет такую возможность.

Интернет как информационное хранилище интересен своими материалами, накопившимися за десятки лет его существования. Как сориентироваться в таком колоссальном информационном пространстве, которое предоставляет для нас Интернет?

При решении данной проблемы на помощь приходят поисковые инструменты. Поисковые инструменты (ПИ) – это специальное программное обеспечение, основная задача которого – обеспечить оптимальный поиск информации в Интернете. Размещаются ПИ на специальных серверах, и каждый из них выполняет следующие четыре основные задачи:

1) анализ Web-страниц;

2) занесение результатов анализа Web-страниц на тот или другой уровень базы данных поискового сервера, в зависимости от методов автоматического индексирования, т.е. методов анализа содержимого страниц;

3) поиск документов по запросу пользователя;

4) обеспечение удобного интерфейса для поиска информации и просмотра результатов поиска пользователем.

Приемы работы, используемые при работе с разными поисковыми инструментами, практически одинаковы, при этом используются следующие понятия:

Пользовательский интерфейс поискового инструмента представлен в виде HTML-страницы с активизируемыми URL-ссылками, строкой формирования запроса (строкой поиска) и инструментами активизации запроса;

Индекс поисковой системы – результат анализа Web-страниц, размещенный в базе данных поискового сервера по определенным правилам;

Запрос – фраза или ключевые слова, записываемые пользователем в строке поиска. Для формирования запроса используются специальные символы (&&, ||, "", ~), математические символы (*, +, -), булевы операторы (and, or, not, near).

Для того чтобы объяснить поисковой службе, что ей необходимо найти, пользователь вынужден некоторым образом формализовать свою информационную потребность. Процесс формализации, как правило, сводится к выявлению набора понятий и терминов, характеризующих информационную потребность, и определению отношений между ними. Такие понятия и термины получили название ключевых слов , а выделенное множество ключевых слов с зафиксированными отношениями между ними именуются запросом .

Пользователь, набрав ключевые слова и активизировав поиск, получает список документов по сформулированному (заданному) запросу. Список документов, отобранных информационно-поисковой системой, обычно называют выдачей или откликом , а меру соответствия отклика запросу или информационной потребности – релевантностью отклика. Этот список ранжируется по определенным критериям так, чтобы вверху списка оказались те документы, которые наиболее соответствуют запросу пользователя. Каждый из поисковых инструментов использует различные критерии ранжирования документов, как при анализе результатов поиска, так и при формировании индекса (наполнении индексной базы данных Web-страниц). Вследствие этого, если вы укажете в строке поиска для каждого поискового инструмента одинаковой конструкции запрос, получите различные результаты поиска.

Для результатов поиска информации в Интернет можно выделить четыре основных характеристики:

Полнота;

Точность;

Актуальность;

Скорость получения.

На каждую их этих характеристик влияет ряд факторов, о которых должен знать пользователь, приступая к поиску. Часть из них являются объективными, т.е. пользователь не может повлиять на них. Однако три основных фактора пользователь должен учитывать при проведении поисковых работ. К ним относятся:

1) выбор информационно-поискового пространства внутри сети;

2) особенности информационно-поисковой системы;

3) качество построения запроса.

Каждый из поисковых инструментов предлагает два способа поиска, простой (Simple Search) и расширенный (Advanced Search), во втором случае – с использованием специальной формы запроса, в первом – без нее.

Освоив критерии уточнения запроса и приемы расширенного поиска, вы можете увеличить эффективность поиска и достаточно быстро найти нужную информацию. Прежде всего, увеличить эффективность поиска можно за счет использования в запросах логических операторов (операций) or(или) , and (и) , nea r(близко ) no t (не ), математических и специальных символов. С помощью операторов и/или и символов пользователь связывает ключевые слова в нужной последовательности, чтобы получить наиболее адекватный запросу результат поиска.

Ниже приведены таблицы с примерами использования простых и расширенных запросов с использованием булевых операторов:

Простой запрос
образование
образован*
высшее образование
“высшее образование”

Во втором примере используется символ звездочка. Это означает, что ищутся все документы по данной маске, т.е. все словообразования от слова «образование» и само это слово в разных падежах.

В третьем примере записаны просто ключевые слова, поэтому в выдаваемом списке документов по такому запросу между данными ключевыми словами могут располагаться и другие слова, союзы и т.д.

В последнем примере использование кавычек – “высшее образование” означает поиск целой фразы.

Простой запрос дает значительное количество ссылок на документы, т.к. в список попадают документы, содержащие одно из слов, введенных при запросе, или простое словосочетание.

Расширенный запрос с использованием булевых операторов.

Оператор and позволяет указать на то, что в содержании документа должны быть включены все ключевые слова. Тем не менее, количество документов может быть все еще велико, и их просмотр займет достаточно времени. Поэтому в ряде случаев гораздо удобнее применить контекстный оператор near , указывающий, что слова должны располагаться в документе в достаточной близости. Использование near значительно уменьшит количество найденных документов.

При формировании запроса можно использовать математические знаки. «Плюс» (+), поставленный перед любым словом запроса, заставит поисковик обязательно учесть это слово при обработке запроса. «Минус» (-) соответствует оператору (НЕ ) и работает на исключение термина из результатов. Таким образом, оператор НЕ - первое средство уточнения слишком широких запросов. Знаки (+ и -) ставятся в запросе перед нужным словом, при этом они не должны отделяться от него пробелами.

Еще один способ сузить поиск – использовать специальные ключевые слова. Специальным образом записанные ключевые слова представлены в следующей таблице. Однако использовать их надо очень внимательно, так как не все поисковые инструменты поддерживают поиск по перечисленным ключевым словам. Чтобы удостовериться, какие ключевые слова поддерживаются данным поисковым инструментом, следует просматривать его справочную информацию или гиперссылку Помощь .

host: <адрес_узла> Выдает список документов с узлов, в имени которых присутствует значение, введенное в параметре <адрес_узла>. Например, по запросу host: www.skags.ruбудет получен список документов, расположенных на сервере, чей адрес www.skags.ru(рис.1.1)
url: <текст> Находит страницы, в адрес которых входит определенное слово или фраза. Указав url: Microsoft, вы найдете все страницы, адреса (URL) которых содержат слово Microsoft (рис.1.2)
link: Находит документы, на которых есть ссылка на указанный URL. Запрос link: altavista.com поможет найти все страницы, которые содержат ссылку на AltaVista(рис.1.3)
image <текст> Находит документы с изображениями, в название или описание которых входит слово, введенное в качестве параметра текст. Например, по запросу image Russia мы получим список адресов документов, в которых содержится изображение, в состав имени или описания которого входит слово Russia(рис.1.4)
title <текст> Находит документы, в заголовок которых входит указанная фраза (имеется в виду название документа, которое отображается в строке заголовка при открытии документа в браузере). Запрос title Windows 7 поможет найти страницы со словом Windows 7в заголовке.

Примеры использования специальных ключевых слов в разных поисковых системах приведены ниже.

Рис.1.1. host

Рис.1.2. Использование специального ключевого слова url

Рис.1.3. Использование специального ключевого слова link

Рис 1.4. Использование специального ключевого слова image

Рис 1.5 . Использование специального ключевого слова title

Тема 1.2
Поисковые серверы

Путь к огромному информационному багажу человечества, хранящемуся в библиотеках, фонотеках, фильмотеках, лежит через карточки каталогов. В Интернет существуют аналогичные механизмы для нахождения требуемой информации. Это поисковые серверы, служащие отправной точкой для пользователей сети. Поисковые серверы можно разделить на тематические каталоги (поисковые каталоги), роботы индексов (поисковые машины или поисковые системы), системы мета поиска .

Тематические каталоги Интернета аналогичны библиотечным, информация в них имеет иерархическую структуру, классифицирована по темам, охватывающим все сферы деятельности человека: искусство, науку, образование и т.д. Каталогами пользуются тогда, когда не вполне четко знают, что именно ищут, когда предметная область очерчена, но поиск не конкретизирован. Входя в любой раздел, пользователь видит все более и более дробную детализацию. Здесь возможен и поиск информации по ключевому слову.

Каталоги возникли из интересных ссылок, закладок. Они строятся по принципу от общего к частному. Каталоги могут быть:

1) общего назначения (включают ресурсы всех сфер жизнедеятельности человека);

2) специализированные (объединяют ресурсы, посвященные определенной тематике).

Ведение каталогов частично автоматизировано, но до сих пор классификация ресурсов осуществляется вручную. Каталоги не самообновляются.

Рассмотрим наиболее популярные, на наш взгляд, поисковые каталоги: русские и глобальные. Ниже представлены названия каталогов и их адреса в Интернет.

Рассмотрим поисковые системы и их особенности. Эти системы еще называют роботами индексов или поисковыми машинами.

Поисковые машины устроены несколько иначе по сравнению с поисковыми каталогами. По сути это сервер с огромной базой данных URL-адресов, который автоматически обращается к страницам WWW по всем этим адресам, изучает содержимое этих страниц, формирует и прописывает ключевые слова со страниц в свою базу данных (индексирует страницы). Более того, этот сервер обращается по всем встречаемым на страницах ссылкам и, переходя к новым страницам, проделывает с ними тоже самое. Все ссылки помещаются в базу данных. Пользователи используют ключевые слова, которые поисковая система ищет по базе данных. Выдача результатов поиска состоит из выдержек рекомендованных пользователю страниц, их адресов (URL), оформленных в виде гиперссылок.

В случае поисковых систем огромный объем информации обрабатывается автоматически. Для поисковых систем характерно самообновление.

Рассмотрим наиболее популярные на наш взгляд поисковые системы: русские и глобальные. Конечно, в Интернете поисковых систем значительно больше, но, на наш взгляд, представленные являются наиболее популярными и востребованными.

Тема 1.3
Поиск информации в Интернет

Стратегии, применяемые для поиска информации в Интернет, постоянно совершенствуются. ПоисквWeb это во многом искусство, основанное на знании самой сети, возможностях поисковых систем и, в значительно меньшей степени, – на возможностях конкретного браузера. Как правило, браузеры имеют панель, с помощью которой можно выполнять функции по поиску в Web .

Преимущество такой панели состоит в том, что вы можете отправить запрос на несколько серверов с одной страницы, значительно экономя время, потому что не надо загружать заглавные страницы этих поисковых серверов друг за другом. Подобные средства, обеспечивающие доступ сразу к нескольким поисковым системам, называются мета-поисковыми средствами поиска.

К сожалению, подобные средства мета-поиска отнюдь не свободны от недостатков. Главный из них состоит в том, что мета-поиск на поддерживаемых серверах осуществляется по наиболее упрощенной методике (Simple Search). Это связано с тем, что каждая поисковая система имеет свой набор дополнительных опций по сужению области поиска, применению булевых операторов и т. д. Естественно, что в случае простого «поиска» (Simple Search) из поля зрения выпадают документы, которые могли бы быть найдены при более тщательном поиске продвинутыми средствами конкретного сервера.

Лекция 4. Инструменты информационного поиска

Постоянное обновление информационного массива в сочетании с приростом объема данных крайне усложняет учет имеющихся документов и, соответственно, поиск, который условно можно разделить на:

  • фактографический поиск: в энциклопедиях, справочниках, словарях,
  • библиографический поиск: библиотеки, каталоги, программы.
  • документальный поиск: электронные документы, электронные библиотеки, электронные журналы.

Важность проблемы информационного поиска привела к образованию целой отрасли, задача которой заключается именно в оказании помощи пользователю по навигации в киберпространстве. Составляют эту отрасль специальные поисковые службы или сервисы . Их традиционно разделяют на:

  • справочники или каталоги
  • поисковые системы

Эти разновидности визуально очень похожи, поскольку «каждый справочник обладает собственной поисковой системой, а каждая поисковая система - собственным справочником» . Однако принципы их работы базируются на абсолютно разных подходах и технологиях. При этом каждая разновидность поисковых сервисов применяется в решении определенного типа задач. Информационный поиск подразумевает использование определенных стратегий, методов, механизмов и средств. Поведение пользователя, осуществляющего управление процессом поиска, определяется не только информационной потребностью, но и инструментальным разнообразием системы - технологиями и средствами, предоставляемыми системой. Выбором инструмента во многом определяется стратегия поисковой деятельности и поисковые технологии.

Поисковые технологии - унифицированные (оптимизированные в рамках конкретной информационно-поисковой системы) последовательности эффективного использования отдельных средств поиска в процессе взаимодействия пользователя с системой.

По используемым поисковым технологиям информационные системы можно разбить на 3 категории:

  • тематические каталоги и специализированные каталоги (онлайновые справочники);
  • поисковые машины (полнотекстовый поиск);
  • средства мета-поиска.

Тематические каталоги предусматривают обработку документов и отнесение их к одной из нескольких категорий, перечень которых заранее задан. Фактически это знакомое всем библиотекарям индексирование на основе классификации . Специализированные каталоги или справочники создаются по отдельным отраслям и темам. Поисковые машины (самое развитое средство поиска в Интернете) реализуют технологию полнотекстового поиска. Индексируются тексты, расположенные на запрашиваемых серверах. При использовании средств метапоиска запрос осуществляется одновременно несколькими поисковыми системами. Результат поиска объединяется в общий, упорядоченный по степени релевантности, список.

Средства поиска - взаимозависимый комплекс информационно-поисковых языков и языков определения/управления данными, обеспечивающий структурные и семантические преобразования объектов обработки (документов, словарей, совокупностей результатов поиска).

1. Справочники

Поисковые средства первой группы представляют собой электронные справочники, имеющие четкую иерархическую систематическую или логико-тематическую структуру, во многом напоминающую структуру систематического каталога библиотеки . Работа со справочниками позволяет ориентироваться в Интернет-ресурсах в пределах отдельных отраслей знания, углубляясь от общего к частному, меняя иерархические ветви, возвращаясь на несколько шагов назад и т.д.

Среди российских разработок в этой области значатся:

  • Апорт (адрес: www.aport.ru ),
  • List.ru (адрес: list.mail.ru ),
  • Weblist (адрес: www.weblist.ru ),
  • Иван Сусанин (адрес: www.susanin.net )
  • Улитка (адрес: www.ulitka.ru ).

Главной отличительной особенностью справочников является то, что они сделаны вручную. Редакционные коллегии каждого из справочников, которые по характеру труда напоминают отделы каталогизации и систематизации крупных библиотек , регулярно просматривают содержимое вновь появившихся серверов и отслеживают изменения на уже существующих. Выявленные данные анализируются и заносятся в разделы справочника в соответствии с принятой классификацией. Описание сервера в целом (или раздела, если он представляется вполне самостоятельным блоком) снабжается краткой аннотацией, содержащей общие сведения о характере имеющейся информации. В некоторых случаях заносятся добавочные сведения о языке документов, посещаемости ресурса, его физическом месторасположении и т.п.

Основными параметрами, характеризующими достоинства справочников, являются:

  • объем;
  • оперативность отражения новых или изменившихся ресурсов;
  • логичность и последовательность иерархической схемы классификации;
  • перекрестность структуры.

Объемом справочника определяется степень его надежности или « информационная прочность» . В некоторых системах существует специальный механизм, периодически проверяющий доступность сайта и исключающий его из перечня при долгом «отсутствии» в Сети. Логичностью (научностью) применяемой схемы классификации определяется степень простоты, с которой пользователи находят требуемые сведения. Система перекрестных ссылок позволяет выявить информацию, используя разные подходы (например, территориальный или отраслевой). В этом случае схема классификации должна автоматически выводить пользователя на искомый объект, какой бы путь поиска не был выбран.

Возможности составления запроса для этого вида поисковых средств особой роли не играют. Сложные разыскания, требующие детализации запроса, с помощью каталогов не проводятся.

Справочники предназначены для решения трех типов задач :

  • ориентация в незнакомой отрасли знания;
  • разыскание крупных объектов, каковыми являются, к примеру, серверы организаций или значительных проектов;
  • получение готового перечня ресурсов, имеющих размытый поисковый образ (библиотек определенного типа, транспортных расписаний или сайтов политических партий и т.д.)

Другим примером является сравнение справочника ресурсов с систематическим каталогом библиотеки, в котором от книги (в данном случае, целого сайта) остается лишь описание и аннотация.

2. Поисковые системы

В основу работы поисковых систем (поисковых машин) заложены совершенно иные технологические принципы. Задача поисковых машин - обеспечить детальное разыскание информации, что может быть достигнуто только за счет учета (индексирования ) содержания максимально возможного числа веб-страниц. В отличие от справочников, поисковые машины функционируют в автоматизированном режиме и имеют единообразный принцип действия.

Поисковые системы состоят из двух базовых компонентов. Первый компонент представляет собой программу-робот , задача которого передвигаться с сервера на сервер и находить там новые (или изменившиеся) документы, скачивая их на главный компьютер системы. Робот просматривает содержимое документа, находит новые ссылки, - как на другие документы сервера, так и внешние сайты. Далее программа самостоятельно направляется по указанным ссылкам, находит новые документы, после чего процесс повторяется вновь, напоминая хорошо известный в библиографии «метод снежного кома» . Выявленные документы обрабатываются (индексируются) вторым компонентом поисковой системы. При этом, как правило, учитывается все содержание страницы, включая текст, иллюстрации, аудио- и видеофайлы. Индексации подвергаются все слова в документе, что дает возможность использовать поисковые системы для детального поиска по самой узкой тематике. Образуемые индексные файлы , хранящие информацию о том, какое ключевое слово, сколько раз, в каком документе и на каком сервере употребляется, составляют ту базу данных, к которой обращается библиотекарь, вводящий в строку запроса сочетания ключевых слов.

Вывод результатов осуществляется с помощью специального модуля, который производит интеллектуальное ранжирование результатов . При этом в расчет берется:

  • местоположение термина в документе (название, заголовок, основной текст), частота его повторения,
  • процентное соотношение искомого термина к тексту страницы,
  • число и авторитетность внешних ссылок на данную страницу с других сайтов.

К основным параметрам поисковых систем относятся:

  • число проиндексированных серверов и отдельных документов (объем индексных файлов);
  • степень оперативности обновления базы данных за счет включения сведений о новых материалах и удаления устаревших;
  • возможности для составления запроса;
  • интеллектуальность системы ранжирования результатов поиска;
  • наличие дополнительных сервисных функций, облегчающих работу пользователя.

Возможности поискового механизма выражать запрос максимально точно в значительной степени предопределяют качество полученных результатов. Каждая машина имеет свою собственную лексику, которая по-разному позволяет детализировать поисковое предписание .

Все поисковые машины обладают модулем ранжирования результатов поиска . Это второй базовый компонент всех систем. Перечень факторов, принимаемых во внимание при определении места документа в перечне ссылок, необычайно широк: от местоположения слова на странице до рейтинга (авторитета) страниц, имеющих ссылки на найденный документ.

  • Google (адрес: www.google.com ),
  • AlltheWeb (адрес: www.alltheweb.com ),
  • Alta Vista (адрес: www.altavista.com ).

Подобные поисковые средства существуют и в России. Все они предназначены для работы с русскоязычными документами и обладают мощным http://www.metabot.ru ).

Выводы по теме лекционного блока

Поисковая система делает выборку страниц из базы данных в соответствии с запросом, затем страницы упорядочиваются по степени убывания совпадений (примеч. А.А.)

В данном случае наблюдается прямая аналогия с принципами работы распределенных сводных каталогов библиотеки. Ключевой возможностью мета-поиска является способность рассылать запросы пользователя одновременно по различным поисковых системам - с последующим суммированием результатов. (примеч. А.А.)

Обращаясь к справочникам, библиотекарь может рассчитывать на получение лишь очень общих сведений по тематике, и никогда - детальных данных: от сервера крупной корпорации, содержащего тысячи страниц, в справочнике будет представлено лишь наименование и несколько строк аннотации.

1. Введение

С каждым годом объемы Интернета увеличиваются в разы, поэтому вероятность найти необходимую информацию резко возрастает. Интернет объединяет миллионы компьютеров, множество разных сетей, число пользователей увеличивается на 15-80% ежегодно. И, тем не менее, все чаще при обращении к Интернет основной проблемой оказывается не отсутствие искомой информации, а возможность ее найти. Как правило, обычный человек в силу разных обстоятельств не может или не хочет тратить на поиск нужного ему ответа больше 15-20 минут. Поэтому особенно актуально правильно и грамотно научиться, казалось бы, простой вещи – где и как искать, чтобы получать ЖЕЛАЕМЫЕ ответы.

Чтобы найти нужную информацию, необходимо найти её адрес. Для этого существуют специализированные поисковые сервера (роботы индексов (поисковые системы), тематические Интернет-каталоги, системы мета-поиска, службы поиска людей и т.д.). В данном мастер-классе раскрываются основные технологии поиска информации в Интернете, предоставляются общие черты поисковых инструментов, рассматриваются структуры поисковых запросов для наиболее популярных русскоязычных и англоязычных поисковых систем.

2. Технологии поиска

Web-технология World Wide Web (WWW) считается специальной технологией подготовки и размещения документов в сети Интернет. В состав WWW входят и web-страницы, и электронные библиотеки, каталоги, и даже виртуальные музеи! При таком обилии информации остро встает вопрос: «Как сориентироваться в столь огромном и масштабном информационном пространстве?»
В решении данной проблемы на помощь приходят поисковые инструменты.

2.1 Поисковые инструменты

Поисковые инструменты - это особое программное обеспечение, основная цель которого – обеспечить наиболее оптимальный и качественный поиск информации для пользователей Интернета. Поисковые инструменты размещаются на специальных веб-серверах, каждый из которых выполняет определенную функцию:

  1. Анализ веб-страниц и занесение результатов анализа на тот или иной уровень базы данных поискового сервера.
  2. Поиск информации по запросу пользователя.
  3. Обеспечение удобного интерфейса для поиска информации и просмотра результата поиска пользователем.

Приемы работы, используемые при работе с теми или другими поисковыми инструментами, практически одинаковы. Перед тем как перейти к их обсуждению, рассмотрим следующие понятия:

  1. Интерфейс поискового инструмента представлен в виде страницы с гиперссылками, строкой подачи запроса (строкой поиска) и инструментами активизации запроса.
  2. Индекс поисковой системы – это информационная база, содержащая результат анализа веб-страниц, составленная по определенным правилам.
  3. Запрос – это ключевое слово или фраза, которую вводит пользователь в строку поиска. Для формирования различных запросов используются специальные символы ("", ~), математические символы (*, +, ?).

Схема поиска информации в сети Интернет проста. Пользователь набирает ключевую фразу и активизирует поиск, тем самым получает подборку документов по сформулированному (заданному) запросу. Этот список документов ранжируется по определенным критериям так, чтобы вверху списка оказались те документы, которые наиболее соответствуют запросу пользователя. Каждый из поисковых инструментов использует различные критерии ранжирования документов, как при анализе результатов поиска, так и при формировании индекса (наполнении индексной базы данных web-страниц).

Таким образом, если указать в строке поиска для каждого поискового инструмента одинаковой конструкции запрос, можно получить различные результаты поиска. Для пользователя имеет большое значение, какие документы окажутся в первых двух-трех десятках документов по результатам поиска и на сколько эти документы соответствуют ожиданиям пользователя.

Большинство поисковых инструментов предлагают два способа поиска – simple search (простой поиск) и advanced search (расширенный поиск) с использованием специальной формы запроса и без нее. Рассмотрим оба вида поиска на примере англоязычной поисковой машины.

Например, AltaVista удобно использовать для произвольных запросов, «Something about online degrees in information technology», тогда как поисковый инструмент Yahoo позволяет получать мировые новости, информацию о курсе валют или прогнозе погоды.

Освоение критериев уточнения запроса и приемов расширенного поиска, позволяет увеличивать эффективность поиска и достаточно быстро найти необходимую информацию. Прежде всего, увеличить эффективность поиска Вы можете за счет использования в запросах логических операторов (операций) Or, And, Near, Not, математических и специальных символов. С помощью операторов и/или символов пользователь связывает ключевые слова в нужной последовательности, чтобы получить наиболее адекватный запросу результат поиска. Формы запросов приведены в таблице 1.

Таблица 1

Простой запрос дает некоторое количество ссылок на документы, т.к. в список попадают документы, содержащие одно из слов, введенных при запросе, или простое словосочетание (см. таблицу 1). Оператор and позволяет указать на то, что в содержании документа должны быть включены все ключевые слова. Тем не менее, количество документов может быть все еще велико, и их просмотр займет достаточно времени. Поэтому в ряде случаев гораздо удобнее применить контекстный оператор near, указывающий, что слова должны располагаться в документе в достаточной близости. Использование near значительно уменьшает количество найденных документов. Наличие символа "*" в строке запроса означает, что будет осуществляться поиск слова по его маске. Например, получим список документов, содержащих слова, начинающиеся на "gov", если в строке запроса запишем "gov*". Это могут быть слова government, governor и т.д.

Не менее популярная поисковая система Rambler ведет статистику посещаемости ссылок из собственной базы данных, поддерживаются те же логические операторы И, ИЛИ, НЕ, метасимвол * (аналогично расширяющему диапазон запроса символу * в AltaVista), коэффициентные символы + и -, для увеличения или уменьшения значимости вводимых в запрос слов.

Давайте рассмотрим наиболее популярные технологии поиска информации в Интернет.

2.2 Поисковые машины (search engines)

Машины веб-поиска - это сервера с огромной базой данных URL-адресов, которые автоматически обращаются к страницам WWW по всем этим адресам, изучают содержимое этих страниц, формируют и прописывают ключевые слова со страниц в свою базу данных (индексирует страницы).

Более того, роботы поисковых систем переходят по встречаемым на страницах ссылкам и переиндексируют их. Так как почти любая страница WWW имеет множество ссылок на другие страницы, то при подобной работе поисковая машина в конечном результате теоретически может обойти все сайты в Интернет.

Именно этот вид поисковых инструментов является наиболее известным и популярным среди всех пользователей сети Интернет. У каждого на слуху названия известных машин веб-поиска (поисковых систем) – Яndex, Rambler, Aport.

Чтобы воспользоваться данным видом поискового инструмента, необходимо зайти на него и набрать в строке поиска интересующее Вас ключевое слово. Далее Вы получите выдачу из ссылок, хранящихся в базе поисковой системы, которые наиболее близки Вашему запросу. Чтобы поиск был наиболее эффективен, заранее обратите внимание на следующие моменты:

  • определитесь с темой запроса. Что именно в конечном итоге Вы хотите найти?
  • обращайте внимание на язык, грамматику, использование различных небуквенных символов, морфологию.Важно также правильно сформулировать и вписать ключевые слова. Каждая поисковая система имеет свою форму составления запроса - принцип один, но могут различаться используемые символы или операторы. Требуемые формы запроса различаются также в зависимости от сложности программного обеспечения поисковых систем и предоставляемых ими услуг. Так или иначе, каждая поисковая система имеет раздел "Help" ("Помощь"), где все синтаксические правила, а также рекомендации и советы по поиску, доступно объясняются (скриншот страничек поисковиков).
  • используйте возможности разных поисковых систем. Если не нашли на Яndex, попробуйте на Google. Пользуйтесь услугами расширенного поиска.
  • чтобы исключить документы, содержащие определенные термины, используйте знак "-" перед каждым таким словом. Например, если Вам нужна информация о работах Шекспира, за исключением "Гамлета", то введите запрос в виде: "Шекспир-Гамлет". И для того, чтобы, наоборот, в результаты поиска обязательно включались определенные ссылки, используйте символ "+". Так, чтобы найти ссылки о продаже именно автомобилей, Вам нужен запрос "продажа+автомобиль". Для увеличения эффективности и точности поиска, используйте комбинации этих символов.
  • каждая ссылка в списке результатов поиска содержит – несколько строчек из найденного документа, среди которых встречаются Ваши ключевые слова. Прежде чем переходить по ссылке, оцените соответсвие сниппета теме запроса. Перейдя по ссылке на определенный сайт, внимательно окиньте взглядом главную страничку. Как правило, первой страницы достаточно, чтобы понять – по адресу Вы пришли или нет. Если да, то дальнейшие поиски нужной информации ведите на выбранном сайте (в разделах сайта), если нет – возвращайтесь к результатам поиска и пробуйте очередную ссылку.
  • помните, что поисковые системы не производят самостоятельную информацию (за исключением разъяснений о самих себе). Поисковая система – это лишь посредник между обладателем информации (сайтом) и Вами. Базы данных постоянно обновляются, в них вносятся новые адреса, но отставание от реально существующей в мире информации все равно остается. Просто потому, что поисковые системы не работают со скоростью света.

К наиболее известным машинам веб-поиска относятся Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Среди русскоязычных можно выделить Яndex, Rambler, Апорт.

Поисковые системы являются самыми масштабными и ценными, но далеко не единственными источниками информации в Сети, ведь помимо них существуют и другие способы поиска в Интернете.

2.3 Каталоги (directories)

Каталог Интернет-ресурсов – это постоянно обновляющийся и пополняющийся иерархический каталог, содержащий множество категорий и отдельных web-серверов с кратким описанием их содержимого.Способ поиска по каталогу подразумевает «движение вниз по ступенькам», то есть движение от более общих категорий к более конкретным. Одним из преимуществ тематических каталогов является то, что пояснения к ссылкам дают создатели каталога и полностью отражают его содержание, то есть дает Вам возможность точнее определить, насколько соответствует содержание сервера цели Вашего поиска.

Примером тематического русскоязычного каталога можно назвать ресурс http://www.ulitka.ru/ .

На главной странице данного сайта расположен тематический рубрикатор,

с помощью которого пользователь попадает в рубрику со ссылками на интересующую его продукцию.

Кроме того, некоторые тематические каталоги позволяют искать по ключевым словам. Пользователь вводит необходимое ключевое слово в строку поиска

и получает список ссылок с описаниями сайтов, которые наиболее полно соответствуют его запросу. Стоит отметить, что этот поиск происходит не в содержимом WWW-серверов, а в их кратком описании, хранящихся в каталоге.

В нашем примере в каталоге также имеется возможность сортировки сайтов по количеству посещений, по алфавиту, по дате занесения.

Другие примеры русскоязычных каталогов:
Каталог@Mail.ru
Weblist
Vsego.ru
Cреди англоязычных каталогов можно выделить:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Подборки ссылок

Подборки ссылок – это отсортированные по темам ссылки. Они достаточно сильно отличаются друг от друга по наполнению, поэтому чтобы найти подборку, наиболее полно отвечающую Вашим интересам, необходимо ходить по ним самостоятельно, дабы составить собственное мнение.

В качестве примера приведем Подборку ссылок "Сокровища Интернет" АО "Релком"

Пользователь, нажимая на любую из заинтересовавших его рубрик

  • СОДЕРЖАНИЕ

    Автомобилистам

    • Астрономия и астрология
    • Ваш дом
    • Ваши питомцы
    • Дети - цветы жизни
    • Досуг
    • Города в Сети Internet
    • Здоровье и медицина
    • Информационные агентства и службы
    • Краеведческий музей и т.д.,
    • Автомобильная электроника.
    • Музей автомото старины.
    • Коллегия Правовой Защиты Автовладельцев.
    • Sportdrive.

    Преимуществом такого вида поисковых инструментов является их целенаправленность, обычно подборка включает в себя редкие интернет ресурсы, подобранные конкретным веб-мастером или хозяином интернет странички.

    2.5 Базы данных адресов (addresses database)

    Базы данных адресов – это специальные поисковые сервера, которые обычно используют классификации по роду деятельности, по выпускаемой продукции и оказываемым услугам, по географическому признаку. Иногда они дополнены поиском по алфавиту. В записях базы данных хранится информация о сайтах, которые предоставляют информацию об электронном адресе, организации и почтовом адресе за определенную плату.

    Крупнейшей англоязычной базой данных адресов можно назвать: http://www.lookup.com/ -

    Попадая в данные поддиректории, пользователь обнаруживает ссылки на сайты, которые и предлагают интересующую его информацию.

    Широко доступных и официальных баз данных адресов в РФ нам неизвестно.

    2.6 Поиск в архивах Gopher (Gopher archives)

    Gopher – это взаимосвязанная система серверов (Gopher-пространство), распределенная по Интернет.

    В пространстве Gopher собрана богатейшая литературная библиотека, однако материалы недоступны для просмотра в удаленном режиме: пользователь может только просматривать иерархически организованное оглавление и выбирать файл по названию. С помощью специальной программы (Veronica) такой поиск можно сделать и автоматически, используя запросы, построенные на ключевых словах.

    До 1995 года Gopher являлся самой динамичной технологией Интернет: темпы роста числа соответствующих серверов опережали темпы роста серверов всех других типов Интернет. В сети EUnet/Relcom активного развития серверы Gopher не получили, и сегодня о них практически никто не вспоминает.

    2.7 Система поиска FTP файлов (FTP Search)

    Система поиска FTP-файлов – это особый тип средств поиска в Internet, который позволяет находить файлы, доступные на «анонимных» FTP-серверах. Протокол FTP предназначен для передачи по сети файлов, и в этом смысле он функционально является своеобразным аналогом Gopher.

    Основным критерием поиска является название файла, задаваемое разными способами (точное соответствие, подстрока, регулярное выражение и т.д.). Данный тип поиска, конечно же, не может соперничать по возможностям с поисковыми машинами, так как содержимое файлов никак не учитывается при поиске, а файлам, как известно, можно давать произвольные имена. Тем не менее, если Вам требуется найти какую-нибудь известную программу или описание стандарта, то с большой долей вероятности файл, его содержащий, будет иметь соответствующее имя, и Вы сможете найти его при помощи одного из серверов FTP Search :

    FileSearch ищет файлы на FTP-серверах по именам самих файлов и каталогов. Если Вы ищете какую-либо программу или еще что-то, то на WWW-серверах Вы скорее найдете их описание, а с FTP-серверов Вы сможете перекачать их к себе.

    2.8 Система поиска в конференциях Usenet News

    USENET NEWS – это система телеконференций сообщества сетей Интернет. На Западе этот сервис принято называть новостями. Близким аналогом телеконференций являются и так называемые "эхи" в сети FIDO.

    С точки зрения абонента телеконференции, USENET представляют из себя доску объявлений, в которой есть разделы, где можно найти статьи на любую тему - от политики до садоводства. Эта доска объявлений доступна через компьютер, подобно электронной почте. Не отходя от компьютера, можно читать или помещать статьи в ту или иную конференцию, найти полезный совет или вступать в дискуссии. Естественно, статьи занимают место на компьютерах, поэтому не хранятся вечно, а периодически уничтожаются, освобождая место для новых. Во всем мире лучшим сервисом для поиска информации в конференциях Usenet является сервер Google Groups (Google Inc.).

    Группы Google – это бесплатное интерактивное сообщество и служба групп обсуждений, которая предлагает самый обширный в Интернете архив сообщений сети Usenet (более миллиарда сообщений).Подробнее ознакомиться с правилами пользования сервисом можно на странице http://groups.google.com/intl/ru/googlegroups/tour/index.html

    Среди русскоязычных выделяется сервер Всемирная система USENET и телеконференции Relcom. Точно также как и в других поисковых службах, пользователь набирает строку запроса, а сервер формирует список конференций, содержащих ключевые слова. Далее надо подписаться на отобранные конференции в программе работы с новостями. Также имеет место аналогичный российский сервер FidoNet Online: конференции Fido на WWW.

    2.9 Системы мета-поиска

    Для быстрого поиска в базах сразу нескольких поисковых систем лучше обратиться к системам мета-поиска.

    Системы мета-поиска – это поисковые машины, которые посылают Ваш запрос на огромное количество разных поисковых систем, затем обрабатывают полученные результаты, удаляют повторяющиеся адреса ресурсов и представляют более широкий спектр того, что представлено в сети Интернет.

    Наиболее популярная в мире система мета-поиска Search.com .

    Объединенный поисковый сервер Search.com компании CNET, Inc. включает в себя почти два десятка поисковых систем, ссылками на которые пестрит весь Интернет.

    С помощью данного вида поисковых инструментов пользователь может искать информацию во множестве поисковых систем, однако отрицательной стороной данных систем можно назвать их нестабильность.

    2.10 Системы поиска людей

    Системы поиска людей – это специальные сервера, которые позволяют осуществлять поиск людей в Интернет, пользователь может указать Ф.И.О. человека и получить его адрес электронной почты и URL-адрес. Однако, следует отметить, что системы поиска людей, в основном, берут информацию об электронных адресах из открытых источников, таких как конференции Usenet. Среди самых известных систем поиска людей можно выделить:

    Поиск адресов e-mail

    в специальные графы поиска контактные данные (First Name. City, Last Name, Phone number), Вы можете найти интересующую Вас информацию.

    Системы поиска людей - это действительно большие сервера, их базы данных содержат порядка 6 000 000 адресов.

    3. Заключение

    Мы рассмотрели основные технологии поиска информации в Интернет и представили в общих чертах поисковые инструменты, которые существуют на данный момент в Интернете, а также структуру поисковых запросов для наиболее популярных русскоязычных и англоязычных поисковых систем и, подводя итог вышесказанному, хотим отметить, что единой оптимальной схемы поиска информации в Интернет не существует. В зависимости от специфики нужной Вам информации, Вы можете использовать соответствующие поисковые инструменты и службы. А от того, как грамотно будут подобраны поисковые службы, зависит качество результатов поиска.

  • Классификация поисковых инструментов (их типы и виды) Поисковые инструменты можно разделить на: - каталоги или директории - directories - поисковые системы - search engines. В основу этой классификации положен принцип отбора и обработки информации для базы данных поискового инструмента, а именно: насколько этот процесс автоматизирован, кто создает базу данных поискового инструмента: люди или компьютеры.


    Классификация поисковых инструментов (их типы и виды) В последнее время разница между поисковыми системами и директориями «стирается», поскольку их создатели стараются не акцентировать внимание пользователей на принципах отбора информации, а представляют как можно больше схожих сервисных возможностей, работая как универсальные порталы. Но разница в отборе и обработке информации все-таки остается существенно важной и определяющей: – поисковые машины используют машины-роботы для поиска, индексации информации – т.е. Процесс полностью автоматизирован; - директории построены на том, что сайт «дожидается» быть принятым, обработанным и описанным неким специалистом- каталогизатором.


    Классификация поисковых инструментов (их типы и виды) Такие отличные друг от друга принципы работы поисковых систем и директорий значительно влияют на их объем и содержание, а соответственно – и на стратегию поиска: Поисковые системы индексируют содержимое того или иного сайта полностью и поиск ведется по всем его полным текстам. Директории представляют тот или иной сайт в общих чертах – каталогизатор аннотирует и систематизирует сайт в соответствии с его общим содержанием и полные тексты не индексируются. Поисковые системы индексируют большое количество сайтов, поскольку роботы, «просматривающие» содержимое Сети действуют по принципу «снежного кома», путешествуя от ссылки к ссылке. Директории же отличаются осмысленностью и упорядоченностью подбора сайтов в свои базы данных (обычно это информационно насыщенные и/или сайты крупных физических объектов).


    Классификация поисковых инструментов (их типы и виды) Итак, некоторые поисковые системы: Altavista (Яndex (Google (Rambler (FastSearch (


    Классификация поисковых инструментов (их типы и виды) И директории (или каталоги): Yahoo (Librarians Index to the Internet (lii.org) List.ru (


    Классификация поисковых инструментов (их типы и виды) Среди перечисленных, как вы заметили, есть как универсальные глобальные поисковые инструменты, так и универсальные региональные (в данном случае - российские). Приведем и некоторые другие: EuroFerret (Voila (Altavista France (fr.altavista.com) UKPlus (ukplus.co.uk)


    Классификация поисковых инструментов (их типы и виды) Деление поисковых инструментов на глобальные и региональные – не что иное, как классификация по географическому принципу отбора ресурсов для индексации. Другие поисковые инструменты также содержательно органичивают свои базы данных, но по – тематике: FindLaw (Whowhere (MusicSearch (HumorSearch (FindBook (


    Классификация поисковых инструментов (их типы и виды) Заметьте, что такие специализированные или тематические поисковые инструменты могут использовать: либо свои собственные базы данных для поиска по вашему запросу, либо производят поиск по всей Сети, используя другие поисковые системы.


    Классификация поисковых инструментов (их типы и виды) Кроме того, существуют и метапоисковые системы, предлагающие искать в нескольких поисковых системах одновременно. Например: Mamma (Преимущество в том, что в таком случае выдается максимально большее количество результатов, недостаток же в том, что не все поисковые системы имеют одинаковый синтаксис языка запросов (например, кавычки поддерживаются не каждой поисковой системой).


    Основные элементы языка запросов поисковых систем Перечислим общие элементы и особенности языка запросов поисковых систем: Большинство используют: + или - (включить или исключить термин из поискового предписания); «кавычки» (для обозначения фразы, устойчивого словосочетания). Некоторые вместо знаков + или – используют союзы AND, AND NOT.


    Основные элементы языка запросов поисковых систем Большинство позволяют использовать символы усечения слова слева * (например: wish* - будут найдены: wish, wishes, wishful, wishbone, and wishy-washy) Некоторые поисковые системы чувствительны к заглавным и строчным буквам (например, если вы ищете материалы о людях с фамилией Stone с помощью Altavista, следует обязательно использовать заглавную букву, посколько в противном случае будут найдены все сайты где встречается слово stone - камень).


    Основные элементы языка запросов поисковых систем (на примере Яndex) ЭлементЧто он означаетПример запроса пробел или & или + логическое И (в пределах предложения) семейное право &&логическое И (в пределах документа) рецепты && (плавленный сыр) |логическое ИЛИфото | фотография | снимок | фотоизображение


    Основные элементы языка запросов поисковых систем (на примере Яndex) () группирование слов(технология | изготовление) (масла | творога) ~ или - союз И НЕ (в пределах предложения) дума ~ закон ~~ союз И НЕ (в пределах документа) путеводитель по парижу ~~ (агентство | тур) «» поиск фразы«антология поэзии»


    Основные элементы языка запросов поисковых систем (на примере Яndex) ! перед словомточная форма слова!настоящий!момента - Настоящий закон вступает в силу спустя две недели с момента его опубликования. $title («»)Выражение присутствует в поле «Заголовок» (Title) HTML-документа. $title («флора и фауна») - страницы с названиями схожими с «Флора и фауна Сибири»


    И, в заключение: 1) Для того, чтобы правильно построить стратегию поиска, нужно прежде всего решить для себя какого рода информацию вы хотите получить – некую общую, описывающую объект или явление в целом, или же какие-то детали, частности, которые могут встретиться в полном тексте какого-то документа. В первом случае – целесообразно использовать директорию, во втором – поисковую систему. 2) Если же, начиная поиск, вы еще не представляете точно, что и как много вы хотите получить в результатах запроса рекомендуется использовать разные поисковые инструменты в комплексе.