Интернет-разведка. Руководство к действию

ОглавлениеДобавить в закладки К обложке

Описание языков запросов различных поисковых машин

Язык запросов поисковой машины Яндекс

Лучшая, на наш взгляд, работа по изучению операторов поисковой машины Яндекс выполнена специалистом из Санкт-Петербурга Денисом Фурсовым. На его ресурсе[3] постоянно проводятся дополнительные исследования, отслеживаются и оцениваются изменения в работе операторов указанной поисковой машины.

Ниже речь пойдет о том, как с помощью специальных фильтров, основанных на Булевой алгебре, создавать запросы, максимально соответствующие потребностям специалиста, который ищет информацию в Интернете.

При изучении этого вопроса, не следует забывать, что компьютер очень исполнителен, но лишен способности думать, поэтому следует составлять запрос, исходя из того, что он будет обработан компьютером буквально, а не с учетом того, что же на самом деле имел в виду пользователь, создавая свое обращение.

Лучше всех эту мысль проиллюстрировал летом 2005 г. Алексей Амилющенко, главный аналитик отдела маркетинга Яндекса на следующем примере.

Вот еще одна история с семинаров, но ее приходится рассказывать не очень часто. Иногда случается, что заходит разговор о том, что хорошо бы поисковым системам учитывать не только слова, которые есть в индексируемых документах, но и смысл написанного. В ответ говорю, что знаю фразу, про которую и человек-то не скажет, о чем это. Вот она.

Эти типы стали есть в прокатном цехе.

И что тут написано? Я знаю, минимум, три разных смысла. Не подглядывайте в ответ

сразу (он ниже). Попробуйте сначала самостоятельно…

Обычно, когда это предложение видит зал, сначала становится тихо (видно, что думают),

потом начинаются смешки (до кого-то дошло), потом хихикают уже все.

Но к делу, что же здесь все-таки написано?

1. Скучный такой вариант.

Эти типы стали (варианты металлопроката) есть (имеются в наличии) в прокатном цехе.

2. Более творческий, с элементами мизантропии.

Эти типы (неприятные автору личности) стали (начали) есть (принимать пищу) в прокатном цехе.

3. Несколько надуманный, конечно, но…

Эти типы стали (варианты металлопроката) есть (надлежит принимать в пищу) в прокатном цехе.

Вот видите, даже протеиновые мозги не справляются, а вы хотите, чтобы у силиконовых это получалось.

Текст запроса мы будем помещать в квадратные скобки [] для того, чтобы визуально выделить его из текста книги. Если уважаемый читатель решит ввести приведенные ниже запросы в поисковую строку поисковой машины, чтобы проверить их работоспособность на практике, то эти квадратные скобки вводить не надо.

Итак, перейдем непосредственно к операторам запросов Яндекса.

1. Логическое «И».

Яндекс поддерживает три разных оператора, относящихся к логическому «И», что делает его самым гибким из всех поисковиков, работающих с русским языком. Столь развитая, практически уникальная система операторов поисковых запросов дает возможность предельно точно настроить запрос и сформировать такой фильтр для данных в Интернете, который максимально качественно выбирает нужную информацию и отсекает ненужную.

1.1. Пробел.

Слова, разделенные пробелом, должны располагаться недалеко друг от друга. Специалисты поясняют, что термин «недалеко» отнюдь не фиксированная величина и меняется в зависимости от того, с какими словами указанный оператор в каждом конкретном случае используется. Если они часто употребляются, то «недалеко» – значит, на расстоянии нескольких слов друг от друга. Если же они редко встречаются в обиходе, то даже их нахождение в разных концах документа будет восприниматься как «недалеко».

При этом, несмотря на то, что логическое «И» в общем виде Булевой алгебры подразумевает присутствие всех упомянутых слов, Яндекс, тем не менее, действительно выдает сначала те документы, в которых есть все ключевые слова, представленные в запросе. После чего начинает выдавать документы, в которых на одно ключевое слово меньше, чем в запросе, затем – на два слова меньше и так далее.

Запрос: [маркетинг менеджмент]

Результат поиска: страниц – 2 442 393, сайтов – не менее 1456

В выдаче: Маркетинг, Финансы, Реклама, Менеджмент

1.2. Амперсанд (&).


Логин
Пароль
Запомнить меня