Интернет-разведка. Руководство к действию

ОглавлениеДобавить в закладки К обложке

5. Заглавные буквы или строчные?

В отличие от Яндекса Гугл не различает регистр букв. Все буквы воспринимаются как строчные, вне зависимости от того, как их вводили в поисковую строку. Запросы:

[Эйфелева Башня], [Эйфелева башня] и [эйфелева башня]

дадут одинаковые результаты.

Результат поиска на момент написания книги:

Результаты 1 – 10 из примерно 543 000 для Эйфелева Башня.

Результаты 1 – 10 из примерно 543 000 для эйфелева башня.

6. Стоп-слова.

Во вспомогательных инструкциях (хэлпах) написано, что Гугл, подобно большинству поисковых систем, игнорирует стоп-слова. Кроме того, хэлпы утверждают, будто, как и многие другие поисковики, Гугл имеет механизм принудительного включения стоп-слов в результаты поиска. К таким элементам относится большинство артиклей английского языка, союзов и предлогов русского языка.

В реальности ситуация, похоже, складывается иначе.

Тест: вводим по-русски букву [в]

Результат:

Результаты 1 – 10 из примерно 48 600 000 для в.

Вводим по-английски артикль [the]

Результат:

Результаты 1 – 10 из примерно 8 670 000 000 для the.

7. Оператор «Плюс» (+).

Тем не менее, бывают ситуации, когда надо принудительно включить в текст какое-либо слово, которое может иметь варианты написания. В хэлпе Гугла приводится пример с запросом «Star Wars Episode I», где римская единица представляет собой латинскую букву «I» («ай»). Если сделать запрос просто как:

[Star Wars Episode I], —

то результат будет следующий:

Результаты 1 – 10 из примерно 13 200 000 для Star Wars Episode I.

В том числе в выдаче появятся слова

«Episode II», «Episode IV» и т. п.

Если сделать запрос:

[Star Wars Episode +I], —

то результат будет такой:

Результаты 1 – 10 из примерно 9 290 000 для Star Wars Episode +I.

И в него войдут только тексты, содержащие слово «Episode I».

8. Морфология слов.

Гугл не поддерживает морфологию слов. Их изначально следует вводить в нужных формах. Правда, отчасти это компенсируется интеллектуальной системой поиска, которая может найти нужную словоформу в ссылках на страницу. Чтобы проверить утверждение об отсутствии поддержки морфологии, возьмем такое языковое сочетание, по которому можно увидеть все без исключения результаты. А сочетание следующее: «Глоклая куздра».

Тест:

Запрос:

[глоклая куздра]

Результаты 1–4 из примерно 16 для глоклая куздра.

В выдаче три адреса:

1. www.flame.ws/txt/index.php/t737.html

2. www.dom.no/modules.php?name=Forums&file=viewtopic&p=31986&highlight=

3. www.gb.anekdot.ru/vm.html?file=vm&date=1998-08-07

Запрос:

[глоклую куздру]

Результаты 1–1 из 1 для глоклую куздру.

В выдаче один адрес:

gb.anekdot.ru/vm.html?file=vm&date=1998-08-07

Запрос:

[глоклой куздре]

Результат: Не найдено ни одного документа, соответствующего запросу глоклой куздре.

Правда, это не мешает Гуглу иногда выделять по запросу «площадь» слово «площади» как релевантное. Однако подобное встречается на странице выдачи, но не в кэше.

Просто для сравнения приведем результат Яндекса. По всем трем запросам о «глоклой куздре» система дала на момент написания книги одинаковый результат:

Результат поиска: страниц – 13, сайтов – не менее 5.

9. Улучшение запроса во время поиска.

Поскольку Гугл выдает все слова, которые вы вводите в запросе, имеет смысл составлять новые запросы, содержащие те слова, которые вы забыли ввести в начале поиска, но обнаружили в ходе его выполнения в найденных текстах. В ряде случаев это помогает улучшить результат. Подчеркнем особо – это должны быть именно отдельные запросы. Добавление же новых слов к уже имеющемуся списку порой приводит к излишнему сужению диапазона результатов, ведь Гугл будет пытаться выдать документ, в котором содержатся все искомые слова.


Логин
Пароль
Запомнить меня