7 апр. 2007 г.

Поисковые операторы Google

Этот систематизированный материал, собранный из открытых источников и проверенный на собственном опыте, может пригодиться как карманный справочник при составлении сложных комплексных запросов для Google.

Таблица разделена на пять колонок: оператор, область его применения (другими словами, базы данных Google, в которых данный оператор работает наилучшим образом), пример запроса, если он необходим, и примечания. Последняя колонка нужна в первую очередь для того, чтобы выделить операторы, требующие особого отношения. Некоторые из них, например, не могут применяться в одиночку или плохо сочетаются с другими операторами — это важный нюанс, о котором лучше знать заранее.

Оператор
Значение
Базы данных
Пример
Примечания
Cache: Возвращает кэшированную копию страницы с указанным адресом или URL. При сочетании с поисковым термином выделяет его на кэшированной странице Web cache:www.irs.gov Не сочетается с другими операторами. Между оператором и URL не ставится пробел
Link: Находит страницы, ссылающиеся на указанный документ или веб-страницу link:warriorlibrarian.com Между оператором и URL не ставится пробел
Related: Находит сайты, тематически связанные или подобные указанному Web related:healthfinder.gov Не сочетается с другими операторами или ключевыми словами. Между оператором и URL не ставится пробел
Info: Показывает информацию о сайте по указанному адресу Web info:www.theonion.com Не сочетается с другими операторами или ключевыми словами. Между оператором и адресом не ставится пробел
Define, what is, what are Находит определения указанного понятия, взятые из онлайновых источников Web define monopsony, what is podcast Не сочетается с другими операторами. Если указаны несколько ключевых слов, они воспринимаются как единая фраза
Stocks: Поиск биржевых котировок по нескольким источникам (используются службы Yahoo Finance, Fool.com, MSN MoneyCentral и ClearStation) Web stocks: goog Не сочетается с другими операторами и ключевыми словами. В поиске используется пробел
Allinurl: Находит страницы, в URL которых встречаются все указанные ключевые слова Web Group Images allinurl:pez faq Не сочетается с другими операторами и ключевыми словами
Inurl: Находит указанные ключевые слова в URL на страницах Web Images pharmaceutical inurl:investor Хорошо сочетается с другими операторами. Не ведется поиск по наименованию протокола (http://, ftp:// и так далее). Поскольку в URL могут встречаться спецсимволы, не обрабатываемые Google, это может привести к неожиданным результатам поиска
Inanchor: Поиск ключевых слов в тексте ссылок

Web Images News

restaurants Portland inanchor:kid-friendly

Хорошо сочетается с другими операторами
movie: Поиск обзоров фильмов и кинотеатров, где искомый фильм транслируют Web Groups News movie: traffic Используется с пробелом.
book Поиск полных текстов книг Web book Ender's Game Как правило, ссылки на полные тексты книг подсвечиваются в начале выдачи. Далее идут ссылки на книги с искомым словом
Phonebook: Rphonebook: Bphonebook: Поиск телефонных номеров по обычным или бизнес-справочникам Web rphonebook: bill jones NY Не сочетается с другими операторами. Актуален в первую очередь для Северной Америки
Site: Ограничение поиска определенным сайтом или доменом Web Images Halloween site:www.census.gov Хорошо сочетается с другими операторами. Между оператором и ключевым словом не ставится пробел. Поскольку такой запрос разбирается справа налево, необходимо обязательно указывать домен верхнего уровня (.net, .com, .by, .ru и т.д.), иначе результаты поиска будут неполными
Allintitle: Находит страницы со всеми указанными ключевыми словами, находящимися в области <title> Web Group Images News allintitle: Google Advanced Operators Плохо сочетается с другими операторами.
Intitle: Находит страницы с указанными словами в области <title> Web Groups Images News movies comedy intitle:top ten Хорошо сочетается с другими операторами. Между оператором и ключевым словом не ставится пробел
Allintext: Поиск страниц со всеми указанными ключевыми словами в основном тексте документа Web Groups Images News allintext:ingredients cilantro chicken lime Не сочетается с другими операторами. Область применения ограничена. Может быть использован в запросах типа «Найти ключевое слово во всех элементах, кроме заголовка, ссылок и url»
Filetype: Находит документы определенного типа (с заданным расширением файла) Web Groups Form 1098-T IRS filetype:pdf В одиночку не используется — дополняет другие операторы. Хорошо сочетается с другими операторами и несколькими ключевыми словами. Список поддерживаемых расширений файлов можно найти по адресу www.google.com/help/faq_filetypes.html
Daterange: Находит страницы, проиндексированные в заданный промежуток времени Web Официально не поддерживается. Обе даты должны быть представлены в днях по Юлианскому календарю. В одиночку не используется — дополняет другие операторы. Хорошо сочетается с другими операторами и несколькими ключевыми словами
Numrange: Находит страницы с числовыми значениями из указанного промежутка Web Наполеон numrange:1812-1815 Хорошо сочетается с другими операторами и несколькими ключевыми словами
Author: Поиск по автору сообщения Groups flying author:Hamish author:Reid Хорошо сочетается с другими операторами и несколькими ключевыми словами
Group: Поиск по определенным группам Groups ivan doig group:rec.arts.books Хорошо сочетается с другими операторами
Insubject: Поиск сообщений с указанными словами в теме сообщения Groups insubject:"crazy quilts" Хорошо сочетается с другими операторами и несколькими ключевыми словами
source: Поиск новостей из указанных источников News peace source:ha_aretz Хорошо сочетается с другими операторами и несколькими ключевыми словами
location: Поиск новостей в указанном регионе News queen location:uk Хорошо сочетается с другими операторами и несколькими ключевыми словами
store: Поиск товаров в каталоге Froogle Froogle jeans store:gap Хорошо сочетается с другими ключевыми словами
Msgid: Поиск сообщения с конкретным указанным ID Groups Не сочетается с другими операторами
Официальный список операторов Google находится по адресу www.google.com/help/operators.html . На сегодняшний день там описаны 11 операторов. В приведенной таблице их больше, поскольку в нее включены операторы, работающие не только в основной базе данных, но и, например, в Google Groups. Теоретически их может быть еще больше, например, за счет скрытых до поры до времени новинок, еще находящихся на стадии тестирования. Так что, если вы вдруг наткнетесь на такой неизвестный оператор, можете принимать заслуженные поздравления. Если вы действительно серьезно заинтересуетесь работой с операторами Google, посетите официальный блог Google по адресу www.google.com/googleblog . Кроме того, большое количество интересных сведений можно почерпнуть в неофициальном блоге Google (Swartz’s unofficial Google Blog). Пополнить собственную коллекцию операторов Google можно также с помощью уже рассмотренной нами в одной из предыдущих статей службы Google Alerts. В свойствах подписки укажите запрос типа google advanced operator site:google.com.

Пока вы не используете конкретный оператор, ваше ключевое слово ищется во всех элементах страницы, поэтому применение операторов — это в первую очередь средство фильтрации результатов. Поскольку в алгоритм сортировки результатов поиска Google периодически вносятся усовершенствования, будьте готовы к тому, что запрос одной и той же конструкции через некоторое время может выдавать отличающиеся результаты. Порядок слов в запросе может оказывать влияние на сортировку результатов. Если в вашем запросе два ключевых слова, то Google найдет одни и те же сайты вне зависимости от порядка этих слов, но вот при сортировке ссылок на первые места будут попадать те страницы, на которых ключевые слова идут в заданном вами порядке. В особых случаях при комбинации нескольких операторов вы можете получить разные результаты, поэтому, если вдруг что-то идет не так, как вы этого ожидаете, попробуйте поменять их местами. Иногда при поиске файлов с определенным расширением могут возникать свои нюансы. Если вы захотите получить полный список проиндексированных Google pdf-файлов, недостаточно будет дать запрос типа filetype:pdf — такие на первый взгляд корректные запросы вообще ничего не возвращают. Здесь можно использовать прием, основанный на том, что Google при поиске ищет заданное слово, в том числе в URL файлов. Таким образом, потребуется использовать запрос filetype:pdf pdf. Поскольку во всех ссылках на pdf-файлы будет присутствовать это расширение (другими словами, фрагмент «.pdf»), вы получите ожидаемый ответ.

При сочетании операторов могут возникать свои накладки, которых можно легко избежать. Вот несколько типовых ошибок. Не допускайте противоречивых запросов. Подумайте сами: разве может выдать что-нибудь вразумительное запрос типа inurl:google –google? Некорректное использование нескольких операторов. В качестве примера — применение нескольких ограничений по домену — например, site:org site:net. Если вы хотите найти сайт в одном из нескольких доменов, правильным будет запрос site:org | site:net. Избегайте одновременного применения нескольких операторов, начинающихся с all (allinurl, allintitle, allintext). Если такая комбинация абсолютно необходима, замените операторы на «простые» варианты (inurl, intitle). Применения оператора allintext вообще лучше избегать, кроме тех случаев, когда вы очень хорошо понимаете, что хотите получить с его помощью. Как вы можете убедиться, в таблице есть несколько операторов, которые не сочетаются с другими. Если вы все-таки попробуете применить их в комбинации с другими, то либо ничего не получите, либо получите некорректный ответ, поскольку Google попытается «поправить» такой запрос, рассматривая его как поиск по фразе.