Инструменты поиска. В результате формируется список информационных ресурсов. Данный шаг позволяет создать персональную информационную систему, направленную на решение конкретной задачи поиска. расширение круга информационных ресурсов

Инструменты поиска. В результате формируется список информационных ресурсов. Данный шаг позволяет создать персональную информационную систему, направленную на решение конкретной задачи поиска. расширение круга информационных ресурсов

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Современные методы поиска информации

Введение

Как уметь читать, писать или публично выступать, сегодня в условиях информационного общества умение грамотно осуществлять профессиональный поиск - непреложный навык специалиста-интеллектуала.

Быстрый рост и динамическое развитие информационных ресурсов (прежде всего представленных в сети Интернет) обязывает каждого иметь разнообразные навыки сложного поиска. Уметь быстро и правильно искать в Интернете значит экономить время, владеть достоверной и актуальной информацией, а значит делать верные выводы и принимать правильные решения.

Информационная эвристика призвана помочь специалисту достаточно быстро провести избирательный и эффективный поиск при решении конкретных интеллектуальных задач.

Проблема поиска и использования информации - одна из самых актуальных в современной науке. Разумеется, для эффективного и качественно поиска информации Интернет незаменим. Однако сам факт хранения в Интернете огромного пласта знаний человечества не является свидетельством высокой эффективности поиска и использования информации. Пусть даже информация выдается и в удобной форме, но осваивать ее в конечном итоге приходится человеку. И от того, насколько он владеет методами и методикой поиска, будет зависеть эффективность и качество его труда.

Следовательно, в основе использования информации лежит проблема поиска и преобразования ее в такие содержание и форму, которые создают возможность более удобного и оперативного освоения информации и ее эффективного использования в общественной деятельности.

В связи с этим цель данной работы - исследование особенностей развития и распространения информации, рассмотрение основных целей и методов информационного поиска, анализ правил построения стратегии поиска и формулирования поискового запроса.

Основная часть

Эвристика в общем понимании - это искусство и наука открытия и творческого поиска в сложной предметной области.

При этом эвристика имеет множество значений.

Так, эвристика - это система обучения, способствующая развитию у обучаемых находчивости, умения самостоятельно добывать знания, познавательной активности, потребности в знаниях.

Также эвристика - наука о закономерностях и методах открытия и изучения нового в творческой и познавательной деятельности человека; психология творчества.

Под эвристикой понимается методология разрешения проблем, использующая метод проб и ошибок, а также результаты эксперимента для нахождения прямого пути к решению.

Эвристика - это специальные методы решения задач (эвристические методы), которые обычно противопоставляются формальным методам решения, опирающимся на точные математические модели. Использование эвристических методов (эвристик) сокращает время решения задачи по сравнению с методом полного ненаправленного перебора возможных альтернатив; получаемые решения не являются, как правило, наилучшими, а относятся лишь к множеству допустимых решений.

Эвристика - совокупность присущих человеку механизмов, с помощью которых порождаются процедуры, направленные на решение творческой задач (например, механизмы установления ситуативных отношений в проблемной ситуации, отсечения неперспективных ветвей в дереве вариантов, формирования опровержений с. помощью контрпримеров и т.п.). Эти механизмы, в совокупности определяющие метатеорию решения творческих задач, универсальны по своему характеру и не зависят от конкретной решаемой проблемы.

Эвристика - наука, изучающая эвристическую деятельность; специальный раздел науки о мышлении. Ее основной объект - творческая деятельность; важнейшие проблемы - задачи, связанные с моделями принятия решений (в условиях нестандартных проблемных ситуаций), поиска нового для субъекта или общества, структурирования описаний внешнего мира (на основе классификаций типа периодической системы или систематики К. Линнея). Эвристика как наука развивается на стыке психологии, теории искусственного интеллекта, структурной лингвистики, теории информации.

Таким образом, центральное слово эвристики - это поиск (информации).

Несомненно, что разработка методов получения и использования разнообразной социальной информации традиционно составляет центральную проблему научной организации труда специалиста.

Для принятия решения в каждой конкретной ситуации специалисту необходимо получить возможно более полную и актуальную информацию, относящуюся к данному случаю.

Выбор источников информации, стратегий ее поиска, способов проверки достоверности и соответствия уже имеющимся сведениям, методы оценки полезности найденной информации для разрешения проблем - все эти факторы являются характеристиками информационного поведения человека.

Критериями информационной культуры человека можно считать его умение адекватно формулировать свою потребность в информации во всей совокупности информационных ресурсов, перерабатывать информацию и создавать качественно новую, вести индивидуальные информационно-поисковые системы, адекватно отбирать и оценивать информацию.

Интернет открыл доступ ко многим информационным ресурсам, получить которые другим способом в настоящее время невозможно для читателей российских библиотек. Объединяя локальные, национальные и глобальные сети, он стал громадным информационным ресурсом, наиболее динамичным из всех существующих в настоящее время.

Весьма важной чертой Интернета является то, что пользователь не просто получает доступ к информации, но и сам производит ее. К тому же поиск информации в новых условиях и в новой информационной среде предоставляется самому специалисту.

В связи с этим можно выделить два положительных момента:

-увеличивается вероятность выявления полезной по существу, но не соответствующей строго формально запросу информации. В отличие от посредника специалист не вынужден жестко придерживаться формулировки запроса. Он сам ведет диалог с поисковой системой, меняя тактику поиска в зависимости от полученных результатов;

-формируются основы научного мышления, навыки научно-исследовательской работы. Специалист учится ориентироваться в сетевом пространстве, отбирать из большого количества документов то, что действительно необходимо и, наконец, варьировать свой запрос в зависимости от анализа уже выявленных документов.

Тем не менее, пользователи часто не ощущают удовлетворения от результатов поиска в новой информационной среде. Обычно это происходит по следующим причинам:

Как правило, пользователи в качестве инструмента поиска используют либо поисковые машины (AltaVista, HotBot), либо каталоги ресурсов (Yahoo). Несмотря на ряд достоинств, вышеупомянутые поисковые системы не обеспечивают научный контроль качества (то есть процесс включения информации в БД этих поисковых систем не находится под контролем специалистов-предметников), что может привести к получению в результате поиска недостоверной информации;

-отсутствие знаний и навыков по составлению запроса к поисковой системе приводит к получению большого количества информационного шума;

-пользователь часто не осознает тот факт, что, несмотря на то, что информация существует в интернете, она находится вне поля зрения поисковых машин. Отсутствие элементарных знаний по проведению поиска приводит к снижению полноты получаемой информации.

Таким образом, можно утверждать, что в Интернете есть больше возможностей, нежели используется в настоящий момент. И, следовательно, проблема заключается не в недостаточности качественной информации в Интернете, а в неумении специалиста ее найти.

В рамках библиографоведения накоплен, теоретически и методически обобщен большой исторический опыт поиска и использования информационных источников. Именно в библиографоведении сформировалась и ныне целенаправленно развивается специальная научная дисциплина - библиографическая эвристика.

Библиографическая эвристика - одна из важнейших и активно развивающихся частей общей науки о библиографии, библиографоведении. В современных условиях ускорения и усложнения информационных процессов в обществе ей уделяется особое внимание.

Под библиографической эвристикой понимается библиографоведческая дисциплина, разрабатывающая историю, теорию и методику информационного поиска.

Категория «информация» при этом включает в себя и понятие «библиографическая информация», которая является одной из важнейших ее составляющих. Это объясняется той функциональной ролью, то есть той социальной задачей, которую решает общество посредством библиографической информации в процессе производства, распространения и использования социальной информации, знания.

Объективный характер существования и использования такой информации и предопределяет самые различные задачи ее поиска. В целом же все реальное многообразие таких задач можно свести к трем основным целям информационного поиска:

-поиск необходимых сведений об источнике и установление его наличия в системе других источников. Ведется путем разыскания библиографической информации и библиографических пособий (информационных изданий), специально создаваемых для более эффективного поиска и использования информации (литературы, книги);

-поиск самих информационных источников (документов и изданий), в которых есть или может содержаться нужная информация;

-поиск фактических сведений, содержащихся в литературе, книге, например, об исторических фактах и событиях, о технических характеристиках машин и процессов, о свойствах веществ и материалов, о биографических данных из жизни и деятельности писателя, ученого и т.п.

Эти цели определяют и три основных вида информационного поиска: библиографический, документальный и фактографический, которые тесно взаимосвязаны между собой.

Например, чтобы найти информационный источник (документ или издание), надо знать определенную совокупность библиографической информации (фактов), характеризующей его, отличающей его от многих других: хотя бы от написанных тем же автором, на одну и ту же тему, выпущенных тем же издательством, в одном и том же году и т.д. Следовательно, нужно сначала проделать библиографический поиск. И, наоборот, чтобы провести фактографический поиск в какой-либо отрасли знаний или практики требуется сначала найти те литературные источники (документы, издания), в которых могут быть интересующие нас факты. Поэтому сначала надо провести библиографический и документальный поиск.

Осуществлять поиск и использовать мощные потоки информации становится все труднее.

И для этого библиографическая эвристика имеет ряд методов поиска информации: сплошной, выборочный, интуитивный, типологический («рецептурный»), индуктивный, дедуктивный, метод библиографических ссылок, метод восхождения от абстрактного к конкретному.

Рассмотрим их вкратце.

Итак, сплошной метод. Это обследование сплошь и без пропусков все наличие имеющихся пособий и источников. Очевидно, что в современных условиях этот прием трудно реализуем даже для узкой темы. Поэтому часто он рассматривается только в качестве чисто теоретического.

Выборочный метод - более рациональный и реальный путь поиска информации, который сводится к подбору и изучению определенной совокупности источников.

Интуитивный метод. Под ним понимается умение найти нужный материал посредством библиографического чутья, продолжительного опыта.

Типологический, или рецептурный метода, когда использование задач информационного поиска позволяет для каждого конкретного информационного поиска намечать определенный путь и документальные средства (пособия, источники) решения, то есть дать своего рода модель, рецепт решения этой поисковой задачи. Так, оптимальной типовой моделью для разработки различных «рецептов» информационного поиска является библиографическое описание.

Индуктивный метод информационного поиска. Процесс познания с использованием индукции совершается от единичных суждений и фактов к общим правилам и обобщениям, в которых выражается общая закономерность.

Дедуктивный метод информационного поиска. Обратная картина сложится, если мы будем осуществлять поиск дедуктивным методом. Такая направленность мысли может иметь место при исследовании определенной области явлений, создании развернутой научной теории и т.п.

Метод информационного поиска по библиографическим ссылкам. Возможность его использования заключается и в самом характере литературы, состоящей из определенной взаимосвязи фактов, произведений, документов и изданий. Каждое новое литературное произведение - это в известной степени анализ, оценка и обобщение социальной информации, уже имеющейся в литературе. Специфической формой отражения указанной взаимосвязи, преемственности литературного развития и является библиографическая ссылка (сноска).

Изложенные методы позволяют найти необходимую информацию в традиционной информационной среде.

Однако в наше время не менее, а где-то и гораздо более, важны методы и методика поиска информации в новой информационной среде - Интернете.

Поиск информации может быть произведен по нескольким методам, значительно различающимся как по эффективности и качеству поиска, так и по типу извлекаемой информации.

Рассмотрим основные методы поиска информации в Интернете, используемые по отдельности или в комбинации друг с другом.

Прежде всего, это использование поисковых машин. В настоящее время этот метод - один из основных и фактически единственный при проведении предварительного поиска. В результате поиска появится список ресурсов Интернета, который требуется детально рассмотреть.

Применение поисковых машин основано на использовании ключевых слов, передающихся поисковым серверам в качестве аргументов поиска.

В качестве методов рассматривается и непосредственный поиск с использование гипертекстовых ссылок. Так как все сайты в пространстве Всемирной паутины фактически связаны между собой, то поиск информации может быть произведен путем последовательного просмотра связанных страниц с помощью браузера.

На первый взгляд, этот полностью ручной метод поиска выглядит полным анахронизмом, в то же время этот способ Web-страниц часто оказывается единственно возможным на заключительных этапах информационного поиска, когда механическое исследование уступает место более глубокому анализу.

При этом, использование каталогов, классифицированных и тематических списков и всевозможных справочников также относится к этому виду поиска.

Поиск с применением специальных средств - это полностью автоматизированный метод, весьма эффективный для проведения первичного поиска.

Сущность этого метода заключается в применении специализированных программ - спайдеров, которые в автоматическом режиме просматривают Web-страницы, отыскивая на них искомую информацию.

То есть, можно говорить об автоматизированном варианте просмотра с помощью гипертекстовых ссылок (поисковые машины используют похожие методы).

Этот метод является особо эффективным в том случае, если использование поисковых машин не дает необходимых результатов в силу нестандартности запроса, либо других причин.

Еще один метод - анализ новых ресурсов, поиск по которым может оказаться необходимым при проведении повторных циклов поиска, поиска наиболее свежей информации либо для анализа тенденций развития объекта исследования в динамике.

Еще одна причина такого поиска заключается в том, что большинство поисковых машин обновляет свои индексы со значительной задержкой, вызванной гигантскими объемами обрабатываемых данных, и это упущение обычно тем больше, чем менее популярна интересующая тема. Такое соображение является весьма существенным при проведении поиска в узкоспециальной предметной области.

Очевидно, что поиск информации в Интернете более рассматривается как процесс решения поисковой задачи, стоящей перед пользователем, а не как просто нахождение релевантной запросу информации.

Основными этапами методики поиска являются:

-формулировка и уточнение информационного запроса. На этом этапе идет целенаправленное ограничение и конкретизация общей цели поиска;

-планирование поисковой процедуры. Основная цель данного процесса - определение путей и способов рационального решения поисковой задачи. Этот этап включает в себя разработку поисковых стратегий, предусматривающих выполнение выявленных наборов требований;

-реализация поиска. Окончательное решение поисковой задачи.

Методика поиска информации включает несколько этапов.

Первым этапом является формулировка и уточнение информационного запроса. Этот этап традиционно играет ведущую роль. От того, насколько верно сформулирован запрос, будет зависеть последующий выбор информационных ресурсов. «Уточнение запроса» в библиотечной практике представляет собой ряд критериев или вопросов, необходимых для уточнения потребности пользователя в информации. В ходе интервью выясняется тип источника, в котором будет проводиться поиск, содержание темы, глубина ретроспективного поиска. На данном этапе целесообразно осуществить:

-формулирование запроса на естественном языке;

-определение типа информационной потребности;

-определение цели поиска информации;

-определение необходимых ограничений поиска;

-окончательную формулировку информационного запроса.

Цель 1-го шага - формирование представления об искомой информации. Для того чтобы получить это представление, обладателю информационной потребности необходимо как можно более точно выразить ее на естественном языке.

Даже достаточно грубое представление о типе информационной потребности позволяет уточнить обуславливаемые ею требования, которые следует учитывать при поиске. Традиционно различают два типа информационных потребностей: 1) когда наилучшей метаинформацией (информацией об информации) признается та, которая наиболее полно и точно описывает конкретную информационную потребность данного потребителя и позволяет получить точный ответ; 2) когда границы определены нечетко, а также с течением времени могут изменяться.

Процессы информационного поиска, с помощью которых удовлетворяются информационные потребности разных типов, в целом отличаются друг от друга, в связи с чем можно говорить о разных видах информационного поиска. Об информационном поиске, удовлетворяющем информационные потребности первого типа, говорят как о фактографическом. Об информационном поиске, удовлетворяющем потребности второго типа, - как о документальном. Однако часто, чтобы найти некоторые факты в интернете, необходимо сначала провести поиск документов (Web-страниц), содержащих эти факты. В этом случае можно говорить о документально-фактографическом поиске.

Следующий шаг - определение цели поиска информации, которое позволяет выявить степень требуемой полноты информации, что также оказывает влияние на выбор поисковых систем. Противоположными друг другу целями поиска информации традиционно являются:

-предварительное знакомство с проблемой;

-тщательное изучение проблемы.

Как правило, обычная цель поиска информации лежит где-то между этими двумя крайностями, то есть пользователю требуется некоторое количество информации, но абсолютная полнота сведений ему не нужна.

К числу основных ограничений традиционно относят: ограничения по видам изданий, языкам публикаций, по географическим и хронологическим рамкам поиска. Поэтому необходимо четко выяснить:

-информация из каких источников интересует пользователя (статьи, монографии, материалы конференций, другое);

-на каком языке;

-каковы географические рамки поиска;

-каковы хронологические рамки поиска.

Для окончательной формулировки информационного запроса необходимо провести всесторонний лексический анализ информации, подлежащей поиску. Необходимо получить из какого-либо источника прецедент подробного и грамотного описания исследуемого вопроса. Таким источником может стать как узкоспециальный справочник, так и энциклопедия общего профиля. На основе изученного материала необходимо сформулировать максимально широкий набор ключевых слов в виде отдельных терминов, словосочетаний, профессиональной лексики и клише, при необходимости на нескольких языках.

Основная цель этапа планирования поисковой процедуры - определение путей и способов рационального решения поисковой задачи. Он включает в себя разработку общей программы поиска. Параллельно осуществляется выбор и оценка качества поисковых систем, проводится поиск недостающей информации.

На этом этапе речь идет о следующих шагах:

-выбор и оценка качества поисковых систем;

-разработка общей программы поиска.

Отбор и оценку качества поисковых систем необходимо проводить с точки зрения их соответствия реальной информационной потребности и специфике запроса. Каждый пользователь имеет специфические требования, оказывающие влияние на выбор поисковой системы, ее содержания и возможностей. При выборе поисковой системы необходимо обращать внимание на следующие параметры: объем индекса поисковой системы, контроль качества содержащейся в ней информации, возможности языков запросов.

Разработка общей программы поиска заключается в определении объектов, методов и возможных направлений (маршрутов) поиска на основе выявленных ограничений поиска (тематических, хронологических, языковых, географических), а также степени полноты поиска.

Тактика и средства поиска могут существенно различаться в зависимости не только от тематики, но и от других параметров запроса. Здесь следует руководствоваться рядом общих методических рекомендаций.

Так, например, характер поиска всецело определяется содержанием поставленной пользователем поисковой задачи. И в этом отношении важно различать, что сначала поиск как бы привязан к теме и к цели детальной, всесторонней разработки ее плана, когда особенно необходим широкий охват источников информации.

Следовательно, сначала в большей мере идет поиск информационных ресурсов (то есть совокупностей документов). И лишь затем информационный поиск конкретизируется, ограничивается непосредственным содержанием решаемой поисковой задачи. На этом этапе преобладает уже поиск самих документов.

Разумеется, на протяжении всего процесса поиска следует сочетать различные виды и методы поиска в двух основных направлениях: c одной стороны, от общих классификационных поисковых систем к предметно-ориентированным указателям ресурсов, далее к конкретным документам и содержащимся в них фактам; c другой - от уникальных слов и фраз запроса к предметно-ориентированным указателям ресурсов и/или к конкретным документам.

Цель последнего этапа - окончательное решение поисковой задачи. Он также включает в себя создание инструментов, необходимых для ее решения.

На этом этапе необходимо выполнить следующие шаги:

-отбор совокупности информационных ресурсов по теме поиска;

-проведение поиска в информационных ресурсах;

-оценка полноты информации;

-расширение круга информационных ресурсов.

На этапе отбора совокупности информационных ресурсов по теме поиска проводится поиск в отобранной на этапе планирования совокупности поисковых систем. Поиск можно проводить как от частного к общему, так и от общего к частному. В результате формируется список информационных ресурсов, в которых может содержаться информация по вопросу.

Список информационных ресурсов намечается таким образом, чтобы ресурсы, дополняя друг друга, максимально охватывали информацию по данной теме в соответствии с заранее намеченными ограничениями поиска. Если их круг слишком узок, результаты поиска могут оказаться неудовлетворительными, а если слишком широк - возрастает трудоемкость поиска.

На этом этапе необходимо четко определить, что известно об искомой информации и что неизвестно, но необходимо выяснить. Например, может быть известно название интересующего информационного центра, но неизвестен его URL. Таким образом, необходимо сформировать список запросов для поиска недостающей информации. Этот список формируется на основе выявленных ключевых слов и имеющейся информации о ресурсах.

Поиск недостающих звеньев описания ресурса (метаданных) рекомендуется проводить с помощью поисковых и метапоисковых машин. Однако, если ничего не известно об искомых ресурсах, целесообразно обращаться к классификационным поисковым системам или же к специализированным словарным поисковым системам. В случае, если пользователь не является специалистом в данной области, ему следует обращаться к классификационным поисковым системам с научным контролем качества (информационным шлюзам).

При проведении поиска рекомендуется использовать следующие методы: метод догадки, метод поиска от общего к частному, метод поиска от частного к общему. Метод догадки заключается в том, что после можно попытаться написать название искомой организации или ее аббревиатуру. Метод поиска от общего к частному обычно используется при проведении поиска в классификационных поисковых системах. Поскольку поиск в них проводится только по предметным категориям и описаниям ресурсов, то целесообразно изначально максимально расширить запрос. Метод поиска от частного к общему обычно используется при проведении поиска в словарных поисковых системах.

В результате формируется список информационных ресурсов. Данный шаг позволяет создать персональную информационную систему, направленную на решение конкретной задачи поиска.

При проведении поиска документов необходимо иметь возможность как сузить, так и расширить запрос. Как правило, поиск действительно нужной пользователю информации представляет собой состоящую из ряда шагов деятельность, в процессе которой пользователь формулирует некоторые запросы, анализирует полученную выборку (результат выполнения запроса), на основании анализа уточняет свое понимание структуры базы данных и возможностей поискового аппарата информационной системы, свои информационные потребности и формулирует новый запрос (уточняет старый). И снова чередует шаги выборки и анализа, постепенно уточняя запрос и продвигаясь к цели.

Традиционно различают две базовые стратегии поиска: отраслевой поиск и предметный. Они отражают две противоположные тенденции во взаимоотношении между науками и отраслями знания: дифференциацию наук и их интеграцию. Стратегия отраслевого поиска осуществляется от общего к частному путем просмотра иерархических классификаторов, а предметного - от частного к общему путем выборки данных по значениям дескрипторов, ключевых слов (то есть данные рассматриваются с точки зрения их «предметных» свойств).

Выбор той или иной поисковой стратегии зависит от конкретной задачи поиска. Например, при прочих равных условиях поиск по ключевым словам тем предпочтительнее поиску по классификатору, чем более конкретный характер имеет запрос. Как и при поиске информационных ресурсов, при поиске документов необходимо учитывать возможности языков запросов, предлагаемые различными СУБД.

Выявив часть документов путем проведения поиска в первичном круге информационных ресурсов, целесообразно провести просмотр и оценку полноты полученной информации.

Далеко не всегда пользователю нужна вся информация по заявленной теме. Часто ему достаточно лишь нескольких авторитетных источников.

На этом этапе формируется список документов и проводится проверка на дублетность. Однако в том случае, если полнота полученной информации недостаточна, следует провести дополнительный поиск информационных ресурсов.

При проведении поиска информации в интернете, в котором полнота играет важную роль, необходимо помнить, что ни одна поисковая система не индексирует всего, что есть в интернете.

Расширить список информационных ресурсов можно следующими путями:

-провести поиск в зарубежных метапоисковых системах с целью выявления баз данных, посвященных конкретно тематике поиска;

-провести поиск по гипертекстовым ссылкам, двигаясь от уже найденных документов;

-провести поиск баз данных, опираясь на структуру URL уже найденных документов.

Использование исследованных методов позволяет пользователю самостоятельно проводить поиск информации в новой информационной среде. Она дает возможность не только улучшить качество получаемой в результате поиска информации, но и повысить ее полноту.

И в завершение работы хотелось еще бы обратить внимание на некоторые советы участников Кубка России по поиску в Интернете:

1. Постарайтесь понять смысл вопроса. Возможно, ответ вам уже известен. Чтобы найти правильный адрес страницы, ищите одновременно ключевые слова из вопроса и известный вам ответ.

2. Число документов, полученных в результате поиска, может быть огромно. Поэтому решающее значение для оптимального поиска информации имеет правильный набор ключевых слов.

3. Проверяйте орфографию в написании слова. Используйте синонимы, если список найденных страниц слишком мал.

4. Ищите больше, чем по одному слову. Максимально сужайте предмет поиска.

5. Используйте настройки поиска в поисковых системах, чтобы задать удобные параметры описания документов и структуру страницы с результатами поиска.

Заключение

В проведенном исследовании изложены и рассмотрены вопросы теории, методов и методики библиографической и информационной эвристики.

Очевидно, что освоение азов данной сферы необходимо для формирования профессиональных званий и умений любого специалиста.

Поскольку образование современного специалиста должно обеспечивать не столько его профессиональные умения и навыки, сколько способность к социальной адаптации, конкурентоспособность индивида, то информационная грамотность специалиста является основой его профессиональной компетентности и фактором ее развития.

В процессе реализации информационного поиска следует руководствоваться рядом общих методических рекомендаций.

Несомненно, что характер поиска всецело определяется содержанием поставленной задачи. Формулирование задачи поиска позволяет определить область и особенности используемых источников, облегчить составление программы поиска.

Вначале поиск привязан к теме и к цели детальной, всесторонней разработки ее плана, когда особенно необходим широкий охват источников. Затем информационный поиск конкретизируется, ограничивается непосредственным содержанием задачи.

В самом общем виде процесс информационного поиска можно разделить на этапы формулирования задачи поиска, разработки рабочей программы поиска, реализации поиска и оформления его результатов.

И в заключение укажем, что, в любом случае, только при систематическом и целенаправленном изучении, знании и умении рационально применять систему информационного поиска современный специалист может быть уверен в эффективности и качестве своей работы.

Список источников

1. Бородкин Л.И., Владимиров В.Н., Гарскова И.М. Азбука Интернета. Адресация в Интернете. Поиск информационных ресурсов в сети. В записную книжку//Новая и новейшая история. 1999. № 1.

2. Брайчевский С.М. Современные информационные потоки: актуальная проблематика//Научно-техническая информация. Сер.1. 2005. №11.

3. Гречихин А.А. Библиографическая эвристика. - М.: 1984.

4. Комер Д. Принципы функционирования Интернета. Учебный курс. - СПб.: 2002.

5. Кузнецов И.Н. Информация: поиск, анализ, защита. - М.: 2004.

6. Ландэ Д.В. Поиск знаний в Internet. Профессиональная работа. - М.: 2005.

7. Паршукова Г.Б. Информационная грамотность как фактор развития профессиональной компетенции. Технологии информационного общества - Интернет и современное общество: Труды VIII Всероссийской объединенной конференции (Санкт-Петербург, 8-11 ноября 2005 г.). - СПб.: Филологический факультет СПбГУ, 2005.

8. Прохоров А. Эффективный поиск в Интернете//КомпьютерПресс. 2006. № 2.

9. Степанов В.К. Библиографический поиск в Интернете//Библиография. 1998. № 1.

10. Талантов М. Профессиональный поиск в Интернете: планирование поисковой процедуры//Компьютер-пресс. 1999. № 8.

11. Татарников О. Новые технологии поиска в Интернет//КомпьютерПресс. 2005. № 10.

12. Тоффлер Б.Э., Имбер Дж. Словарь маркетинговых терминов. - М.: 2000.

13. Яценко Н.Е. Толковый словарь обществоведческих терминов. - СПб.: 1999.

Размещено на Allbest.ru

Подобные документы

    Особенности поиска информации в Интернет: стратегия и методика. Поисковые машины, каталоги и порталы информационных ресурсов. Подбор и введение ключевых слов. Использование режима "расширенный поиск", который имеет каждая из поисковых систем в Интернете.

    реферат , добавлен 06.08.2014

    Понятие и принципы работы, внутренняя структура и элементы, история формирования и развития поисковой системы "Rambler". Исследование и анализ, а также оценка эффективности данной поисковой системы для поиска экономической информации в интернете.

    курсовая работа , добавлен 10.05.2015

    Изучение классификации поисковых средств по В.В. Дудихину. Поиск информации с помощью поисковых ресурсов. Формирование запросов. Использование ключевых слов. Индексация документов, размещенных на различных серверах. Зарубежные лидеры поисковых систем.

    презентация , добавлен 10.03.2015

    Характеристика основных патентных баз данных, используемых при проведении патентно-информационного поиска в Интернете. Стратегия патентного поиска и системы патентной классификации. Использование логических операторов и ключевых слов при поиске.

    презентация , добавлен 15.09.2011

    История поисковых систем. Классификация информационных систем по степени автоматизации. Три основных способа поиска информации в Интернете. Отличие поисковых систем от каталогов. Назначение и типы информационных систем государственных учреждений.

    курсовая работа , добавлен 13.05.2015

    Приемы поиска информации в Интернете. Поиск по известному адресу, конструирование адреса пользователем. Специальные информационно-поисковые системы: классификационные (рубрикаторы) и словарные. Поиск информационных ресурсов по различным направлениям.

    реферат , добавлен 03.04.2010

    Рост количества информации в мире, его увеличение в сети Интернет в геометрической прогрессии. Количество сайтов, зарегистрированных в поисковой системе Яндекс. Особенности эффективного поиска информации в сети Интернет. Схема информационных потоков.

    презентация , добавлен 27.08.2013

    Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.

    реферат , добавлен 12.05.2010

    Обоснование выбора метода извлечения ключевых слов. Анализ предметной области, проектирование информационной системы поиска релевантных документов. Реализация запросов к электронным библиотекам. Реализация интерфейса системы поиска релевантных документов.

    дипломная работа , добавлен 21.09.2016

    Всемирная Паутина - это совокупность информационных ресурсов, связанных средствами телекоммуникаций и основанных на гипертекстовом представлении данных. Поиск информации в Internet. Конкретизация области поиска при помощи выделения ключевых слов.

Технологии поиска

Законы трения и тепломассообмена в турбулентном пограничном слое

Существует несколько разновидностей представления ʼʼзакона тренияʼʼ (для эталонного случая), приводящие практически к тождественным результатам. Сообразно понятию ʼʼлогарифмическогоʼʼ пограничного слоя (при значении первой константы турбулентности χ = 0,4 ) закон трения для предельно развитой турбулентности с ʼʼисчезающей вязкостьюʼʼ хорошо аппроксимируется простой формулой Кармана:

При степенном представлении профиля скорости должна быть предложена формула:

где: ; n – степенной показатель профиля скорости;

– полуэмпирический коэффициент;

А – эмпирический коэффициент;

δ – толщина пограничного слоя.

Используя соотношения для чисел Рейнольдса, построенных на разных линœейных величинах:

Важно заметить, что для случая развития турбулентного погранслоя с передней кромки (х кр = 0 ) закон трения должна быть представлен также в виде:

Значения параметрических величин представленных формул для различных профилей скоростей сведены в таблицу

Параметр n
1/7 1/8 1/9 1/10
А 8,74 9,71 10,6 11,5
0,0975 0,089 0,0818 0,0757
1,28 1,25 1,22 1,20
m 0,250 0,222 0,200 0,182
B 0,0252 0,0206 0,0190 0,0148
m 1 0,200 0,182 0,167 0,154
B 1 0,0576 0,0450 0,0362 0,0308

Известны и используются также другие формы представления закона трения, приводящие практически к одним и тем же результатам. Так В.М. Иевлевым предложена аппроксимация:

Формулы для законов тепло-и массообмена получаются из ʼʼзаконов тренияʼʼ для стандартных условий (эталонный случай) посредством известного принципа тройной аналогии Рейнольдса.

где: S – корректирующий множитель – фактор аналогии Рейнольдса на не соблюдение условий эталона (и), фактор S в первом приближении удовлетворительно аппроксимируется соотношением:

Важно заметить, что для случая использования интегральных параметров ʼʼзаконыʼʼ тепло-и массообмена хорошо описываются зависимостями:

Web-технология World Wide Web (WWW) считается специальной технологией подготовки и размещения документов в сети Интернет. В состав WWW входят и web-страницы, и электронные библиотеки, каталоги, и даже виртуальные музеи! При таком обилии информации остро встает вопрос: ʼʼКак сориентироваться в столь огромном и масштабном информационном пространстве -ʼʼ В решении данной проблемы на помощь приходят поисковые инструменты.

Поисковые инструменты - это особое программное обеспечение, основная цель которого – обеспечить наиболее оптимальный и качественный поиск информации для пользователœей Интернета. Поисковые инструменты размещаются на специальных веб-серверах, каждый из которых выполняет определœенную функцию:

1. Анализ веб-страниц и занесение результатов анализа на тот или иной уровень базы данных поискового сервера.

2. Поиск информации по запросу пользователя.

3. Обеспечение удобного интерфейса для поиска информации и просмотра результата поиска пользователœем.

Приемы работы, используемые при работе с теми или другими поисковыми инструментами, практически одинаковы. Перед тем как перейти к их обсуждению, рассмотрим следующие понятия:

1. Интерфейс поискового инструмента представлен в виде страницы с гиперссылками, строкой подачи запроса (строкой поиска) и инструментами активизации запроса.

2. Индекс поисковой системы - ϶ᴛᴏ информационная база, содержащая результат анализа веб-страниц, составленная по определœенным правилам.

3. Запрос - ϶ᴛᴏ ключевое слово или фраза, которую вводит пользователь в строку поиска. Для формирования различных запросов используются специальные символы ("", ~), математические символы (*, +, -).

Схема поиска информации проста. Пользователь набирает ключевую фразу и активизирует поиск, тем самым получает подборку документов по сформулированному (заданному) запросу. Этот список документов ранжируется по определœенным критериям так, чтобы вверху списка оказались те документы, которые наиболее соответствуют запросу пользователя. Каждый из поисковых инструментов использует различные критерии ранжирования документов, как при анализе результатов поиска, так и при формировании индекса (наполнении индексной базы данных web-страниц).

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, в случае если указать в строке поиска для каждого поискового инструмента одинаковой конструкции запрос, можно получить различные результаты поиска. Для пользователя имеет большое значение, какие документы окажутся в первых двух-трех десятках документов по результатам поиска и на сколько эти документы соответствуют ожиданиям пользователя.

Большинство поисковых инструментов предлагают два способа поиска – simple search (простой поиск) и advanced search (расширенный поиск) с использованием специальной формы запроса и без нее. Рассмотрим оба вида поиска на примере англоязычной поисковой машины.

К примеру, AltaVista удобно использовать для произвольных запросов, ʼʼSomething about online degrees in information technologyʼʼ, тогда как поисковый инструмент Yahoo позволяет получать мировые новости, информацию о курсе валют или прогнозе погоды.

Освоение критериев уточнения запроса и приемов расширенного поиска, позволяет увеличивать эффективность поиска и достаточно быстро найти необходимую информацию. Прежде всœего, увеличить эффективность поиска Вы можете за счёт использования в запросах логических операторов (операций) Or, And, Near, Not, математических и специальных символов. С помощью операторов и/или символов пользователь связывает ключевые слова в нужной последовательности, чтобы получить наиболее адекватный запросу результат поиска. Простой запрос дает неĸᴏᴛᴏᴩᴏᴇ количество ссылок на документы, т.к. в список попадают документы, содержащие одно из слов, введенных при запросœе, или простое словосочетание (см. таблицу 1). Оператор and позволяет указать на то, что в содержании документа должны быть включены всœе ключевые слова. Тем не менее, количество документов должна быть всœе еще велико, и их просмотр займет достаточно времени. По этой причине в ряде случаев гораздо удобнее применить контекстный оператор near, указывающий, что слова должны располагаться в документе в достаточной близости. Использование near значительно уменьшает количество найденных документов. Наличие символа "*" в строке запроса означает, что будет осуществляться поиск слова по его маске. К примеру, получим список документов, содержащих слова, начинающиеся на "gov", в случае если в строке запроса запишем "gov*". Это бывают слова government, governor и т.д.

Наиболее развитый сервис поиска русскоязычной информации предоставляет поисковый сервер Яndex. В Яndex можно просто написать по-русски фразу, описывающую то, что Вы хотите найти, и система проанализирует и обработает Ваш запрос, а затем постарается найти всœе, что относится к заданной теме. Вы можете, используя специальные операторы, составить строку, поясняющую поисковой системе, каким Вашим требованиям должна отвечать интересующая Вас информация. Некоторые из операторов языка запросов Яndex можно посмотреть здесь: http://help.yandex.ru/search/ -id=481939

Не менее популярная поисковая система Rambler ведет статистику посœещаемости ссылок из собственной базы данных, поддерживаются те же логические операторы И, ИЛИ, НЕ, метасимвол * (аналогично расширяющему диапазон запроса символу * в AltaVista), коэффициентные символы + и -, для увеличения или уменьшения значимости вводимых в запрос слов.

Давайте рассмотрим наиболее популярные технологии поиска информации в Интернет.

Тема 3 Работа с поисковыми системами Интернет

1. Введение

С каждым годом объемы Интернета увеличиваются в разы, поэтому вероятность найти необходимую информацию резко возрастает. Интернет объединяет миллионы компьютеров, множество разных сетей, число пользователей увеличивается на 15-80% ежегодно. И, тем не менее, все чаще при обращении к Интернет основной проблемой оказывается не отсутствие искомой информации, а возможность ее найти. Как правило, обычный человек в силу разных обстоятельств не может или не хочет тратить на поиск нужного ему ответа больше 15-20 минут. Поэтому особенно актуально правильно и грамотно научиться, казалось бы, простой вещи – где и как искать, чтобы получать ЖЕЛАЕМЫЕ ответы.

Чтобы найти нужную информацию, необходимо найти её адрес. Для этого существуют специализированные поисковые сервера (роботы индексов (поисковые системы), тематические Интернет-каталоги, системы мета-поиска, службы поиска людей и т.д.). В данном мастер-классе раскрываются основные технологии поиска информации в Интернете, предоставляются общие черты поисковых инструментов, рассматриваются структуры поисковых запросов для наиболее популярных русскоязычных и англоязычных поисковых систем.

2. Технологии поиска

Web-технология World Wide Web (WWW) считается специальной технологией подготовки и размещения документов в сети Интернет. В состав WWW входят и web-страницы, и электронные библиотеки, каталоги, и даже виртуальные музеи! При таком обилии информации остро встает вопрос: «Как сориентироваться в столь огромном и масштабном информационном пространстве?»
В решении данной проблемы на помощь приходят поисковые инструменты.

2.1 Поисковые инструменты

Поисковые инструменты - это особое программное обеспечение, основная цель которого – обеспечить наиболее оптимальный и качественный поиск информации для пользователей Интернета. Поисковые инструменты размещаются на специальных веб-серверах, каждый из которых выполняет определенную функцию:

  1. Анализ веб-страниц и занесение результатов анализа на тот или иной уровень базы данных поискового сервера.
  2. Поиск информации по запросу пользователя.
  3. Обеспечение удобного интерфейса для поиска информации и просмотра результата поиска пользователем.

Приемы работы, используемые при работе с теми или другими поисковыми инструментами, практически одинаковы. Перед тем как перейти к их обсуждению, рассмотрим следующие понятия:

  1. Интерфейс поискового инструмента представлен в виде страницы с гиперссылками, строкой подачи запроса (строкой поиска) и инструментами активизации запроса.
  2. Индекс поисковой системы – это информационная база, содержащая результат анализа веб-страниц, составленная по определенным правилам.
  3. Запрос – это ключевое слово или фраза, которую вводит пользователь в строку поиска. Для формирования различных запросов используются специальные символы ("", ~), математические символы (*, +, ?).

Схема поиска информации в сети Интернет проста. Пользователь набирает ключевую фразу и активизирует поиск, тем самым получает подборку документов по сформулированному (заданному) запросу. Этот список документов ранжируется по определенным критериям так, чтобы вверху списка оказались те документы, которые наиболее соответствуют запросу пользователя. Каждый из поисковых инструментов использует различные критерии ранжирования документов, как при анализе результатов поиска, так и при формировании индекса (наполнении индексной базы данных web-страниц).

Таким образом, если указать в строке поиска для каждого поискового инструмента одинаковой конструкции запрос, можно получить различные результаты поиска. Для пользователя имеет большое значение, какие документы окажутся в первых двух-трех десятках документов по результатам поиска и на сколько эти документы соответствуют ожиданиям пользователя.

Большинство поисковых инструментов предлагают два способа поиска – simple search (простой поиск) и advanced search (расширенный поиск) с использованием специальной формы запроса и без нее. Рассмотрим оба вида поиска на примере англоязычной поисковой машины.

Например, AltaVista удобно использовать для произвольных запросов, «Something about online degrees in information technology», тогда как поисковый инструмент Yahoo позволяет получать мировые новости, информацию о курсе валют или прогнозе погоды.

Освоение критериев уточнения запроса и приемов расширенного поиска, позволяет увеличивать эффективность поиска и достаточно быстро найти необходимую информацию. Прежде всего, увеличить эффективность поиска Вы можете за счет использования в запросах логических операторов (операций) Or, And, Near, Not, математических и специальных символов. С помощью операторов и/или символов пользователь связывает ключевые слова в нужной последовательности, чтобы получить наиболее адекватный запросу результат поиска. Формы запросов приведены в таблице 1.

Таблица 1

Простой запрос дает некоторое количество ссылок на документы, т.к. в список попадают документы, содержащие одно из слов, введенных при запросе, или простое словосочетание (см. таблицу 1). Оператор and позволяет указать на то, что в содержании документа должны быть включены все ключевые слова. Тем не менее, количество документов может быть все еще велико, и их просмотр займет достаточно времени. Поэтому в ряде случаев гораздо удобнее применить контекстный оператор near, указывающий, что слова должны располагаться в документе в достаточной близости. Использование near значительно уменьшает количество найденных документов. Наличие символа "*" в строке запроса означает, что будет осуществляться поиск слова по его маске. Например, получим список документов, содержащих слова, начинающиеся на "gov", если в строке запроса запишем "gov*". Это могут быть слова government, governor и т.д.

Не менее популярная поисковая система Rambler ведет статистику посещаемости ссылок из собственной базы данных, поддерживаются те же логические операторы И, ИЛИ, НЕ, метасимвол * (аналогично расширяющему диапазон запроса символу * в AltaVista), коэффициентные символы + и -, для увеличения или уменьшения значимости вводимых в запрос слов.

Давайте рассмотрим наиболее популярные технологии поиска информации в Интернет.

2.2 Поисковые машины (search engines)

Машины веб-поиска - это сервера с огромной базой данных URL-адресов, которые автоматически обращаются к страницам WWW по всем этим адресам, изучают содержимое этих страниц, формируют и прописывают ключевые слова со страниц в свою базу данных (индексирует страницы).

Более того, роботы поисковых систем переходят по встречаемым на страницах ссылкам и переиндексируют их. Так как почти любая страница WWW имеет множество ссылок на другие страницы, то при подобной работе поисковая машина в конечном результате теоретически может обойти все сайты в Интернет.

Именно этот вид поисковых инструментов является наиболее известным и популярным среди всех пользователей сети Интернет. У каждого на слуху названия известных машин веб-поиска (поисковых систем) – Яndex, Rambler, Aport.

Чтобы воспользоваться данным видом поискового инструмента, необходимо зайти на него и набрать в строке поиска интересующее Вас ключевое слово. Далее Вы получите выдачу из ссылок, хранящихся в базе поисковой системы, которые наиболее близки Вашему запросу. Чтобы поиск был наиболее эффективен, заранее обратите внимание на следующие моменты:

  • определитесь с темой запроса. Что именно в конечном итоге Вы хотите найти?
  • обращайте внимание на язык, грамматику, использование различных небуквенных символов, морфологию.Важно также правильно сформулировать и вписать ключевые слова. Каждая поисковая система имеет свою форму составления запроса - принцип один, но могут различаться используемые символы или операторы. Требуемые формы запроса различаются также в зависимости от сложности программного обеспечения поисковых систем и предоставляемых ими услуг. Так или иначе, каждая поисковая система имеет раздел "Help" ("Помощь"), где все синтаксические правила, а также рекомендации и советы по поиску, доступно объясняются (скриншот страничек поисковиков).
  • используйте возможности разных поисковых систем. Если не нашли на Яndex, попробуйте на Google. Пользуйтесь услугами расширенного поиска.
  • чтобы исключить документы, содержащие определенные термины, используйте знак "-" перед каждым таким словом. Например, если Вам нужна информация о работах Шекспира, за исключением "Гамлета", то введите запрос в виде: "Шекспир-Гамлет". И для того, чтобы, наоборот, в результаты поиска обязательно включались определенные ссылки, используйте символ "+". Так, чтобы найти ссылки о продаже именно автомобилей, Вам нужен запрос "продажа+автомобиль". Для увеличения эффективности и точности поиска, используйте комбинации этих символов.
  • каждая ссылка в списке результатов поиска содержит – несколько строчек из найденного документа, среди которых встречаются Ваши ключевые слова. Прежде чем переходить по ссылке, оцените соответсвие сниппета теме запроса. Перейдя по ссылке на определенный сайт, внимательно окиньте взглядом главную страничку. Как правило, первой страницы достаточно, чтобы понять – по адресу Вы пришли или нет. Если да, то дальнейшие поиски нужной информации ведите на выбранном сайте (в разделах сайта), если нет – возвращайтесь к результатам поиска и пробуйте очередную ссылку.
  • помните, что поисковые системы не производят самостоятельную информацию (за исключением разъяснений о самих себе). Поисковая система – это лишь посредник между обладателем информации (сайтом) и Вами. Базы данных постоянно обновляются, в них вносятся новые адреса, но отставание от реально существующей в мире информации все равно остается. Просто потому, что поисковые системы не работают со скоростью света.

К наиболее известным машинам веб-поиска относятся Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Среди русскоязычных можно выделить Яndex, Rambler, Апорт.

Поисковые системы являются самыми масштабными и ценными, но далеко не единственными источниками информации в Сети, ведь помимо них существуют и другие способы поиска в Интернете.

2.3 Каталоги (directories)

Каталог Интернет-ресурсов – это постоянно обновляющийся и пополняющийся иерархический каталог, содержащий множество категорий и отдельных web-серверов с кратким описанием их содержимого.Способ поиска по каталогу подразумевает «движение вниз по ступенькам», то есть движение от более общих категорий к более конкретным. Одним из преимуществ тематических каталогов является то, что пояснения к ссылкам дают создатели каталога и полностью отражают его содержание, то есть дает Вам возможность точнее определить, насколько соответствует содержание сервера цели Вашего поиска.

Примером тематического русскоязычного каталога можно назвать ресурс http://www.ulitka.ru/ .

На главной странице данного сайта расположен тематический рубрикатор,

с помощью которого пользователь попадает в рубрику со ссылками на интересующую его продукцию.

Кроме того, некоторые тематические каталоги позволяют искать по ключевым словам. Пользователь вводит необходимое ключевое слово в строку поиска

и получает список ссылок с описаниями сайтов, которые наиболее полно соответствуют его запросу. Стоит отметить, что этот поиск происходит не в содержимом WWW-серверов, а в их кратком описании, хранящихся в каталоге.

В нашем примере в каталоге также имеется возможность сортировки сайтов по количеству посещений, по алфавиту, по дате занесения.

Другие примеры русскоязычных каталогов:
Каталог@Mail.ru
Weblist
Vsego.ru
Cреди англоязычных каталогов можно выделить:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Подборки ссылок

Подборки ссылок – это отсортированные по темам ссылки. Они достаточно сильно отличаются друг от друга по наполнению, поэтому чтобы найти подборку, наиболее полно отвечающую Вашим интересам, необходимо ходить по ним самостоятельно, дабы составить собственное мнение.

В качестве примера приведем Подборку ссылок "Сокровища Интернет" АО "Релком"

Пользователь, нажимая на любую из заинтересовавших его рубрик

  • СОДЕРЖАНИЕ

    Автомобилистам

    • Астрономия и астрология
    • Ваш дом
    • Ваши питомцы
    • Дети - цветы жизни
    • Досуг
    • Города в Сети Internet
    • Здоровье и медицина
    • Информационные агентства и службы
    • Краеведческий музей и т.д.,
    • Автомобильная электроника.
    • Музей автомото старины.
    • Коллегия Правовой Защиты Автовладельцев.
    • Sportdrive.

    Преимуществом такого вида поисковых инструментов является их целенаправленность, обычно подборка включает в себя редкие интернет ресурсы, подобранные конкретным веб-мастером или хозяином интернет странички.

    2.5 Базы данных адресов (addresses database)

    Базы данных адресов – это специальные поисковые сервера, которые обычно используют классификации по роду деятельности, по выпускаемой продукции и оказываемым услугам, по географическому признаку. Иногда они дополнены поиском по алфавиту. В записях базы данных хранится информация о сайтах, которые предоставляют информацию об электронном адресе, организации и почтовом адресе за определенную плату.

    Крупнейшей англоязычной базой данных адресов можно назвать: http://www.lookup.com/ -

    Попадая в данные поддиректории, пользователь обнаруживает ссылки на сайты, которые и предлагают интересующую его информацию.

    Широко доступных и официальных баз данных адресов в РФ нам неизвестно.

    2.6 Поиск в архивах Gopher (Gopher archives)

    Gopher – это взаимосвязанная система серверов (Gopher-пространство), распределенная по Интернет.

    В пространстве Gopher собрана богатейшая литературная библиотека, однако материалы недоступны для просмотра в удаленном режиме: пользователь может только просматривать иерархически организованное оглавление и выбирать файл по названию. С помощью специальной программы (Veronica) такой поиск можно сделать и автоматически, используя запросы, построенные на ключевых словах.

    До 1995 года Gopher являлся самой динамичной технологией Интернет: темпы роста числа соответствующих серверов опережали темпы роста серверов всех других типов Интернет. В сети EUnet/Relcom активного развития серверы Gopher не получили, и сегодня о них практически никто не вспоминает.

    2.7 Система поиска FTP файлов (FTP Search)

    Система поиска FTP-файлов – это особый тип средств поиска в Internet, который позволяет находить файлы, доступные на «анонимных» FTP-серверах. Протокол FTP предназначен для передачи по сети файлов, и в этом смысле он функционально является своеобразным аналогом Gopher.

    Основным критерием поиска является название файла, задаваемое разными способами (точное соответствие, подстрока, регулярное выражение и т.д.). Данный тип поиска, конечно же, не может соперничать по возможностям с поисковыми машинами, так как содержимое файлов никак не учитывается при поиске, а файлам, как известно, можно давать произвольные имена. Тем не менее, если Вам требуется найти какую-нибудь известную программу или описание стандарта, то с большой долей вероятности файл, его содержащий, будет иметь соответствующее имя, и Вы сможете найти его при помощи одного из серверов FTP Search :

    FileSearch ищет файлы на FTP-серверах по именам самих файлов и каталогов. Если Вы ищете какую-либо программу или еще что-то, то на WWW-серверах Вы скорее найдете их описание, а с FTP-серверов Вы сможете перекачать их к себе.

    2.8 Система поиска в конференциях Usenet News

    USENET NEWS – это система телеконференций сообщества сетей Интернет. На Западе этот сервис принято называть новостями. Близким аналогом телеконференций являются и так называемые "эхи" в сети FIDO.

    С точки зрения абонента телеконференции, USENET представляют из себя доску объявлений, в которой есть разделы, где можно найти статьи на любую тему - от политики до садоводства. Эта доска объявлений доступна через компьютер, подобно электронной почте. Не отходя от компьютера, можно читать или помещать статьи в ту или иную конференцию, найти полезный совет или вступать в дискуссии. Естественно, статьи занимают место на компьютерах, поэтому не хранятся вечно, а периодически уничтожаются, освобождая место для новых. Во всем мире лучшим сервисом для поиска информации в конференциях Usenet является сервер Google Groups (Google Inc.).

    Группы Google – это бесплатное интерактивное сообщество и служба групп обсуждений, которая предлагает самый обширный в Интернете архив сообщений сети Usenet (более миллиарда сообщений).Подробнее ознакомиться с правилами пользования сервисом можно на странице http://groups.google.com/intl/ru/googlegroups/tour/index.html

    Среди русскоязычных выделяется сервер Всемирная система USENET и телеконференции Relcom. Точно также как и в других поисковых службах, пользователь набирает строку запроса, а сервер формирует список конференций, содержащих ключевые слова. Далее надо подписаться на отобранные конференции в программе работы с новостями. Также имеет место аналогичный российский сервер FidoNet Online: конференции Fido на WWW.

    2.9 Системы мета-поиска

    Для быстрого поиска в базах сразу нескольких поисковых систем лучше обратиться к системам мета-поиска.

    Системы мета-поиска – это поисковые машины, которые посылают Ваш запрос на огромное количество разных поисковых систем, затем обрабатывают полученные результаты, удаляют повторяющиеся адреса ресурсов и представляют более широкий спектр того, что представлено в сети Интернет.

    Наиболее популярная в мире система мета-поиска Search.com .

    Объединенный поисковый сервер Search.com компании CNET, Inc. включает в себя почти два десятка поисковых систем, ссылками на которые пестрит весь Интернет.

    С помощью данного вида поисковых инструментов пользователь может искать информацию во множестве поисковых систем, однако отрицательной стороной данных систем можно назвать их нестабильность.

    2.10 Системы поиска людей

    Системы поиска людей – это специальные сервера, которые позволяют осуществлять поиск людей в Интернет, пользователь может указать Ф.И.О. человека и получить его адрес электронной почты и URL-адрес. Однако, следует отметить, что системы поиска людей, в основном, берут информацию об электронных адресах из открытых источников, таких как конференции Usenet. Среди самых известных систем поиска людей можно выделить:

    Поиск адресов e-mail

    в специальные графы поиска контактные данные (First Name. City, Last Name, Phone number), Вы можете найти интересующую Вас информацию.

    Системы поиска людей - это действительно большие сервера, их базы данных содержат порядка 6 000 000 адресов.

    3. Заключение

    Мы рассмотрели основные технологии поиска информации в Интернет и представили в общих чертах поисковые инструменты, которые существуют на данный момент в Интернете, а также структуру поисковых запросов для наиболее популярных русскоязычных и англоязычных поисковых систем и, подводя итог вышесказанному, хотим отметить, что единой оптимальной схемы поиска информации в Интернет не существует. В зависимости от специфики нужной Вам информации, Вы можете использовать соответствующие поисковые инструменты и службы. А от того, как грамотно будут подобраны поисковые службы, зависит качество результатов поиска.

  • Лекция 4. Инструменты информационного поиска

    Постоянное обновление информационного массива в сочетании с приростом объема данных крайне усложняет учет имеющихся документов и, соответственно, поиск, который условно можно разделить на:

    • фактографический поиск: в энциклопедиях, справочниках, словарях,
    • библиографический поиск: библиотеки, каталоги, программы.
    • документальный поиск: электронные документы, электронные библиотеки, электронные журналы.

    Важность проблемы информационного поиска привела к образованию целой отрасли, задача которой заключается именно в оказании помощи пользователю по навигации в киберпространстве. Составляют эту отрасль специальные поисковые службы или сервисы . Их традиционно разделяют на:

    • справочники или каталоги
    • поисковые системы

    Эти разновидности визуально очень похожи, поскольку «каждый справочник обладает собственной поисковой системой, а каждая поисковая система - собственным справочником» . Однако принципы их работы базируются на абсолютно разных подходах и технологиях. При этом каждая разновидность поисковых сервисов применяется в решении определенного типа задач. Информационный поиск подразумевает использование определенных стратегий, методов, механизмов и средств. Поведение пользователя, осуществляющего управление процессом поиска, определяется не только информационной потребностью, но и инструментальным разнообразием системы - технологиями и средствами, предоставляемыми системой. Выбором инструмента во многом определяется стратегия поисковой деятельности и поисковые технологии.

    Поисковые технологии - унифицированные (оптимизированные в рамках конкретной информационно-поисковой системы) последовательности эффективного использования отдельных средств поиска в процессе взаимодействия пользователя с системой.

    По используемым поисковым технологиям информационные системы можно разбить на 3 категории:

    • тематические каталоги и специализированные каталоги (онлайновые справочники);
    • поисковые машины (полнотекстовый поиск);
    • средства мета-поиска.

    Тематические каталоги предусматривают обработку документов и отнесение их к одной из нескольких категорий, перечень которых заранее задан. Фактически это знакомое всем библиотекарям индексирование на основе классификации . Специализированные каталоги или справочники создаются по отдельным отраслям и темам. Поисковые машины (самое развитое средство поиска в Интернете) реализуют технологию полнотекстового поиска. Индексируются тексты, расположенные на запрашиваемых серверах. При использовании средств метапоиска запрос осуществляется одновременно несколькими поисковыми системами. Результат поиска объединяется в общий, упорядоченный по степени релевантности, список.

    Средства поиска - взаимозависимый комплекс информационно-поисковых языков и языков определения/управления данными, обеспечивающий структурные и семантические преобразования объектов обработки (документов, словарей, совокупностей результатов поиска).

    1. Справочники

    Поисковые средства первой группы представляют собой электронные справочники, имеющие четкую иерархическую систематическую или логико-тематическую структуру, во многом напоминающую структуру систематического каталога библиотеки . Работа со справочниками позволяет ориентироваться в Интернет-ресурсах в пределах отдельных отраслей знания, углубляясь от общего к частному, меняя иерархические ветви, возвращаясь на несколько шагов назад и т.д.

    Среди российских разработок в этой области значатся:

    • Апорт (адрес: www.aport.ru ),
    • List.ru (адрес: list.mail.ru ),
    • Weblist (адрес: www.weblist.ru ),
    • Иван Сусанин (адрес: www.susanin.net )
    • Улитка (адрес: www.ulitka.ru ).

    Главной отличительной особенностью справочников является то, что они сделаны вручную. Редакционные коллегии каждого из справочников, которые по характеру труда напоминают отделы каталогизации и систематизации крупных библиотек , регулярно просматривают содержимое вновь появившихся серверов и отслеживают изменения на уже существующих. Выявленные данные анализируются и заносятся в разделы справочника в соответствии с принятой классификацией. Описание сервера в целом (или раздела, если он представляется вполне самостоятельным блоком) снабжается краткой аннотацией, содержащей общие сведения о характере имеющейся информации. В некоторых случаях заносятся добавочные сведения о языке документов, посещаемости ресурса, его физическом месторасположении и т.п.

    Основными параметрами, характеризующими достоинства справочников, являются:

    • объем;
    • оперативность отражения новых или изменившихся ресурсов;
    • логичность и последовательность иерархической схемы классификации;
    • перекрестность структуры.

    Объемом справочника определяется степень его надежности или « информационная прочность» . В некоторых системах существует специальный механизм, периодически проверяющий доступность сайта и исключающий его из перечня при долгом «отсутствии» в Сети. Логичностью (научностью) применяемой схемы классификации определяется степень простоты, с которой пользователи находят требуемые сведения. Система перекрестных ссылок позволяет выявить информацию, используя разные подходы (например, территориальный или отраслевой). В этом случае схема классификации должна автоматически выводить пользователя на искомый объект, какой бы путь поиска не был выбран.

    Возможности составления запроса для этого вида поисковых средств особой роли не играют. Сложные разыскания, требующие детализации запроса, с помощью каталогов не проводятся.

    Справочники предназначены для решения трех типов задач :

    • ориентация в незнакомой отрасли знания;
    • разыскание крупных объектов, каковыми являются, к примеру, серверы организаций или значительных проектов;
    • получение готового перечня ресурсов, имеющих размытый поисковый образ (библиотек определенного типа, транспортных расписаний или сайтов политических партий и т.д.)

    Другим примером является сравнение справочника ресурсов с систематическим каталогом библиотеки, в котором от книги (в данном случае, целого сайта) остается лишь описание и аннотация.

    2. Поисковые системы

    В основу работы поисковых систем (поисковых машин) заложены совершенно иные технологические принципы. Задача поисковых машин - обеспечить детальное разыскание информации, что может быть достигнуто только за счет учета (индексирования ) содержания максимально возможного числа веб-страниц. В отличие от справочников, поисковые машины функционируют в автоматизированном режиме и имеют единообразный принцип действия.

    Поисковые системы состоят из двух базовых компонентов. Первый компонент представляет собой программу-робот , задача которого передвигаться с сервера на сервер и находить там новые (или изменившиеся) документы, скачивая их на главный компьютер системы. Робот просматривает содержимое документа, находит новые ссылки, - как на другие документы сервера, так и внешние сайты. Далее программа самостоятельно направляется по указанным ссылкам, находит новые документы, после чего процесс повторяется вновь, напоминая хорошо известный в библиографии «метод снежного кома» . Выявленные документы обрабатываются (индексируются) вторым компонентом поисковой системы. При этом, как правило, учитывается все содержание страницы, включая текст, иллюстрации, аудио- и видеофайлы. Индексации подвергаются все слова в документе, что дает возможность использовать поисковые системы для детального поиска по самой узкой тематике. Образуемые индексные файлы , хранящие информацию о том, какое ключевое слово, сколько раз, в каком документе и на каком сервере употребляется, составляют ту базу данных, к которой обращается библиотекарь, вводящий в строку запроса сочетания ключевых слов.

    Вывод результатов осуществляется с помощью специального модуля, который производит интеллектуальное ранжирование результатов . При этом в расчет берется:

    • местоположение термина в документе (название, заголовок, основной текст), частота его повторения,
    • процентное соотношение искомого термина к тексту страницы,
    • число и авторитетность внешних ссылок на данную страницу с других сайтов.

    К основным параметрам поисковых систем относятся:

    • число проиндексированных серверов и отдельных документов (объем индексных файлов);
    • степень оперативности обновления базы данных за счет включения сведений о новых материалах и удаления устаревших;
    • возможности для составления запроса;
    • интеллектуальность системы ранжирования результатов поиска;
    • наличие дополнительных сервисных функций, облегчающих работу пользователя.

    Возможности поискового механизма выражать запрос максимально точно в значительной степени предопределяют качество полученных результатов. Каждая машина имеет свою собственную лексику, которая по-разному позволяет детализировать поисковое предписание .

    Все поисковые машины обладают модулем ранжирования результатов поиска . Это второй базовый компонент всех систем. Перечень факторов, принимаемых во внимание при определении места документа в перечне ссылок, необычайно широк: от местоположения слова на странице до рейтинга (авторитета) страниц, имеющих ссылки на найденный документ.

    • Google (адрес: www.google.com ),
    • AlltheWeb (адрес: www.alltheweb.com ),
    • Alta Vista (адрес: www.altavista.com ).

    Подобные поисковые средства существуют и в России. Все они предназначены для работы с русскоязычными документами и обладают мощным http://www.metabot.ru ).

    Выводы по теме лекционного блока

    Поисковая система делает выборку страниц из базы данных в соответствии с запросом, затем страницы упорядочиваются по степени убывания совпадений (примеч. А.А.)

    В данном случае наблюдается прямая аналогия с принципами работы распределенных сводных каталогов библиотеки. Ключевой возможностью мета-поиска является способность рассылать запросы пользователя одновременно по различным поисковых системам - с последующим суммированием результатов. (примеч. А.А.)

    Обращаясь к справочникам, библиотекарь может рассчитывать на получение лишь очень общих сведений по тематике, и никогда - детальных данных: от сервера крупной корпорации, содержащего тысячи страниц, в справочнике будет представлено лишь наименование и несколько строк аннотации.

    ИПС (информационно-поисковая система) – это система, обеспечивающая поиск и отбор необходимых данных в специальной базе с описаниями источников информации (индексе) на основе информационно-поискового языка и соответствующих правил поиска.

    Релевантность – это соответствие результатов поиска сформулированному запросу.

    Пертинентность (в информационном поиске) - соответствие полученной информации информационной потребности пользователя.

    Пертинентность измеряется степенью соответствие между ожиданиями пользователя и результатами поиска (сравните с релевантностью), которая определяется как отношение объема полезной для пользователя информации к общему объему полученной информации, найденнойпоисковой системой.

    Достижение высокой степени пертинентности - основное поле конкурентной борьбы современных поисковых систем. Именно для максимального удовлетворения информационных потребностей пользователей в настоящее время в ИП-системах широко применяются теории и методы семантических сетей, контент-анализа и глубинного анализа текстов (Text mining,интеллектуальный анализ текстов ).

    Для поиска нужной информации в сети используется адрес ресурса (англ . Uniform Resource Locator (URL ) адрес), содержащий имя протокола, по которому нужно обращаться к требуемой информации, адрес сервера и имя файла на этом сервере (рис. 2).

    Рис. 2. Пример адреса ресурса

    Поиско́вая систе́ма - программно-аппаратный комплекс свеб-интерфейсом, предоставляющий возможность поискаинформациивИнтернете. Под поисковой системой обычно подразумеваетсясайт, на котором размещён интерфейс системы. Программной частью поисковой системы являетсяпоисковая машина(поисковый движок) -комплекс программ, обеспечивающий функциональность поисковой системы и обычно являющийся коммерческой тайной компании-разработчика поисковой системы

    Поиск информации в Интернете осуществляется с помощью специальных программ, обрабатывающих запросы - информационно-поисковых систем (ИПС) . Существует несколько моделей, на которых основана работа поисковых систем, но исторически две модели приобрели наибольшую популярность - это поисковые каталоги и поисковые указатели .

    Поисковые каталоги устроены по тому же принципу, что и тематические каталоги крупных библиотек. Они обычно представляют собой иерархические гипертекстовые меню с пунктами и подпунктами, определяющими тематику сайтов, адреса которых содержатся в данном каталоге, с постепенным, от уровня к уровню, уточнением темы. Поисковые каталоги создаются вручную . Высококвалифицированные редакторы лично просматривают информационное пространство WWW, отбирают то, что по их мнению представляет общественный интерес, и заносят в каталог.

    Основной проблемой поисковых каталогов является чрезвычайно низкий коэффициент охвата ресурсов WWW. Чтобы многократно увеличить коэффициент охвата ресурсов Web, из процесса наполнения базы данных поисковой системы необходимо исключить человеческий фактор - работа должна быть автоматизирована.

    Автоматическую каталогизацию Web-ресурсов и удовлетворение запросов клиентов выполняют поисковые указатели . Работу поискового указателя можно условно разделить на три этапа:

      сбор первичной базы данных. Для сканирования информационного пространства WWW используются специальные агентские программы - черви, задача которых состоит в поиске неизвестных ресурсов и регистрация их в базе данных;

      индексация базы данных - первичная обработка с целью оптимизации поиска. На этапе индексации создаются специализированные документы - собственно поисковые указатели;

      рафинирование результирующего списка. На этом этапе создается список ссылок, который будет передан пользователю в качестве результирующего. Рафинирование результирующего списка заключается в фильтрации и ранжировании результатов поиска.

    Под фильтрацией понимается отсев ссылок, которые нецелесообразно выдавать пользователю (например, проверяется наличие дубликатов). Ранжирование заключается в создании специального порядка представления результирующего списка (по количеству ключевых слов, сопутствующих слов и др.).

    Главной задачей любой ИПС является поиск информации релевантной информационным потребностям пользователя. Очень важно в результате проведенного поиска ничего не потерять, то есть найти все документы, относящиеся к запросу, и не найти ничего лишнего. Поэтому вводится качественная характеристика процедуры поиска – релевантность.

    Релевантность – это соответствие результатов поиска сформулированному запросу.

    1 Поисковые инструменты

    Поисковые инструменты - это особое программное обеспечение, основная цель которого – обеспечить наиболее оптимальный и качественный поиск информации для пользователей Интернета. Поисковые инструменты размещаются на специальных веб-серверах, каждый из которых выполняет определенную функцию:

    Машины веб-поиска - это сервера с огромной базой данных URL-адресов, которые автоматически обращаются к страницам WWW по всем этим адресам, изучают содержимое этих страниц, формируют и прописывают ключевые слова со страниц в свою базу данных (индексирует страницы).

    Более того, роботы поисковых систем переходят по встречаемым на страницах ссылкам и переиндексируют их. Так как почти любая страница WWW имеет множество ссылок на другие страницы, то при подобной работе поисковая машина в конечном результате теоретически может обойти все сайты в Интернет.

    Именно этот вид поисковых инструментов является наиболее известным и популярным среди всех пользователей сети Интернет. У каждого на слуху названия известных машин веб-поиска (поисковых систем) – Яndex, Rambler, Aport.

    Работа машин веб-поиска сводится к следующему:

      Анализ веб-страниц и занесение результатов анализа на тот или иной уровень базы данных поискового сервера.

      Поиск информации по запросу пользователя.

      Обеспечение удобного интерфейса для поиска информации и просмотра результата поиска пользователем.

    Приемы работы, используемые при работе с теми или другими поисковыми инструментами, практически одинаковы. При их описании используются следующие понятия:

      Интерфейс поискового инструмента представлен в виде страницы с гиперссылками, строкой подачи запроса (строкой поиска) и инструментами активизации запроса.

      Индекс поисковой системы – это информационная база, содержащая результат анализа веб-страниц, составленная по определенным правилам.

      Запрос – это ключевое слово или фраза, которую вводит пользователь в строку поиска. Для формирования различных запросов используются специальные символы ("", ~), математические символы (*, +, ?).

    Схема поиска информации проста. Пользователь набирает ключевую фразу и активизирует поиск, тем самым получает подборку документов по сформулированному (заданному) запросу. Этот список документов ранжируется по определенным критериям так, чтобы вверху списка оказались те документы, которые наиболее соответствуют запросу пользователя. Каждый из поисковых инструментов использует различные критерии ранжирования документов, как при анализе результатов поиска, так и при формировании индекса (наполнении индексной базы данных web-страниц).

    В России наиболее крупными и популярными поисковыми указателями являются:

      «Яndex» (www.yandex.ru)

      «Pамблер» (www.rambler.ru)

      «Google» (www.google.ru)

      «Апорт2000» (www.aport.ru)

    2 Механизмы поиска

    Обобщенная технология поиска состоит из следующих этапов:

      Пользователь формулирует запрос

      Система проводит поиск документов (или их поисковых образов)

      Пользователь получает результат (сведения о документах)

      Пользователь совершенствует или реформирует запрос

      Организация нового поиска...

    Как правило, поисковые машины поддерживают два режима: режим простого поиска и режим расширенного поиска. Рассмотрим обобщенные возможности.

    Формирования запроса в режиме простого поиска. Можно просто вводить через пробел одно или несколько слов; поиск слов со всевозможными окончаниями моделируется символом * в конце слова. Многие системы позволяют искать словосочетания или фразу, для этого необходимо ее заключить в кавычки. Возможно обязательное включение или исключение определенных слов.

    Основная проблема поиска по примитивно составленному запросу (в виде перечисления ключевых слов) заключается в том, что поисковая машина найдет все страницы, на которых указанные слова встречаются в любой части документа. Как правило, количество найденных страниц будет слишком велико.

    Для улучшения качества поиска в режиме простого поиска допустимо использование логических операторов и операторов, позволяющих ограничить область поиска, а также выбор определенной категории документов из представленного списка.

    Многие поисковые системы включают в свой язык составления запросов специальные операторы, позволяющие проводить поиск в определенных зонах документа, например, в его заголовке, или искать документ по известной части его адреса.

    Режим расширенного или детального запроса в разных системах реализован индивидуально, но чаще всего это бланк, в котором упомянутые операторы и ключевые элементы реализуются простой установкой соответствующих флажков или выбором параметров из списка.

    Ниже в качестве примера приведены сведения из раздела помощь поисковой системы Yandex: окно расширенного поиска, язык запросов, искать в найденном.

    Искать в найденном Если в результате запроса Яндекс нашел много документов, но по более широкой теме, чем вам хочется, вы можете сократить этот список, уточнив запрос. Еще один вариант - включить флажок в найденном в форме поиска, задать дополнительные ключевые слова, и следующий поиск будет вестись только по тем документам, которые были отобраны в предыдущем поиске.

    Памятка по использованию языка запросов

    Пример

    Значение

    "К нам на утренний рассол"

    Слова идут подряд в точной форме

    "Прибыл * посол"

    Пропущено слово в цитате

    полгорбушки & мосол

    Слова в пределах одного предложения

    снаряжайся && добудь

    Слова в пределах одного документа

    глухаря | куропатку | кого-нибудь

    Поиск любого из слов

    не смогешь << винить

    Неранжирующее "и": выражение после оператора не влияет на позицию документа в выдаче

    я должон /2 казнить

    Расстояние в пределах двух слов в любую сторону (то есть между заданными словами может встречаться одно слово)

    нешто я ~~ пойму

    Исключение слова пойму из поиска

    при моем /+2 уму

    Расстояние в пределах двух слов в прямом порядке

    чай ~ лаптем

    Поиск предложения, где слово чай встречается без слова лаптем

    щи /(-1 +2) хлебаю

    Расстояние от одного слова в обратном порядке до двух слов в прямом

    Соображаю!что!чему

    Слова в точной форме с заданным регистром

    получается && (+на | !мне)

    Скобки формируют группы в сложных запросах

    Политика

    Словарная форма слова

    title:(в стране)

    Поиск по заголовкам документов

    url:ptici.narod.ru/ptici/kuropatka.htm

    Поиск по URL

    беспременно inurl:vojne

    Поиск с учетом фрагмента URL

    Поиск по хосту

    Поиск по хосту в обратной записи

    site:http://www.lib.ru/PXESY/FILATOW

    Поиск по всем поддоменам и страницам заданного сайта

    Поиск по одному типу файлов

    Поиск с ограничением по языку

    Поиск с ограничением по домену

    Поиск с ограничением по дате

    государственное дело && /3 улавливаешь нить

    Расстояние в 3 предложения в любую сторону

    нешто я ~~ пойму

    Исключение слова пойму из поиска

    Интересной возможностью является поиск документов в сети, ссылающиеся на страницу с указанным вами адресом (URL). Таким образом, можно найти в сети страницы, на которых есть ссылки на ваш Web-сайт. Некоторые системы позволят ограничить область поиска внутри указанного домена.

    В качестве дополнительных специальных операторов можно выделить:

      Операторы поиска документов с определенным графическим файлом;

      Операторы ограничения по дате искомых страниц;

      Операторы близости между словами;

      Операторы учета словоформы;

      Операторы сортировки результатов (по релевантности, свежести, старости).

    Следует заметить, что, к великому сожалению, на сегодняшний день не существует стандарта на количество и синтаксис поддерживаемых операторов для различных поисковых систем. Попытки разработать стандарт на синтаксис поддерживаемых операторов предпринимаются, поэтому есть надежда на то, что разработчики поисковых систем позаботятся об удобстве пользователей. На данном этапе развития средств поиска, пользователь, обращаясь к определенной поисковой системе, непременно должен в первую очередь ознакомиться с ее правилами составления запросов. Как правило, на домашней странице будет обязательно присутствовать ссылка Помощь (Help), по которой вы перейдете к справочной информации.

    Различные поисковые системы описывают разное количество источников информации в Интернет. Поэтому нельзя ограничиваться поиском только в одной поисковой системе.

    Рассмотрим способы представления результатов поиска в поисковых машинах.

    Чаще всего количество найденных документов превышает несколько десятков, а в отдельных случаях может достигать сотен тысяч! Поэтому в качестве формы выдачи составляется список документов по 5-10-15 единиц на странице с возможностью перехода к следующей порции внизу страницы. Обязательно указывается заголовок и URL(адрес) найденного документа, иногда система указывает в процентах степень релевантности документа.

    В описании документа чаще всего содержится несколько первых предложений или выдержки из текста документа с выделением ключевых слов. Как правило, указана дата обновления (проверки) документа, его размер в килобайтах, некоторые системы определяют язык документа и его кодировку (для русскоязычных документов).

    Что можно делать с полученными результатами? Если название и описание документа соответствует вашим требованиям, можно немедленно перейти к его первоисточнику по ссылке. Это удобнее делать в новом окне, чтобы иметь возможность далее анализировать результаты выдачи. Многие поисковые системы позволяют проводить поиск в найденных документах, причем вы можете уточнить ваш запрос введением дополнительных терминов.

    Если интеллектуальность системы высока, вам могут предложить услугу поиска похожих документов. Для этого вы выбираете особо понравившийся документ и указываете его системе в качестве образца для подражания.

    Однако, автоматизация определение похожести – весьма нетривиальная задача, и зачастую эта функция работает неадекватно вашим надеждам. Некоторые поисковики позволяют провести пересортировку результатов. Для экономии вашего времени можно сохранить результаты поиска в виде файла на локальном диске для последующего изучения в автономном режиме.



    © 2024 beasthackerz.ru - Браузеры. Аудио. Жесткий диск. Программы. Локальная сеть. Windows