Metody wyszukiwania informacji w Internecie

Chociaż wyszukiwarki internetowe korzystają z coraz doskonalszych mechanizmów penetrujących Sieć, to gdy próbujemy odnaleźć konkretne informacje, musimy mieć cierpliwość i poświęcić sporo czasu. Jednak stosując podstawowe reguły wyszukiwania, z pewnością skrócimy czas dotarcia do odpowiednich stron WWW. Postaramy się zatem powiedzieć, co zrobić, aby docierając do ukrytej w Sieci informacji, nie trzeba było przeglądać setek stron WWW, wyświetlanych jako odpowiedź wyszukiwarki na zadane przez nas zapytanie. Wiemy, że podstawą efektywniejszego wykorzystania tego, co oferuje Sieć, jest posiadanie elementarnej wiedzy o funkcjonujących w Internecie mechanizmach katalogujących i wyszukujących oraz znajomość zasad wyszukiwania, ale rzadko kto stosuje te zasady.

Chociaż wyszukiwarki internetowe korzystają z coraz doskonalszych mechanizmów penetrujących Sieć, to gdy próbujemy odnaleźć konkretne informacje, musimy mieć cierpliwość i poświęcić sporo czasu. Jednak stosując podstawowe reguły wyszukiwania, z pewnością skrócimy czas dotarcia do odpowiednich stron WWW. Postaramy się zatem powiedzieć, co zrobić, aby docierając do ukrytej w Sieci informacji, nie trzeba było przeglądać setek stron WWW, wyświetlanych jako odpowiedź wyszukiwarki na zadane przez nas zapytanie. Wiemy, że podstawą efektywniejszego wykorzystania tego, co oferuje Sieć, jest posiadanie elementarnej wiedzy o funkcjonujących w Internecie mechanizmach katalogujących i wyszukujących oraz znajomość zasad wyszukiwania, ale rzadko kto stosuje te zasady. Zatem krótko przypominamy o tym, co pomoże nam w sieciowych poszukiwaniach. Podstawową częścią każdej wyszukiwarki jest tzw. robot, który zbiera informacje z Sieci. Jest to specjalny program napisany według algorytmu, który samodzielnie przeszukuje Internet, analizuje zawartość stron WWWW i zapamiętuje wszystko, co znajdzie na tych stronach, w swojej bazie danych. Gdy robot już wcześniej przeszukiwał dany serwis, to za kolejnym razem sprawdza, czy coś się w nim zmieniło - jeżeli tak, to aktualizuje swoją bazę (tzw. index). Ta część pracy wykonywanej przez wyszukiwarkę jest niewidoczna dla użytkownika.
Natomiast internauta widzi efekty pracy wykonywanej przez drugi moduł wyszukiwarki, czyli system umożliwiający zadawanie pytań (okienko wyszukiwarki wraz z zestawem opcji dodatkowych do wyboru) oraz wykaz adresów odnalezionych stron WWW. Wpisanie do okienka poszukiwanego słowa lub wyrażenia i uruchomienie procesu wyszukiwania kliknięciem odpowiedniego przycisku, powoduje wyświetlenie listy stron, zawierających szukane słowo czy wyrażenie. Przy czym kolejność na liście odpowiedzi jest wybierana przez mechanizm wyszukujący tak, aby szukane słowo występowało na danej stronie WWW jak najczęściej (m.in. w tytule, słowach kluczowych, treści strony) i na jak najwyższych miejscach. Dzięki temu trafność odpowiedzi może być najwyższa. Większość portali internetowych oferuje, oprócz profesjonalnie przygotowanych katalogów stron WWW, odpowiednio przygotowane mechanizmy wyszukujące. Katalog to spis wielu tysięcy stron WWW, poukładanych w działy według tematów, opracowany przez zespół redaktorów, którzy oglądają internetowe witryny i je weryfikują, a następnie klasyfikują do odpowiednich kategorii. W każdym dziale tematycznym umieszczane są coraz bardziej szczegółowe podrozdziały, zawierające adresy stron WWW poświęconych danej dziedzinie. Do katalogów wybierane są strony najciekawsze i najbardziej znane, a odnośniki prowadzą do głównych stron witryn. Odnalezienie stron WWW dotyczących konkretnej tematyki jest tutaj łatwiejsze niż podczas korzystania z wyszukiwarek, a taki podział tematyczny znacznie ułatwia poszukiwania, jeżeli planujemy przejrzenie stron poświęconych dokładnie określonemu tematowi. Katalogów internetowych powinni używać m.in. początkujący internauci, którzy chcą przejrzeć ciekawe, sprawdzone pod względem jakości i zawartości merytorycznej witryny. Jeśli szukamy informacji związanych z konkretnym problemem, należy rozpocząć wędrówkę po Sieci właśnie od katalogu. Kiedy szukamy konkretnego sformułowania, które można jednoznacznie zdefiniować jednym słowem lub niezbyt długim wyrażeniem albo gdy znamy konkretną nazwę i chcemy znaleźć wszystko na określony temat, warto zdecydować się na poszukiwania za pomocą mechanizmów wyszukujących. Gdy szukamy informacji w języku polskim, korzystajmy z polskich wyszukiwarek (indeksują one strony przygotowane po polsku). Jednymi z najlepszych są Google (www.google.com. ), NetSprint ( www.netsprint.pl ), a także polska wersja Altavisty ( www.altavista.pl ) i Infoseeka ( http://infoseek.icm.edu.pl ). Zazwyczaj najwięcej trafnych odpowiedzi uzyskamy, wpisując jako umieszczane są słowa w tytule strony i słowa kluczowe w metaznacznikach części nagłówkowej dokumentu HTML. Zatem mechanizm wyszukujący, który rozpoczyna analizę strony WWW od tych słów, szybciej ją odszuka w zasobach Sieci. Musimy pamiętać, że jeżeli użyjemy podczas wyszukiwania zbyt ogólnych wyrażeń, to otrzymamy tysiące nieprzydatnych odpowiedzi. W części wyszukiwarek jest jednak na to sposób. Za pomocą opcji Szukaj wśród otrzymanych wyników możemy zawęzić poszukiwania. Wpisujemy do okienka wyszukiwarki dodatkowe zapytanie. Po kliknięciu przycisku Szukaj zostaną przejrzane tylko wcześniej znalezione strony i spośród nich wybrane te najbardziej trafne. Takim mechanizmem dysponuje m.in. polski Infoseek. Im większej liczby słów użyjemy w pytaniu, tym dokładniejszą uzyskamy odpowiedź. Zalecane jest używanie wyrażeń złożonych z 6-7 słów w jednym zapytaniu. Główne poszukiwane słowo (lub temat) umieszczamy na początku zapytania. Wtedy podczas poszukiwań zostaną uwzględnione wszystkie słowa, przy czym wyrazy wpisane jako pierwsze będą miały najwyższy priorytet ważności i dokumenty je zawierające zostaną wyświetlone na początkowych pozycjach. Gdy chcemy, aby wyszukiwane będą wyrazy pisane zarówno małymi, jak i dużymi literami. Jeśli wpiszemy wyrazy dużymi literami, odnajdziemy wyłącznie dokumenty HTML z tak właśnie napisanym danym słowem. Wyszukiwarki potrafią odnajdować nie tylko słowa czy wyrażenia, ale też całe zdania. Aby takie zdanie odnaleźć, należy je wpisać w okienku wyszukiwarki ujęte w cudzysłów. Wyszukiwarka w odpowiedzi wyświetli strony zawierające w całości podane zdanie. W trakcie poszukiwać warto stosować strukturę hierarchiczną. Prowadzimy poszukiwania od najbardziej ogólnego sformułowania, coraz bardziej zawężając krąg poszukiwań za pomocą kolejnych słów kluczowych (od znaczenia najbardziej ogólnego do szczegółowego). Jeżeli wpisujemy w okienku wyszukiwarki kilka wyrażeń, to stosowane w zapytaniu pojęcia należy oddzielać okrągłymi nawiasami. Dzięki temu mechanizm wyszukujący odszuka strony zawierające wszystkie te wyrażenia i w dalszej kolejności poda strony zawierające każde z tych wyrażeń. Aby przyspieszyć i uszczegółowić wyszukiwania, warto wykorzystywać frazy, czyli słowa kluczowe umieszczać wewnątrz cudzysłowu. Wtedy odnalezione strony będą zawierały wszystkie te wyrazy. Warto stosować zaawansowane metody wyszukiwania, wykorzystując operatory logiczne: AND, OR, NOT, NEAR i AND NOT (patrz ramka). Powinno to spowodować wyświetlanie wyników, które będą dokładną odpowiedzią na wpisane zapytanie. Niestety, użycie zbyt dużej liczby słów w takich połączeniach powoduje dosyć często, że wyszukiwarki informują, iż nie ma dostępnej strony spełniającej takie kryteria. Dlatego przy korzystaniu z operatorów najlepiej ograniczyć się do stosowania nie więcej niż 3-4 słów kluczowych. Jeżeli szukamy konkretnego wyrażenia, to dobrze jest stosować synonimy połączone operatorem OR, co wielokrotnie zwiększa szansę wyświetlenia trafnych stron. Zamiast wpisywać pełne słowa można wpisać tylko ich fragment, uzupełniając symbolem tzw. wild cart - jest to oznaczenie zastępujące więcej niż jeden znak w słowie. Najczęściej stosowana jest gwiazdka “”. Po wpisaniu np. “auto” wyświetlone zostaną strony zawierające słowa rozpoczynające się od ciągu liter “auto” (m.in. autorytet, autostrada, autorski itd.).

Do zawężania kryteriów wyszukiwania stosujmy znaki plus “+” i minus “-”. Znak plus wymusza obecność wyrazu stojącego za nim w danym dokumencie HTML, a minus nakazuje, aby wyrazu tego nie było. Pomiędzy słowem kluczowym i znakiem plus/minus nie wolno wstawiać spacji. Większość obecnych wyszukiwarek umożliwia wybranie formatu dokumentu, jaki chcemy odnaleźć. Może to być np. dokument HTML, ale też plik tekstowy (TXT, DOC) czy plik w formacie PDF. Jeżeli chcemy zawęzić poszukiwania, to po wpisaniu słów kluczowych należy zaznaczyć odpowiednią opcję, umieszczoną zazwyczaj poniżej okienka wyszukiwarki. Przy poszukiwaniu grafiki czy multimediów lepiej jest korzystać ze specjalizowanych wyszukiwarek. Oferują one specjalne opcje poszukiwania plików o rozszerzeniach charakterystycznych dla danych plików audio, wideo, animacji czy plików graficznych. Są one bardziej skuteczne, ponadto wraz z odnośnikiem do strony zawierającej poszukiwane dane wyświetlają często ich rozmiary i inne parametry je charakteryzujące. Przedstawiliśmy jedynie ogólne zasady, które powinny być stosowane podczas korzystania z wyszukiwarek internetowych. Aby zwiększyć skuteczność wyszukiwania, zawsze powinno się przeczytać plik pomocy umieszczony przy każdej wyszukiwarce, przedstawiający najskuteczniejsze i specyficzne dla danego mechanizmu opcje wyszukiwania. Niestety, gwałtowny wzrost liczby serwisów WWW, z pewnością ciekawych, ale nie spełniających różnego typu warunków, pozwalających na dotarcie do nich i skatalogowanie przez roboty nawet najlepszych wyszukiwarek powodują, że za pomocą tradycyjnych internetowych wyszukiwarek i katalogów internetowych możemy przeszukać zaledwie ok. 35% zasobów Sieci. Ale jest na to rada! Możemy skorzystać z metawyszukiwarek, np. Metacrawler ( www.metacrawler.com - korzysta z najważniejszych wyszukiwarek internetowych, odrzuca powtarzające się wyniki, pozwala na szukanie dokumentów, plików audio, aukcji, informacji w grupach dyskusyjnych), Chubba ( http://chubba.whatuseek.com - przeszukuje Internet , Usenet, katalogi i encyklopedie, czy Copernic 2001 ( www.copernic.com ). Ich podstawową zaletą jest to, że do swych poszukiwań wykorzystują kompleksowo wiele sieciowych wyszukiwarek i katalogów. Przykładowo, po zainstalowaniu i uruchomieniu programu Copernic 2001 wystarczy, że wpiszemy w jego okienku wyszukiwawczym słowa kluczowe i uaktywnimy proces wyszukiwania, a po chwili otrzymamy wyniki oferowane przez takie internetowe mechanizmy wyszukujące, jak AltaVista, FAST Search, HotBot, Lycos, MSN Search i Yahoo!