Rozdział 10. Przeszukiwanie dokumentacji - system ht://Dig

ht://Dig jest systemem używanym do indeksowania i wyszukiwania informacji na stronach WWW (na danym serwerze, w domenie lub intranecie). Interfejs użytkownika przypomina popularne wyszukiwarki, takie jak Yahoo!, Google czy Infoseek: użytkownik ma możliwość wpisania słów, które następnie będą wyszukiwane (po naciśnięciu przycisku "Znajdź"). Zwracana jest pełna lista trafień.

System ht://Dig składa się z zestawu komend oraz bazy słów kluczowych. Komendy, m.in. htdig, htsearch, htstat, htmerge, służą do konfiguracji i monitorowania pracy systemu oraz spełniają funkcję skryptów CGI, uruchamianych prosto ze strony WWW. Te, które nie są skryptami CGI (np. htdig), wywołuje się z poziomu shella. Baza słów kluczowych jest z kolei zbiorem wszystkich słów w przeszukiwanej domenie wraz z miejscami ich wystąpienia. Przeszukiwanie bazy jest znacznie wydajniejsze niż byłoby każdorazowe przeszukiwanie całej dokumentacji.

Pakiety instalacyjne systemu ht://Dig są standardowo rozpowszechniane z każdą dystrybucją systemu RedHat. Najświeższa wersja systemu jest dostępna z http://www.htdig.org.

Plikiem konfiguracyjnym dla systemu ht://Dig jest /etc/htdig.conf. Wersja tego pliku, która jest dołączona do systemu (domyślna), może być wykorzystana do konfiguracji systemu bez żadnych zmian. Należy jednak sprawdzić, czy wartość zmiennej "start_url" w pliku to "http://localhost" i czy wartość "localhost" jest odpowiednio ustawione w /etc/hosts (z reguły wartość 127.0.0.1). Należy również sprawdzić czy działa demon httpd, np. poprzez przyłączenie się do serwera WWW: lynx http://localhost. Wyświetlona strona powinna być stroną główną przeszukiwanej dokumentacji, wraz z odnośnikami do wszystkich poddokumentów. Naturalnie, adresy podane jak wyżej mogą być zmienione, w naszym przypadku zamiast http://localhost ustawiono http://www.praterm.com.pl/howto.

Gdy serwer WWW działa tak, jak to opisano powyżej, należy wytworzyć bazę danych. Służy do tego polecenie: rundig (bez parametrów). Czas trwania procesu tworzenia bazy jest uzależniony od ilości przeszukiwanych informacji. W przypadku niniejszego HOWTO i dokumentacji do systemu SZARP całość trwa kilka sekund. Jeżeli informacje na stronie często się zmieniają, to należy ten proces przeprowadzać wielokrotnie, na przykład po każdej zmianie w dokumentacji, najlepiej automatycznie.

Kolejnym krokiem jest odpowiednia modyfikacja interfejsu ht://Dig. Wprawdzie całość interfejsu jest dostarczana wraz z systemem (znajduje się w katalogu /usr/share/htdig, wskazywanym domyślnie przez /var/www/html/htdig) i można się do niej odnieść poprzez adres http://localhost/htdig, lecz jest to interfejs przykładowy, który należy dopiero zintegrować z własną stroną. Poza tym jest to wersja angielska, więc w przypadku polskich stron powinien być przetłumaczony na polski. Interfejs składa się z kilku plików html o określonych nazwach, które są wyświetlane w odpowiednich momentach (np. gdy nie znaleziono żadnego wystąpienia danego słowa, wyświetlana jest zawartość pliku nomatch.html). W opisywanym tu systemie wyszukiwawczym dla dokumentacji SZARP-a skopiowano zawartość katalogu /usr/share/htdig i zmodyfikowano odpowiednie pliki. Następnie usunięto istniejący link /var/www/html/htdig i stworzono nowy, wskazujący na zmodyfikowany katalog z plikami ht://Dig, tak jak poniżej:

rm /var/www/html/htdig
ln -s /opt/szarp/resources/documentation/htdig /var/www/html/htdig
Strona, w której wywoływane jest przeszukiwanie domeny, została zintegrowana ze spisem treści dokumentacji SZARP-a. Od tej pory system ht://Dig powinien być w pełni sprawny.