O segredo de melhor aproveitar os mecanismos de busca
disponíveis na Internet é saber exatamente o que se quer procurar na rede por
Alceu Nader
Não acontece todos os dias, mas serão cada vez mais freqüentes situações em que você
terá apenas a Internet como solução para confirmar aquela informação que a diretoria
acabou de pedir "para ontem". Ou para ajudar o sobrinho no trabalho da escola.
O maior e mais completo banco de dados e notícias jamais criado pelo
homem está ao alcance de uma linha telefônica mas a empreitada tem lá os seus
riscos. Você poderá localizar tudo o que procura em minutos, encontrando o que precisa
entre mais de 55 milhões de endereços da Web, ou passar horas e horas diante do
computador sem conseguir coisa alguma, além de horas na conta do provedor, os olhos
vermelhos e uma incômoda sensação de incompetência e ignorância. Seu êxito ou
fracasso será determinado pela maneira como você vai empregar os chamados sites de
busca, os endereços que localizam informações na grande rede.
Novatos e experimentados navegadores recorrem a eles todos os dias. Por
isso mesmo, esses sites são campeões imbatíveis de audiência (ocupam quase a metade da
lista dos mais visitados) e produziram algumas das mais gloriosas histórias pessoais de
sucesso na curta e feérica existência da Internet. Alvo das gigantes da indústria de
software, de hardware e mídia, as empresas que conceberam e colocaram no ar mecanismos de
busca avançados são o exemplo acabado do novo gênero de negócio que a Web criou,
somando prestação de serviço, tecnologia e informação. O Yahoo, por exemplo, o site
de busca mais popular da rede, com cerca de 40 milhões de visitantes por mês, começou
como uma experiência de estudantes no início da Web, há menos de cinco anos, e hoje
vale 6 bilhões de dólares em Wall Street. Seu faturamento cresceu 300% nos dois últimos
anos e suas ações negociadas em bolsas valem hoje 23 mais vezes do que em 1996. O Yahoo,
acrônimo Yet Another Hierarchical Officious Oracle, opera em nove idiomas e está
instalado em 14 países.
Serão precisos alguns truques para não apenas aproveitar melhor o que
esses sites de busca têm a oferecer, como também saber como tornar seu site pessoal, ou
da empresa em que trabalha, mais facilmente localizável pelos serviços de busca da rede.
Rápido e preciso
A primeira coisa a fazer diante de uma pesquisa na rede é preparar-se
previamente para o trabalho, conhecer melhor o assunto, recolher informações e detalhes
que poderão serão preciosos durante a garimpagem. Se o material de referência for em
inglês, melhor. Se o seu inglês anda capenga, não se desespere. Outro dos grandes sites
de busca, o Altavista, tem um serviço de tradução instantânea que não é nenhuma
maravilha, mas quebra grandes galhos. A segunda providência: seja qual for o site de
busca de sua preferência, nunca, jamais, em tempo algum acione a busca municiando o site
com informações genéricas ou vagas. Leve sempre em conta que esses sites não podem ser
utilizados como quem folheia uma enciclopédia, onde tudo está em ordem alfabética. Na
rede, a informação é catalogada segundo os parâmetros de um novo índex geral do
conhecimento humano, onde o detalhe conta mais do que as classificações genéricas dos
assuntos.
Outra característica fundamental a ser considerada antes da busca, e que
também pode melhorar muito a qualidade das respostas obtidas, é a de que existem três
tipos de sites de busca (clique aqui para ver a lista de sites de
busca). São eles:
Ferramentas de busca, ou search engines, abastecida por
programas farejadores, os spiders ou crawlers, que varrem o enunciado e
o conteúdo de milhões de páginas automaticamente.
Catálogos, que trazem endereços capturados na rede e
posteriormente organizados por profissionais segundo áreas de interesse, mais ou menos
como nas páginas amarelas.
Sistema híbridos, que misturam essas tecnologias e métodos.
Conhecer essa diferença de estruturas pode ser vital, por exemplo, se a
informação que você precisa foi publicada recentemente. Neste caso, o êxito da
pesquisa será mais provável nas search engines do que nos catálogos. No caso
do Yahoo, que é um catálogo e não uma ferramenta de busca, a inclusão de uma nova
página ou site na rede pode demorar até quatro meses depois da inscrição e da
apresentação do conteúdo.
Resta, ainda, derrubar um dogma. Nem sempre os sites de busca que se
apresentam como os maiores ou com mais endereços catalogados são os mais aconselháveis
para uma pesquisa que pretenda ser rápida e precisa. Neste caso, dependendo o tema de
interesse, já existem vários sites de busca especializados por assunto (clique aqui para ver a relação), onde certamente a informação
desejada será encontrada com mais facilidade.
Letras minúsculas
Na busca propriamente dita, outro recomendação é jamais esquecer que,
apesar da boa impressão inicial, os softwares que caçam as informações nos sites de
busca são "burros" e levam exatamente tudo ao pé da letra. Mais: a lógica que
eles empregam para nos obedecer não é a mesma que a nossa. Os bancos de dados seguem a
lógica booleana, nome tirado de seu inventor, o matemático britânico George Boole
(1815-1864), que considera apenas dois estados de informação o falso e o
verdadeiro e que é também a base do idioma compreendido pelos circuitos
elétricos. Assim, se você digitar AND entre uma palavra e outra, a ferramenta de busca
vai trazer de volta apenas as páginas que contenham exatamente a combinação das duas
palavras. Já a inclusão do NOT entre as palavras pesquisadas excluirá outras
associações entre essas palavras. A utilização do OR, por fim, fará com que o
resultado da pesquisa considere que você procura os registros de uma das palavras que
você digitou "ou" a outra, independente de qualquer associação que se possa
fazer entre elas.
Complicou? Para clarear, vamos então partir para um exemplo clássico.
Digamos que você queira localizar sites com informações sobre CD com músicas. Se você
cravar apenas CD, receberá uma montanha de resultados tendo, depois, de reiniciar nova
pesquisa a partir dos resultados. Pior: o "CD" que você escreveu também será
interpretado como CD-ROM ou até mesmo Certificados de Depósito. Para evitar esse tipo de
entulho e limitar a pesquisa sobre CD com música, a saída seria escrever CD AND
music, ou CD NOT ROM ou ainda CD NOT money CD NOT invest.
Outros truques úteis podem ajudar ainda mais. Como, por exemplo, cercar
com aspas a frase que você escreveu para a busca. Elas vão fazer com que a ferramenta de
busca localize exatamente o que está escrito. Outro: na dúvida, escreva sempre a sua
pesquisa em letras minúsculas. Agindo assim, a ferramenta irá fazer trazer resultados
que consideram letras minúsculas e maiúsculas. Se você escrever tudo com letras
maiúsculas, somente as ocorrências encontradas com letra maiúscula serão trazidas no
resultado da busca. Você pode ainda ressaltar ou diminuir a importância de determinadas
palavras na sua busca. Para ter certeza que aquela palavra, nome de pessoa ou empresa
fará parte do resultado da busca, insira o símbolo de mais (+) antes da palavra; no
sentido contrário, se você pretender que determinada palavra, nome de pessoa ou empresa
seja excluída da pesquisa, escreva o símbolo do menos (-) antes da palavra.
TREZE OPÇÕES
Por ordem alfabética, os principais sites de busca e suas
características.
Altavista (http://www.altavista.digital.com)
ferramenta de busca, pertencente à Digital Equipment, recentemente adquirida pela
Compaq. Oferece possibilidade de busca em 25 idiomas, inclusive o português. Traz
serviço de tradução simultânea e serviço secundário de busca por endereços
eletrônicos de pessoas residentes nos Estados Unidos. E-mail gratuito.
Boorkmarks (www.bookmarks.com.br)
Nacional. Anuncia ter 600 mil páginas cadastradas em seu catálogo, entre as quais muitas
produzidas por universidades brasileiras. Não oferece o serviço de refinamento de busca.
Cadê (http://www.cade.com.br) O
mais tradicional catálogo de sites brasileiro. Divide suas áreas de pesquisa em 16
tópicos. Oferece quatro possibilidades de busca, entre elas a "busca
inteligente", que traz também o que for encontrado em seus registros com grafia
semelhante.
Excite (http://www.excite.com) É o
segundo maior serviço de busca, atrás somente do Yahoo. Busca endereços em oito países
diferentes. Oferece opção de busca as áreas especializadas e traz serviço noticioso
das agências Reuters e UPI. Serviço gratuito de clipping de notícias.
HotBot (http://www.hotbot.com)
Campeão de qualidade nos testes feitos por revistas especializadas. Pertence à revista
Wired. Oferece filtros para precisar a busca por categoria, palavra, endereço, data e
local onde o site procurado está instalado. Traz seção especial para localização de
órgãos de informação.
Infoseek (http://www.infoseek.com)
Abre para quatro grandes campos gerais de pesquisa Web, Notícias, Empresas e
Grupos de Discussão. Traz noticiário diário sobre economia e esportes nos Estados
Unidos. Recomenda os melhores sites de cada área de interesse. Localiza endereços de
pessoas residentes nos Estados Unidos. Oferece opção de busca em 19 países, entre os
quais o Brasil. Versão em português.
Lycos (http://www.lycos.com) Abre
com 14 possibilidades de busca desde receitas culinárias a notícias distribuídas pela
agência Reuters. Traz classificação dos "Top 5%", o mais antigo sistema de
classificação dos melhores sites da rede, em 18 categorias de assuntos. Busca
informações específicas de 11 países, entre os quais o Brasil não consta.
Onde ir (http://www.ondeir.com.br/)
Nacional. Vem com vinte tópicos diferentes para busca. Como exemplo de sua eficiência, a
chave "notícias" traz a maioria de páginas pessoais de jornalistas e media
watchers; apenas um grande serviço noticioso na relação dos 30 veículos apresentados.
Radar Uol (http://www.radaruol.com.br/)
Maior e mais sofisticado site de busca brasileiro. Anuncia mais de 110 milhões de
páginas catalogadas em seu banco de dados. Permite seleção de busca por região, tal
qual seu modelo mais aproximado, o HotBot. É o site de busca mais consultado do Brasil:
2,5 milhões de pesquisas por mês. Pode ser comparado aos melhores sites de busca do
mundo.
Surf (http://www.surf.com.br)
Nacional. Organiza a busca em 24 áreas de pesquisa, com pesquisas simples e avançadas.
Mantido pela provedora de acesso Dialdata.
Webcrawler (http://www.webcrawler.com)
Um dos pioneiros da rede. Primeiro foi adquirido pelo maior provedor de acesso à
Internet dos Estados Unidos, o AOL, e depois pelo concorrente Excite. Traz notícias do
dia.
Yahoo (http://www.yahoo.com) O site
de busca mais requisitado. Busca informação específica em 16 países, sem o Brasil na
lista, e em dezesseis cidades dos Estados Unidos. Oferece e-mail grátis, notícias do dia
das agências Reuters, Associated Press e de uma longa lista de publicações
especializadas. Abre também para boletins meteorológicos em qualquer cidade do mundo,
inclusive as brasileiras, para os próximos quatro dias da data da consulta.
Zeek (http://zeek.com.br) Nacional.
Ex- www.achei.net. Oferece cinco canais com classificados, notícias e seleção dos
melhores sites. É o mais novo dos sites de busca nacionais. Anuncia ter 50 mil páginas e
25 mil endereços eletrônicos cadastrados. No serviço de notícias reproduz reportagens
das revistas da Ziff-Davis, a editoria de revistas de informática mais importante do
mundo. Oferece a possibilidade de receber o serviço no correio-eletrônico.
|
DIRETO AO PONTO
Alguns sites de busca especializados em um único assunto.
NOTÍCIAS |
Northern (http://www.northernlight.com)
Excelente ferramenta para quem busca principalmente notícias na Web. Na seção
"Special Collection", busca informações de 4.500 jornais, revistas, livros,
bancos de dados e serviços de informação eletrônica. A busca é gratuita, mas o preço
para ter acesso à informação na íntegra varia de 1 dólar 4 dólares. Oferece serviço
de busca sob medida para clientes, ao preço de 4,50 dólares por mês.
|
ECOLA |
Ecola (http://www.ecola.com)
Dedicado à localização de notícias. Anuncia links para mais de 6.100 fontes de
informação de todo o mundo. Possibilita a localização dos órgãos de informação por
tipo ou localização geográfica. Ainda traz poucas referências ao Brasil. No começo de
setembro, apresentava apenas três jornais nacionais.
|
INSTITUIÇÕES
AMERICANAS |
The Great American Web Site
(http://www.slu.edu/departments/english/research/page1.html) Pequeno
catálogo (mas o maior no gênero) com todos os endereços dos órgãos do governo
norte-americano, dos poderes Executivo, Judiciário e Legislativo. Traz também a lista
dos órgãos independentes, como NASA, CIA, Correios etc.
|
CINEMA |
Internet Movie Data Base (http://www.imdb.com/search)
Site mais completo e imbatível para a localização de filmes, biografias, elencos
de filmes e o que mais se pretender localizar sobre cinema. Tem três servidores na
Austrália, Inglaterra e nos Estados Unidos, onde está montado o maior banco de dados.
Tem área especial para o Brasil na área de "Países com mais de 500 filmes" em
15 possibilidades de busca, da "lista completa" dos filmes nacionais até os
filmes estrangeiros rodados no Brasil.
|
CINEMACHINE |
(http://www.cinemachine.com) Também para
cinéfilos. Abre seção para as últimas notícias da indústria, lançamentos e fofocas
de Hollywood.
|
DIREITO |
LawCrawler - (http://www.lawcrawler.com) Busca
informação legal e jurisprudência. Abre para consulta em português de páginas
brasileiras. Traz a chancela da AltaVista Digital nos farejadores empregados na busca.
Oferece ainda endereço eletrônico gratuito com seunome@JusticeMail.com
|
LOCALIZADORES
DE PESSOAS |
Big Foot (http://www.bigfoot.com) Traz os
endereços de pessoas com grafia semelhante ou aproximada ao solicitado. Maioria dos
resultados é de pessoas residentes nos Estados Unidos ou associadas a sites que oferecem
e-mails grátis. Quando não encontra o nome grafado, traz lista com nomes de grafia
semelhante.
|
WHO WHERE? |
(http://www.whowhere.lycos.com) Adquirido
recentemente pela Lycos, uma ferramenta de busca pioneira na Internet. No modo
"avançado" permite a inclusão de mais detalhes sobre a pessoa que se deseja
encontrar na rede. É lento. |
|