Por que o Google (e outros...) mostra somente 1000 resultados? Alguém pode responder está questão para mim? Tecnicamente, eu percebi num experimento prático no ::buscas.com que existe um "longo processo" ao tentar localizar uma palavra-chave em um campo texto por completo em estruturas de bancos de dados complexos (acima de 5 milhões de registros, por exemplo). Isto significa, quando a palavra-chave está no começo do campo indexado (i.e. LINK em LINKING), é fácil e rápido encontrá-la, mas quando essa mesma palavra-chave é uma string parcial numa palavra grande (i.e. LINK em FIRSTLINKMEDIA), como uma palavra combinada (ou string mesclada), ela toma tempo para ser localizada. Em virtude disso [e outros motivos "desconhecidos"], a maioria dos mais populares sistemas de mecanismos de buscas [Live Search, Yahoo, Dogpile além do Google], limitam as buscas do usuário para alguns milhares de resultados, mesmo se você verificar um banco de dados que traga alguns milhões de registros válidos. Talvez os usuários não querem esperar mais que alguns milisegundos... muito tempo (???). Sobre isso, se eu recebo 52.700.000 resultados para a palavra-chave "Brazil" (o nome de meu país em Inglês), mas eu "apenas" posso ver o resumo dos "primeiros" 1000 links (99 páginas), por que os outros 52.699.000 precisam existir?
É realmente verdade dizer: há muita informação armazenada nos bancos de dados [i.e. pelo lado da máquina], mas humanos são responsáveis por criar "filtros" ou "índices" para decidir quais registros serão "visíveis". Seria este o lado do Page Rank? Agradeça ao Larry e ao Sergey. |