Ana Isabel Correia, Sérgio Nunes

Neste artigo, Michael Lesk, compara a história da recuperação de informação (RI) com as fases da vida de uma pessoa. Admite que o sonho de Vannevar Bush poderá ser alcançado em apenas um ciclo de vida de 65 anos. Este ciclo, inicia-se em 1945 com o artigo de Bush - "As We May Think" e termina em 2010, no futuro, com a reforma. Por volta de 2015, segundo o autor, a maioria das tarefas de investigação serão feitas no ecrã e não no papel.
Lesk identifica, baseando-se na divisão feita por Shakespeare em 1599, 7 fases: infância, escolaridade, idade adulta, maturidade, crise de meia idade, realização e reforma.

A infância, compreendida entre 1945 e 1955, foi um período em que surgiram os primeiros sistemas, como por exemplo os índices KWIC. Foi também nesta época que se fizeram algumas experiências ao nível da maquinaria, a mais famosa foi o WRU Searching Selector.

A escolaridade, anos 60, correspondeu a tempos de experimentação e aprendizagem, foi uma época de forte crescimento para a recuperação de informação. Os avanços tecnológicos contribuíram bastante para este facto. Os grandes sistemas de informação remontam a essa época (Dialog, BRS). De entre os principais temas e conceitos avançados destacam-se: bases de dados, pesquisa em texto-livre, aparecimento dos 'thesauros', técnicas de avaliação (revocação e precisão), colecções para testes, 'relevance feedback', recuperação multilíngue e linguagem natural. Houve, no entanto, pouca aplicação prática.

Nos anos 70, identificados como idade adulta, o aparecimento de grandes quantidades de texto em 'formato máquina' e os sistemas de 'time-sharing' funcionaram como catalisadores para a utilização prática dos sistemas. Devido a promessas não concretizadas e à perda de importância dentro dos departamentos, houve um declínio na investigação. O progresso deu-se sobretudo na área da recuperação probabilística. Também nesta época, deu-se a separação entre a RI e a inteligência artificial, que procurou alargar o âmbito da investigação e focar aspectos mais fundamentais.

A maturidade veio nos anos 80 com cada vez mais informação disponível em 'formato máquina'. Deu-se uma dispersão da recuperação online pelo grande público, nomeadamente com os catálogos, revistas e jornais. Deu-se a popularização do CD-ROM, que encaixava perfeitamente com o modelo tradicional de publicação e distribuição de informação. Houve um enorme aumento das bases de dados online, quer em número, quer em variedade. A investigação reapareceu mas as técnicas desenvolvidas não eram utilizadas na indústria.

Por altura dos 45 anos, Lesk identifica uma crise de meia idade durante os anos 90. Nesta época, cada vez mais informação estava disponível online e acessível via algoritmos de pesquisa em texto integral. No entanto, esta era uma área que interessava quase unicamente a especialistas. Os esforços em disseminar o uso pela população em geral tinham tido pouco sucesso (BRS After Dark e Dialog Knowledge Index). Com a revolução da Internet, a informação passa a ser distribuída por qualquer pessoa e não apenas pelas grandes empresas comerciais, há uma proliferação das páginas pessoais. Lesk refere, em relação a este ponto, a visão de Bush em que cada pessoa organiza a sua informação pessoal e a troca com outros. A disponibilização de imagens, com o aparecimento do 'browser' e do 'scanner', abre um novo conjunto de possibilidades. Começam a aparecer jornais só disponíveis online. Os investigadores vêm a aplicação prática de muitas das técnicas desenvolvidas e dá-se um forte avanço na área da avaliação dos sistemas.

Para o início do século XXI, idade da realização, Lesk prevê que a maioria das questões poderão ser respondidas com acesso a material de referência online. Prevê a existência de 'empresas orientadoras' online que ajudarão os utilizadores a encontrar o que pretendem. Aponta como caminho para a investigação o desenvolvimento de técnicas de pesquisa baseadas em imagens, sons e vídeo. No entanto, alerta que será necessário um novo ciclo de redução de custos de armazenamento até atingirmos verdadeiras bibliotecas de vídeo digitalizado.

Finalmente, 65 anos após a publicação do artigo de Bush, a recuperação de informação atinge, segundo Lesk, a reforma. Este autor, prevê que por essa altura o trabalho de conversão para 'formato máquina' esteja praticamente terminado. Entre várias previsões Lesk é da opinião que a informação multimédia será de acesso tão fácil como o texto, que a sintetização de voz será o meio mais usado para acesso a conteúdos e destaca a internacionalização, devido à Internet, como factor importante a abordar.

Tentando contrabalançar a visão optimista do artigo, Lesk faz uma breve abordagem ao que pode correr mal neste cenário. Foca a questão das cópias ilegais, da qualidade da informação na Internet, do SPAM, dos direitos de autor e dos grupos de activistas que lutam contra a proliferação da tecnologia.

Conclui, num registo optimista, afirmando que tudo aponta para que o sonho de Bush se complete num único ciclo de vida, e que no futuro, num mar de informação, o papel do bibliotecário será o de navegar o barco e não o de fornecer a água.

Referências

Lesk, Michael - The Seven Ages of Information Retrieval, Conference for the 50th Anniversary of As We May Think, Cambridge, MA, Outubro 1995.
Bush, Vannevar - As We May Think, Atlantic Monthly 176:1 101-108 (1945).
Shakespeare, William - As You Like It, Act 2, Scene 7, 143-166. 1599.