26 julho 2006

A biblioteca universal ao alcance do mouse

Por Kevin Kelly
em EntreLivros
julho 2006

Em vários escritórios desconhecidos em todo o mundo, milhares de trabalhadores estão usando scanners para inserir livros empoeirados em arquivos de alta tecnologia. Eles estão reunindo, página por página, a biblioteca universal.

O sonho é antigo: reunir em um único lugar todo o conhecimento, passado e presente. Todos os livros, documentos e ferramentas conceituais, em todas as línguas. A esperança é bem conhecida, pois há muito tempo tivemos, por um breve período, tal biblioteca. A grande biblioteca de Alexandria, construída em torno de 300 a.C., pretendia conter todos os pergaminhos que circulavam no mundo conhecido. Em certo momento, dispôs de meio milhão de pergaminhos, algo em torno de 30% a 70% de todos os livros então conhecidos.

Mas mesmo antes dessa biblioteca ser perdida, já havia passado o momento em que todo o conhecimento podia ser abrigado em um único edifício. Desde então, a constante expansão da informação ultrapassou nossa capacidade de reuni-la. Até agora. Quando o Google anunciou, em dezembro de 2004, que digitalizaria, por scanner, os livros das cinco maiores bibliotecas dos Estados Unidos, tornando disponível o conteúdo para pesquisa, ressurgiu a promessa de uma biblioteca universal. De fato, o tremendo desenvolvimento da rede mundial de computadores, que há uma década era quase um nada, nos encorajou a acreditar novamente no impossível. Estará realmente ao nosso alcance a sonhada biblioteca de todo o conhecimento?

Os livros digitais não faziam muito sentido há pouco tempo, até que surgiram os serviços de busca como Google, Yahoo, Ask e MSN. Quando milhões de livros forem digitalizados e os textos ficarem disponíveis em um único banco de dados, a tecnologia de busca permitirá o acesso e a leitura de qualquer livro escrito. Será uma biblioteca realmente grande e seremos capazes de acessá-la a partir de qualquer aparelho que tenha uma tela. Dos tabletes sumérios até hoje, os humanos "publicaram" pelo menos 32 milhões de livros, 750 milhões de artigos e ensaios, 25 milhões de canções, 500 milhões de imagens, 500 mil filmes, 3 milhões de vídeos e programas de TV e 100 bilhões de páginas da internet.

Todo esse material está atualmente nas bibliotecas e arquivos de todo o mundo. Uma vez digitalizado, tudo isso poderá ser condensado (de acordo com os atuais recursos tecnológicos) em discos rígidos de 50 petabytes [que equivalhe a 52,4 milhões de gigabytes]. Seria preciso hoje um edifício do tamano de uma biblioteca municipal para abrigar 50 petabytes. Com a tecnologia do futuro, tudo caberá em um iPod.

Em virtude da questão dos direitos autorais e do fato físico da necessidade de virar as páginas, a digitalização dos livros tem sido lenta. Na melhor das hipóteses, um livro a cada 20 passou para a forma digital. Até agora, a biblioteca universal não tem muitos itens. Mas a situação está mudando rapidamente. Corporações e bibliotecas em todo o mundo estão agora digitalizando quase um milhão de livros por ano. A Amazon digitalizou centenas de milhares de obras contemporâneas. No coração do Silicon Valley, a Stanford University (uma das cinco bibliotecas que colaboram com o Google) está digitalizando seu acervo, de 8 milhões de livros, usando um robô da companhia suíça 4DigitalBooks. Essa pequena máquina vira automaticamente as páginas de cada livro conforme passa pelo scanner, na taxa de mil páginas por hora. Um funcionário coloca o livro em um suporte plano e o robô folheia as páginas, delicadamente para não danificar os volumes raros, sob os olhos de scanner das câmeras digitais.

Bill McCoy, gerente geral de negócios editoriais da Adobe, comenta: "Alguns de nós temos milhares de livros em casa, podemos ir a belas e bem equipadas livrarias e fazer compras na Amazon.com. O efeito mais dramático das bibliotecas digitais não será sobre esses poucos felizardos, mas sobre as bilhões de pessoas cujo acesso aos livros é difícil". As vidas desses sem-livros- estudantes do Mali, cientistas do Cazaquistão, idosos do Peru - será transformada quando uma versão simples da biblioteca universal for colocada em suas mãos.

Transformar letras impressas em pontos eletrônicos que podem ser lidos em uma tela é o primeiro passo essencial. A verdadeira mágica ocorrerá no segundo ato, quando cada palavra em cada livro for cruzada em links, reunida em grupos, citada, indexada, analisada, anotada e inserida na cultura de forma muito mais profunda do que antes. No novo mundo dos livros, cada bit remete a outro, cada página a todas as outras. Nos últimos anos, centenas de milhares de amadores escreveram e elaboraram referências cruzadas para uma enciclopédia online, a Wikipedia. Animados por esse êxito, muitos acreditam que um bilhão de leitores poderá percorrer as páginas de velhos livros, um hyperlink por vez.

Os que apreciam um tema especial, um autor ou livro específico poderão, com o tempo, fazer links nas partes que consideram importantes. Multiplique esse ato por milhões de leitores e a biblioteca universal estará plenamente integrada. Por exemplo, em um livro de não-ficção, será possível clicar num item de bibliografia ou numa nota de rodapé e acessar o livro citado.

Há cerca de 100 bilhões de páginas na web e cada uma tem, em média, dez links. Atravessando a rede há assim um trilhão de conexões e sua força está justamente nesse emaranhado de relações. O mundo estático dos livros será transformado pelo mesmo incremento de relações, já que cada página se abrirá para outras páginas de outros livros: a leitura se tornará então uma atividade comunitária. Marcadores de páginas serão compartilhados com outros leitores e bibliografias trocadas. Você saberá que um amigo anotou um de seus livros favoritos e, logo depois, os links dele serão seus. De forma curiosa, a biblioteca universal se tornará um único e enorme texto, um livro mundial.

Cerca de 15% dos 32 milhões de livros catalogados estão em domínio público e disponíveis para que qualquer um se aproprie, publique ou copie. Quase todo o trabalho de digitalização realizado pelas bibliotecas americanas envolve esses 15%. Aproximadamente 10% de todos os livros em catálogo serão logo escaneados. A Amazon dispõe de pelos menos 4 milhões de livros, incluindo várias edições do mesmo título. Recentemente, várias grandes editoras americanas manifestaram disposição para passar seu catálogo ao mundo digital e estão trabalhando em parceria com o Google: este escaneará os livros e oferecerá, de acordo com o editor, páginas de amostra aos leitores.

Entretanto, o maior problema para as grandes editoras é que elas não sabem ao certo o que realmente possuem. Se você quiser se divertir, pegue um livro fora de catálogo em uma biblioteca e tente determinar quem detém os direitos. Não é tarefa fácil, pois não há nenhuma lista de direitos autorais das obras. A Biblioteca do Congresso [a maior do mundo, com 130 milhões de itens] não tem um catálogo a esse respeito. As editoras não possuem uma lista exaustiva, embora digam que estejam trabalhando para isso. Quanto mais antiga e obscura a obra, menor a probabilidade do editor (caso ainda exista) ser capaz de dizer se o autor ainda está vivo, se os direitos cabem a este ou se foram vendidos, se o editor ainda detém os direitos de impressão ou se pretende reeditar ou escanear o livro. Isso deixa 75% dos textos conhecidos na obscuridade. O limbo legal que cerca essas obras impede que sejam digitalizadas.

Ninguém conseguiu desatar esse nó, até que em 2004 o Google propôs uma solução inteligente. Além de escanear os 15% dos livros em domínio público e fora de catálogo e os 10% dos livros em catálogo, os gerentes do Google declararam que também digitalizariam os 75% de livros que ninguém queria tocar. Afirmaram ainda que reproduziriam o texto inteiro, permitindo que este fosse indexado pelos computadores do Google e acessado por qualquer um. Mas a empresa mostraria aos leitores apenas trechos selecionados a cada vez. Os advogados do Google argumentaram que os trechos oferecidos seriam algo como uma citação em uma resenha e, assim, seu uso seria legal.

O plano da empresa era digitalizar o texto integral dos mais de 10 milhões de títulos que fazem parte do acervo de Stanford, Harvard, Oxford, Universidade de Michigan e Biblioteca Pública de Nova York. Cada livro seria indexado e mostrado de diferentes maneiras nos resultados de uma busca. Para os livros fora de catálogo, o Google mostraria a obra inteira, página por página e, em relação aos que estão em catálogo, a empresa trabalharia com as editoras, que decidiriam quais partes seriam exibidas. Para os livros órfãos, o Google daria acesso apenas a trechos. Qualquer detentor de direitos autorais (autor ou empresa) que provasse a propriedade de um suposto livro órfão poderia solicitar ao Google que retirasse, por qualquer motivo, os trechos. Para muitos autores, essa campanha foi uma salvação: se os poucos escritores consagrados temem a pirataria, a maioria receia a obscuridade. A possibilidade de que as obras sejam encontradas no mesmo mecanismo de busca que todas as outras foi uma boa notícia para os autores e a indústria que precisavam de alento.

Certos autores e várias editoras avaliaram que o plano do Google não era benéfico. Dois pontos os incomodavam: a cópia virtual do livro que estivesse na indexação do servidor e o pressuposto de que a empresa poderia escanear primeiro e perguntar depois. Quando a negociação por fim fracassou, a corporação dos autores e cinco grandes editoras processaram a empresa. O argumento era simples: por que o Google não dividiria os lucros (caso houvesse) com os detentores dos direitos autorais? E por que o Google não solicitaria permissão ao detentor legal dos direitos antes de digitalizar?

A disputa judicial promete ser longa. Jane Friedman, da editora HarperCollins, que apóia o processo contra o Google (embora permaneça sendo sua parceira), declarou: "Não espero que a disputa seja resolvida enquanto eu estiver viva". Ela está certa. Os tribunais poderão discutir para sempre essa complexa questão.

Mas não importa, pois a tecnologia resolverá a controvérsia antes. Fábricas de scanner chinesas, que operam por conta própria, e regras mais frouxas de propriedade intelectual manterão a digitalização dos livros. Quando a tecnologia se tornar melhor, mais rápida e mais barata, os usuários poderão fazer o que já fazem com a música, digitalizando suas próprias bibliotecas.

Em breve um livro fora da biblioteca digital será como uma página da web fora da web, pedindo ar para respirar. De fato, a única forma do livro preservar sua pálida autoridade em nossa cultura é inserir seus textos na biblioteca universal.

Na disputa entre as convenções do livro e as exigências da tela, esta última prevalecerá. Na tela, hoje visível a um bilhão de pessoas na Terra, a tecnologia de busca transformará os livros isolados na biblioteca universal do conhecimento humano.


ACERVOS BRASILEIROS NA REDE

A discussão internacional sobre a digitalização de acervos também envolve as bibliotecas brasileiras. Em evento recente com representantes de bibliotecas de vários países, realizado no Rio de Janeiro, o presidente da Biblioteca Nacional (BN), Muniz Sodré, revelou que recebeu uma oferta do próprio Google para digitalizar 2 milhões de itens, num investimento de US$ 10 milhões. Na ocasião, Sodré se mostrou reticente à oferta, dizendo ser preciso "analisar bem as implicações políticas dessa doação".

Com ou sem Google, o processo de digitalização e colocação do acervo na internet já ocorre na BN desde 2001. Considerada pela UNESCO a sétima biblioteca nacional do mundo e a maior da América Latina, a BN conta, hoje, com cerca de 9 milhões de itens em seu acervo. Desse total, 3 mil itens foram digitalizados (sendo que o termo item inclui livros com mais de 500 imagens).
Tudo o que passou pelo scanner foi para o site da instituição. Há uma coleção de mapas dos séculos XVI ao XVIII, obras raras como a Bíblia de Mogúncia (o incunábulo mais antigo do acervo), a primeira edição de Os Lusíadas ou a Arte da grammatica da lingoa mais usada na costa do Brasil, de 1595, de José de Anchieta, e outros volumes da Real Biblioteca Portuguesa, trazidos pela família real ao Brasil em 1808.

Se no início as obras eram digitalizadas por empresas terceirizadas, hoje a BN já conta com um laboratório e uma equipe de profissionais especializada. "Já temos auto-suficiência para montar o acervo digital", diz Angela Monteiro Bettencourt, coordenadora de Informação Bibliográfica da instituição. Segundo ela, a biblioteca digitaliza seu acervo de acordo com projetos. "Atualmente, estamos trabalhando na coleção de fotografias Tereza Cristina [que pertenceu ao imperador dom Pedro II, seu marido]." Vale dizer que projeto também significa patrocínio e aporte financeiro, tornando o processo viável.

Outro aspecto levado em conta quando se pretende investir na digitalização, é a preservação. Quanto antes uma obra rara for para a internet, menos o original precisará ser manuseado. Por esse motivo, um dos critérios para definir que obras serão digitalizadas é justamente a procura. Quanto mais for solicitada, mais rápido vai pro scanner. Obras que serão restauradas também são digitalizadas. A ressalva é que apenas obras em domínio público passam para o suporte digital e vão para internet, por causa dos direitos autorais. "Em compensação, continuamos microfilmando todo o acervo, que faz parte de nossa metodologia de preservação", diz Angela. Sobre os arquivos digitais, só o tempo dirá o quanto eles perduram e com qual qualidade.


CONTRAPARDIA EUROPÉIA

Em janeiro de 2005, o presidente da Biblioteca Nacional da França, Jean-Noël Jeanneney, publicou um artigo no Le Monde com o título: "Quando o Google desafia a Europa" - que sairia em livro três meses depois, pela Éditions de Minuit. No texto, anuncia "o risco de uma dominação esmagadora da América na definição da idéia que as próximas gerações farão sobre o mundo".

Exageros à parte, a reação européia começaria a ser esboçada em maio de 2005, quando França, Alemanha, Itália, Espanha, Hungria e Polônia assinaram um acordo para criar uma Biblioteca Digital Européia, colocando numa mesma rede os projetos de digitalização de acervos das bibliotecas nacionais de cada um dos países. Em março deste ano, a Comissão Européia anunciou seu apoio ao programa e recomendou que ele seja iniciado imediatamente.

Enquanto a empresa californiana previu a digitalização de 15 milhões de volumes em seis anos (a contar do final de 2004), a biblioteca virtual européia foi mais modesta: prometeu escanear 6 milhões de livros em cinco anos.

Paralelamente, além da biblioteca européia e do Google, outros projetos de digitalização de grande porte foram anunciados. O consórcio Open Content Alliance (OCA), que reúne empresas de serviços de internet e informática, como a californiana Yahoo, realizou o aporte de 2 milhões de dólares para escanear 150 mil livros da Universidade da Califórnia. Já a Microsoft, em parceria com a British Library, apresentou o projeto de digitalização de 25 milhões de páginas (aproximadamente 100 mil livros) da biblioteca, com um custo total de 2,5 milhões de dólares.