Restauração digital de documentos históricos

Uma das melhores maneiras de aprender sobre qualquer período histórico é conversando com as pessoas que o viveram.

Com informações de TechXplore.

Exemplos visuais de imagens coloridas de documentos: Imagem degradada de entrada (linha superior), imagem restaurada usando o método proposto (linha inferior). Crédito: Hanif et al., 2023, PLOS ONE, CC-BY 4.0 (creativecommons.org/licenses/by/4.0/)

Falar com pessoas do passado distante é muito unilateral, pois elas normalmente estão mortas e pararam de ouvir há muito tempo. No entanto, eles falam muito se você tiver paciência para ouvir, ou melhor, leia o que eles dizem em cartas, diários e post-its primitivos sem versos colantes.

Um grupo internacional de cientistas da computação da Itália, Reino Unido e Paquistão se uniram para ressuscitar os mortos de escritos que foram degradados pelo tempo, desenvolvendo um método assistido por computador para virtualmente devolver os documentos a uma condição mais legível e decifrável. Em seu trabalho de pesquisa, “Restauração e análise de conteúdo de manuscritos antigos por meio da segmentação baseada no espaço de cores”, publicado na revista PLOS ONE , a equipe detalha o método de sua técnica de restauração digital e os resultados experimentais.

Temos uma noção das civilizações antigas a partir de seus escritos, triviais e profundos. A escrita cuneiforme suméria em tabuletas de argila revela transações mercantis de 4.000 anos, cálculos geométricos e poesia detalhando a queda de uma grande cidade. Se tivessem sido escritos em papel e não em argila, provavelmente não os teríamos hoje.

Temos historiadores escrevendo sobre eventos antigos, pois eles próprios viviam no que hoje é a Grécia antiga. Temos cartas de soldados em todos os grandes conflitos dos últimos quatrocentos anos, uma história escrita da maioria dos eventos maiores ou menores desde a revolução industrial, e tudo isso em papel suscetível ao envelhecimento e à degradação.

Há um pequeno vazio no registro por volta do final dos anos 1980, quando as pessoas usavam disquetes para armazenar documentos importantes apenas para jogá-los fora alguns anos depois – felizmente, nada de importante aconteceu naqueles anos.

A leitura de documentos antigos ou antigos, mesmo quando em boas condições, pode exigir que o leitor mergulhe no papel de um criptologista decifrando mensagens codificadas. Não tanto porque o escritor procurou ser intencionalmente secreto com seus textos, mas porque combinações de alfabetização de um escritor, legibilidade da caligrafia, estilos de letras, ortografia obsoleta e convenções gramaticais ou abreviações ad-hoc para economizar espaço podem fazer até mesmo um idioma nativo parecer estranho.

Pegue o mesmo documento e reduza ainda mais sua legibilidade desbotando a tinta, ampliando as letras devido à exposição à umidade, sangrando ou transferindo pigmento de uma página para outra e confundindo as informações novamente, pode se tornar uma tarefa verdadeiramente assustadora.

Um aspecto do esforço atual que difere muito dos métodos anteriores é o uso da cor. A reconstrução digital típica converte um documento em texto preto em um fundo branco na tentativa de revelar o texto por meio de filtragem de ruído e aprimoramento de contraste. No método de cores atual, a imagem é muito mais um esforço de restauração, mantendo muito da aparência e sensação virtual do documento original.

Os pesquisadores aplicaram uma integração complexa de várias técnicas digitais de interpretação de cores e modelos de mistura gaussiana para identificar e separar recursos de texto, papel e artefatos. Isso permite a extração seletiva de diferentes camadas de informações com base em diferenças espectrais às vezes sutis. Assim, um usuário pode decidir se uma anotação rabiscada, decoração de página, carimbo, mancha de anel de caneca de café ou outro recurso é crítico para o entendimento, adicionando ou removendo camadas.

Em alguns casos, a técnica pode preservar características que de outra forma seriam perdidas, como as tênues marcas d’água de um fabricante de papel, que poderiam oferecer informações vitais aos historiadores. Por exemplo, as famosas obras de Leonardo da Vinci, que sobreviveram em condições notáveis ​​e não faziam parte do estudo atual, são escritas em páginas com marcas d’água de vários fornecedores de papel que permitiram aos historiadores de documentos agrupá-las em prováveis ​​grupos de períodos de escrita.

De acordo com o documento, o processamento pode ser realizado em um computador desktop padrão (core i5, 4 GB de RAM, Windows 10). O algoritmo leva apenas alguns minutos para restaurar virtualmente um documento para maior legibilidade. Esse nível de facilidade de uso o tornaria uma ótima ferramenta tanto para pesquisadores de documentos históricos quanto para pessoas que tentam decifrar antigas receitas de família.

Mais informações: Muhammad Hanif et al, Restoration and content analysis of ancient manuscripts via color space based segmentation, PLOS ONE (2023). DOI: 10.1371/journal.pone.0282142



Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Este site utiliza o Akismet para reduzir spam. Fica a saber como são processados os dados dos comentários.