O surgimento dos arquivos está associado ao aparecimento da escrita. Estes nasceram de forma espontânea no seio das Antigas Civilizações do Médio Oriente.Ao longo da história os arquivos conheceram diferentes suportes, desde as placas de argila aos DVD’S, passando pelo papiro, papel, etc.Apesar de os primeiros arquivos terem sido encontrados no seio das Civilizações Pré-Clássicas, é no mundo Greco-Romano que estes ganham maior importância, devido desenvolvimento da Administração.Na idade média o conceito de arquivo tornou-se vulgar com o desenvolvimento dos arquivos da Administração e das Cortes da europa.No século XVI começaram a surgir manuais com uma concepção jurídica da realidade Arquivística.A Revolução Francesa representou um marco importante na história dos arquivos, uma vez que foi permitido pela primeira vez o livre acesso do cidadão comum aos arquivos. Também foi nesta altura que o Arquivo Central do Estado passou a ser considerado como Arquivo da Nação.No século XIX a arquivística ganhou uma elevada importância, passando a ser considerada como uma disciplina auxiliar da história. Também neste século foi editado o Manual dos Arquivos Holandeses.No século XX (1950) surgiu o Conselho Internacional de Arquivos (CIA), com o objectivo de coordenar a Arquivística a nivel internacional. Durante este século também se assistiu ao reforço do papel do profissionais de arquivo, surgindo as primeiras associações de arquivistas (BAD 1973).A partir dos anos 90 e até aos dias de hoje, a grande preocupação da Arquivística centrou-se na importância da informática como meio de gerir novos documentos.A Gestão da Informação contribuiu para que a arquivística adoptasse novas técnicas de trabalho.Em Portugal os arquivos não foram designados sempre da mesma forma: Nos primeiros tempos da monarquia eram conhecidos por carteiras ou cartórios que eram os locais onde se guardavam as cartas, títulos, escritas, bulas pontifícias e outros documentos de vital importância para o reino, posteriormente denominados pelo nome de Tombos.O Arquivo Real Português, fundado por D. Fernando I, ficou conhecido por Torre do Tombo por ter sido instalado numa torre nas muralhas do forte onde vivia o referido monarca.
Vantagens e Desvantagens da Digitalização
VANTAGENS:
- Consulta Rápida
Ao contrario do que acontece com a microfilmagem, na digitalização a pesquisa não é feita de forma sequencial, o que a torna bastante mais rápida.
- Redução de espaço
Depois de digitalizados, alguns originais podem ser destruídos, o que leva a uma redução do espaço de arquivo.
- Geralmente podem ser integradas na aplicação da organização
Por norma, e se planeado no inicio do projecto, as imagens digitalizadas podem ser integradas nas aplicações das entidades.
- A informação pode ser transferida para qualquer local da empresa ou do mundo (rede/internet)
Com o avanço da tecnologia, os documentos digitalizados podem ser acedidos em tempo real, a partir de qualquer lugar.
- Pode ser consultado simultaneamente por várias pessoas
Depois de digitalizados, os documentos podem ser colocados em rede e acedidos por várias pessoas ao mesmo tempo, desde que tenham permissão para tal.
DESVANTAGENS:
- Meios de suporte (discos…) tornam-se vulneráveis com o passar do tempo
Mesmo tendo os cuidados recomendados, com o tempo os suportes onde são guardadas as imagens vão sofrendo desgaste. Para evitar isto recomenda-se a sua substituição regular.
- Avanço da tecnologia
Com o avanço da tecnologia nada nos garante que daqui a alguns anos as imagens digitalizadas hoje possam ser vistas nos sistemas da altura. Convém que a substituição dos suportes acompanhe o avanço da tecnologia.
- Não tem valor legal
Na maior parte dos casos, a digitalização ainda não tem valor legal, não podendo os documentos originais ser destruídos.
OCR e ICR
OCR (Optical Character Recognition)
O Reconhecimento Ótico de Carateres, ou OCR ("Optical Character Recognition") engloba um conjunto de técnicas e procedimentos usados para efectuar a extracção de informação presente num documento digitalizado. O objectivo é fazer a correspondência entre os caracteres digitalizados e a sua classe simbólica. Trata-se portanto da transformação de material legível por humanos numa forma susceptível de ser processada por meios computacionais. A necessidade de recorrer a OCR reside no formato em que os computadores tipicamente armazenam informação gráfica digitalizada, da qual não é trivial extrair dados textuais. O OCR baseia-se sobretudo em tecnologias e métodos desenvolvidos através de investigação em
processamento de imagem e reconhecimento de padrões.
Aplicações dos resultados de processos de OCR incluem a manipulação por computador de material impresso, o arquivamento digital de documentos, a pesquisa de texto e o processamento automatizado de impressos e formulários.
ICR (Inteligent Character Recognition)
A grande diferença dos programas de OCR, é que possuem além das características dos OCR, a faculdade de aprender, ou seja, caso não consigam fazer a substituição da imagem captada por caracteres, perguntam de que caracteres se trata, armazenado essa informação para posterior utilização.
Regra geral, conseguem fazer a interpretação dos caracteres manuscritos.
Digitalização_Indexação
Depois de digitalizado o documento é necessário que se identifique a imagem digitalizada e se classifique antes de ser armazenada.
A indexação é um dos processos cruciais dentro de um processo de Gestão Documental já que é através desta, que se vai decidir onde se armazena cada uma das imagens, e também com que nome e quais as características associadas que deverão ser armazenadas.
A indexação em grande escala consiste em associar a imagem a um registo numa base de dados que guarde informação acerca do mesmo. O processo de indexação pode realizar-se de duas formas:
- Automaticamente:
Através de software de Gestão Documental que permita reconhecer certos campos do documento (Um número, Um código de barras numa posição definidas), que nos sirvam de chave para corresponder ao respectivo campo dentro da base de dados. Este campo pode ser, uma data, um Nome, etc.
- Manualmente
Se o software de Gestão Documental não for capaz de realizar este tipo de operações, sem necessitar de efectuar uma indexação manual. No computador apresentar-se-á o documento digitalizado e o utilizador seleccionará os valores a correspondentes ao respectivo campo.
- Mista
Se o software de Gestão Documental for capaz de realizar este tipo de operações, mas pede a intervenção do utilizador para evitar problemas em documentos cuja indexação poderá resultar duvidosa. Este tipo de indexação é muito utilizada em sistemas onde se processam formulários com baixa qualidade e como tal é necessário em alguns casos a supervisão humana.
Digitalização_Equipamentos
Equipamentos
Um dos aspectos mais importantes a ter em conta quando se inicia um processo de digitalização, é a escolha do equipamento.
Existem no mercado vários tipos de scanner e a sua escolha deve ser adequada ao tipo de documentos a digitalizar e ter em conta alguns aspectos:
- Tamanho do Documento:
O scanner deve de ser capaz de poder tratar documentos do tipo especifico que se pretende capturar (Cartões de visita, A5, A4, A3) para assegurar de que nunca haverá problemas ao capturar um documento de tamanho diferente ao pretendido.
- Volume de Digitalização:
O scanner deve permitir digitalizar o volume de documentos que se pensa utilizar. Este volume pode ser um numero pequeno de documentos (dezenas) até um numero elevado (milhares) por dia.
Na maioria dos sistemas de GD será necessário considerar um dispositivo que possa tratar um certo volume num tempo razoável, para o qual será imprescindível que disponha de um Alimentador Automático de Documentos (ADF). Sempre que necessite digitalizar documentos especialmente frágeis, é possível fazê-lo através da utilização do Cristal (FlatBed).
- Resolução:
A unidade de medida de resolução são pontos por polegada (ppp ou dpi) Este parâmetro indica a qualidade no qual se digitaliza o documento. Este parâmetro depende do tipo de documento, e do processo ao qual vai ser submetido.
Normalmente num ambiente de empresa utilizam-se resoluções entre 200 a 400 ppp. Para digitalização somente de texto é suficiente uma resolução de 200 ppp, mas esta pode aumentar em função da qualidade do original, e do tamanho das letras incluídas no documento. Igualmente poderá aumentar se pretender digitalizar fotografias com grande detalhe para tratamento posterior.
Associada à resolução está a capacidade para digitalizar em tons de cinzentos. Os scanners deverão ser capazes de proporcionar uma gama de até 256 tons de cinzento.
- Cor:
Na maioria dos sistemas de GD o que realmente importa é o conteúdo gráfico e o texto do documento. Logo as cores não serão necessárias, e portanto os scanners específicos de cor não serão utilizados para processos documentais massivos. Contudo, é possível encontrar-se para volumes de trabalho relativamente baixos, scanners que para além de proporcionar os parâmetros adequados aos processos de GD oferecem a possibilidade de trabalhar em cor.
- Documentos Frente/Verso:
É cada vez mais frequente encontrar scanners que ofereçam esta possibilidade. Os documentos numa empresa são muito heterogéneos, podendo estar escritos de um só lado, ou escritos frente e Verso (Dúplex), e para serem lidos, existem duas opções, ou digitalizar primeiro um lado e depois o outro lado do Doc. ou utilizar um scanner dúplex que numa só passagem digitalize frente e Verso.
Depois de analisadas as características do espólio a tratar, é altura de escolher o equipamento que melhor se adequa.
Tipos de Scanners:
- Scanner de Tambor
O scanner de tambor utiliza a tecnologia de digitalização Photo-Multiplier Tube (PMT). Trata-se do tipo mais dispendioso de scanner, tanto no momento de aquisição como em custos de manutenção.
Os scanners de tambor são igualmente os mais complicados de usar, exigindo um tratamento cuidado do equipamento e da obra a digitalizar, necessariamente flexível, pois este equipamento só pode ser utilizado para determinados tipos de originais. Os originais são enrolados em torno de um tambor transparente que é de seguida colocado em rotação, enquanto os foto-multiplicadores captam a informação da imagem. O intenso manuseamento físico limita a gama de obras digitalizáveis neste tipo de scanner e a sua lentidão e
complexidade reduzem a sua produtividade. Portanto, apesar da boa qualidade, são dispositivos utilizados tipicamente apenas na indústria da imprensa ou em estabelecimentos especializados.
Scanner de Tambor Heidelberg
- Scanner de Mesa
Os scanners de mesa são os mais divulgados ao nível do consumidor comum.
Este tipo de equipamento assemelha-se a uma fotocopiadora, utilizando sensores Charge Coupled Devices (CCD). Estes são normalmente posicionados numa linha num mecanismo que percorre a obra a digitalizar, captando desta forma a imagem.
Os scanners baseados em CCD são consideravelmente mais baratos do que os scanners de tambor. Os avanços recentes na tecnologia permitem a scanners de mesa de gama alta obter mesmo uma qualidade de imagem comparável à de alguns scanners de tambor. Outras vantagens destes dispositivos são a sua fácil utilização, a rapidez de digitalização e a possibilidade de digitalizar obras mais sensíveis, que não poderiam ser sujeitas ao processo de digitalização por tambor.
Scanner de Mesa Epson
- Scanner de Transparências
Os scanners de transparências utilizam igualmente dispositivos CCDs, sendo nalguns aspectos bastante semelhantes aos scanners de mesa (aliás, alguns modelos de scanners de mesa possuem mesmo já adaptadores que os permitem usar também como equipamentos de digitalização de transparências ou filmes).
Sendo especialmente concebidos para digitalizar transparências, slides e/ou negativos, a área digitalizada é muito menor do que nos scanners de mesa típicos, o que deve permitir obter uma resolução elevada a um preço comparativamente acessível. Este facto, aliado a uma produtividade considerável, tornam estes scanners a solução ideal para projectos de digitalização de transparências ou slides sem recorrer a dispositivos mais dispendiosos.
Scanner de Negativos Canon
- Scanners Planetários
Os scanners planetários são dispositivos relativamente muito dispendiosos, baseando-se no uso de uma máquina fotográfica digital de muito alta resolução. O objecto a digitalizar é colocado num plano, aberto para cima, estando a câmara orientada para ele. É assim tirada uma fotografia, sempre a uma altura fixa, a qual é transferida então para um computador. Os scanners planetários são adequados para digitalizar periódicos ou livros com requisitos especiais de manuseio (valiosos, antigos ou frágeis).
Scanner Planetário Bookeye
- Scanners de Microfilme
Estes scanners digitalizam microfilmes de vários formatos, de forma automática ou manual.
Scanner Microfilme Kodak
Imagem Digital
As Imagens que observamos são compostas por cores e outros detalhes minuciosos.
Diz-se assim que o mundo real, é nesse aspecto, analógico. No entanto, a forma como esses detalhes são captados pelos nossos olhos e percebidos pelo nosso cérebro é mais limitada, condicionada às características físicas e fisiológicas do nosso organismo. Por exemplo: uma pessoa daltónica não consegue observar as imagens como uma pessoa que não é daltónica.
Tal como as pessoas, também as técnicas e dispositivos de reprodução ou captura de imagens possuem essas limitações de reprodução da realidade.
A pintura começou por ser a primeira técnica usada para esse fim, seguida da fotografia e do cinema.
A captura de uma imagem por um processo ou dispositivo técnico pode ser considerada eficaz se nos conseguir transmitir uma percepção próxima da realidade, mesmo que não consiga uma correspondência total da mesma.
Uma imagem digital é um registo de uma imagem real, feito através de uma determinada tecnologia e registado para que o resultado possa ser reproduzido por outra tecnologia associada.
Durante esta formação iremos abordar os fundamentos dessas técnicas e tecnologias de recolha, registo e reprodução de imagens digitais.
Categorias de Imagens
As imagens gráficas computorizadas enquadram-se em duas grandes categorias: Raster e Vetoriais.
- Imagens Raster (Bitmap Images)
Estas imagens são representadas através uma grelha de cores chamada pixels. A cada pixel é atribuída uma determinada localização e valor. Quando se trabalha em imagens raster, são alterados as localizações e valores e não os objectos ou formas.
Estas imagens são de resolução dependente, isto é, como são constituídas por um determinado número de pixeis, ao serem ampliadas, reduzidas ou impressas a uma resolução mais baixa, perdem qualidade.
Formatos de ficheiros usados para imagens Raster: BMP, EPS, GIF, JPEG, PDF, PICT, TIFF.
Tipos de Imagens Raster:
Imagens Line-arte – Contêm apenas duas cores, que normalmente são o preto e o branco.
Imagens GrayScale – Contêm várias gradações de cinzentos.
Imagens Multitónicas – Contêm gradações de duas ou mais cores.
Imagens a Cores – Contêm várias cores.
- Imagens Vetoriais (Vector Graphics)
Por sua vez, as imagens vetoriais são constituídas por linhas e curvas definidas matematicamente por objectos chamados vetores.
Assim, as imagens vetoriais são de resolução independente, o que significa que podem ser ampliadas, reduzidas ou impressas a uma resolução mais baixa, sem perderem qualidade.
Este tipo de imagem são a melhor opção para representar formas de cor cheia que têm de ser ampliadas ou reduzidas a dimensões diferentes – Ex. Logótipos
Formatos de ficheiros usados para imagens Vetoriais: EPS, PDF, PICT.
Imagem Vetorial
Linhas que a compõem
Concluindo:
Regra geral, as imagens digitalizadas são Raster, enquanto que desenhos feitos em aplicações são Vetoriais.
É possível converter imagens entre os dois tipos de dados.
Tamanho da Imagem:
A dimensão digital da imagem é representada pelo número de pontos total da mesma. Esta informação, associada à resolução, é relevante para quando a imagem é apresentada num ecrã ou impressa numa impressora, pois permite-nos ter a noção exacta da área do ecrã ou do papel que será ocupada pela imagem.
Resolução da Imagem:
A resolução é a capacidade de distinguir os detalhes espaciais finos.
Quanto maior a resolução, maior o tamanho, pois implica que para representar a informação de uma determinada área, utilizam-se mais pontos.
As várias formas de medir e representar este conceito variam de acordo com o dispositivo de saída usado para apresentar a imagem:
Formatos de Imagem Digital
De forma a serem utilizadas por outras aplicações, as imagens, uma vez digitalizadas, devem ter uma estrutura definida. (i.e.: o nome do arquivo, largura x altura, da esquerda e direita e de cima a abaixo e os bits que compõem a imagem). A cada uma das estruturas distintas que existem denominar-se-á como formato.
Existe uma diversidade de formatos de arquivo, no qual deverão ser reconhecidos como standards para que as aplicações de imagens possam comunicar entre elas. Cada arquivo tem uma estrutura. A mesma imagem com diferentes formatos pode ter diferentes tamanhos.
JPEG (Joint Photographic Experts Group)
Este formato não impõe nenhum limite no número de cores que usa. Quando se converte uma imagem para JPEG o que se obtém é normalmente um compromisso entre qualidade da imagem e compressão. Com o formato JPEG é possível ter-se imagens com pouca compressão e boa qualidade, ou com muita compressão e pouca qualidade, ou então ainda um resultado equilibrado entre as duas coisas.
A compressão de JPEG foi desenvolvida para imagens ricas em cor ou em escala de cinzentos, logo não suporta imagens binárias (preto e branco). As imagens a que o formato JPEG se adequa melhor são imagens que retratem cenas realísticas, não produzindo tão bons resultados em imagens de desenhos. Este formato também não suporta imagens animadas.
TIFF (Tagged Image File Format)
O formato TIFF é o formato de imagem ideal para cópias originais de armazenamento e preservação de imagem. É considerado uma norma de facto do mercado, tanto para imagem comercial como para imagem profissional. É também o formato de imagem com maior compatibilidade e suporte nas diversas plataformas, Macintosh, Microsoft Windows, Linux, etc.
GIF (Graphics Interchange Format)
O formato GIF foi desenvolvido pela CompuServe com o objectivo de facilitar a troca de imagens na Internet em 1987, quando as placas de vídeo eram geralmente de 8 bits (hoje é vulgar terem já 24 bits ou mais), sendo antecessor do JPEG. Este formato não guarda a resolução da imagem (em ppi), o que significa que a imagem tem de ser escalada sempre que é necessário imprimir. Para o ecrã e para a Web esta propriedade não é importante. A falta desta informação deve-se ao facto de que em 1987 serem raras as impressoras que imprimiam diretamente imagens, por isso esta informação era de facto pouco relevante. De qualquer forma o formato GIF representa uma excelente opção para gráficos. Imagens gráficas (como logotipos, caixas de diálogo) usam poucas cores. Uma imagem GIF de 16 cores resulta assim num ficheiro de imagem mais pequeno e com melhor qualidade que um JPEG.
PNG (Portable Network Graphics)
O formato PNG foi criado com o objectivo de substituir o formato GIF. Como foi desenhado para ser utilizado na Web, este formato tem três aspetos inovadores: Canal Alpha (transparência variável); Correcção Gamma (controlo do brilho da imagem, independentemente da plataforma); Entrelaçamento Bidimensional (um método progressivo de visualização). Para além destas propriedades, verifica-se ainda que na maioria dos casos a sua compressão é mais eficiente que a usada pelo formato GIF.
BMP (Windows Bitmap)
Este formato é usado pelos programas do windows.
PDF (Portable Document Format)
Os ficheiros PDF mostram e preservam os caracteres originais e os layouts das páginas em ambos os tipos de imagens (Raster e Vetorial). Estes ficheiros conseguem conter formas de pesquisa electrónica de informação e características de navegação, como os links. Podem conter várias imagens e páginas.
Digitalização_Introdução
A digitalização é um processo pelo qual a informação baseada em papel se transforma num formato que pode ser entendido pelo computador. O dispositivo que é capaz de realizar esta tarefa denomina-se Scanner.
O scanner para converter a imagem ótica em digital, utiliza um dispositivo electrónico denominado CCD (Charged Coupled Device).
Estes CCD`s são sensíveis a mudanças de luminosidade que provêm de um documento iluminado. Estas mudanças são produzidas pelo contraste entre o texto e a cor do fundo.
Nestas mudanças de luz os CCD`s convertem essas mudanças de luz, em sinais electrónicos que são processadas para poder obter a imagem ótica original, de forma que possa ser processada pelo computador.
Num CCD uma matriz de centenas de milhares de fotocélulas microscópicas dão origem a pixels captando a intensidade da luz de pequenas porções da imagem.. Se se tratar de capturar imagens a cores, são usados filtros sobre as fotocéluas de cor vermelho, verde e azul.
Os scanners normalmente usam três arrays lineraes de sensores cobertos de filtros vermelho, verde e azul.
Cada sensor contendo milhares de fotocélulas captura a imagem uma linha de cada vez. (há casos em que o sensor se move e outros em que o papel é que se move).
A quantidade de informação que transmitem os CCD`s depende da resolução com que se tenha digitalizado, da utilização ou não de tons de cinzento, e dos parâmetros da aplicação utilizada.
Subscribe to:
Posts (Atom)