Como escanear corretamente livros e afins (+ gerar arquivos digitais)

Question

Pessoal, eu criei esse t&oacute;pico para explicar como fa&ccedil;o tudo isso, por&eacute;m est&aacute; aberto a dicas de qualquer coisa relacionada, seja programa, equipamento, m&eacute;todo, ou mesmo obje&ccedil;&otilde;es aos coment&aacute;rios.

Primeiramente, devo explicar o que o t&iacute;tulo do t&oacute;pico quer dizer:

Como escanear corretamente

Muita gente acha que escanear &eacute; que nem tirar c&oacute;pia (xerox), &eacute; s&oacute; tascar a fonte original (livro, revista, folha de documento) em qualquer equipamento, gerar o scan, e beleza, t&aacute; tudo pronto. N&atilde;o &eacute; assim, deve ser levado em conta o equipamento que est&aacute; escaneando a fonte, o programa que est&aacute; fazendo isso, e mesmo a maneira COMO voc&ecirc; est&aacute; escaneando essa fonte.

Talvez isso explique o porqu&ecirc; (especialmente no Brasil) haja uma escassez enorme de material escaneado, ou mesmo por que ainda encontramos por a&iacute; muito material pessimamente escaneado.

Livros e afins

O enfoque do t&oacute;pico &eacute; no escaneamento de livros mas tamb&eacute;m servir&aacute; para outros tipos de fontes, por&eacute;m fica a advert&ecirc;ncia que n&atilde;o escaneei ainda nenhuma revista, e s&oacute; lidei com 2 livros at&eacute; agora.

+ gerar arquivos digitais

N&atilde;o basta escanear, voc&ecirc; precisa saber como criar da maneira mais adequada um arquivo que possa ser lido seja no computador, seja num tablet espec&iacute;fico. Esse procedimento &eacute; o mais demorado de todos, mas n&atilde;o &eacute; de forma alguma complicado (nenhum deles &eacute;).

Vou tentar ser o mais minucioso poss&iacute;vel pra que n&atilde;o reste nenhuma d&uacute;vida a respeito.

******************************************************************
******************************************************************
******************************************************************
******************************************************************

Primeiro: a escolha do scanner

A resolu&ccedil;&atilde;o &eacute; o aspecto mais relevante na escolha de um scanner, porque quanto maior a mesma, melhor a fidelidade (qualidade, precis&atilde;o) com que o aparelho ir&aacute; capturar imagens (afinal, n&atilde;o estamos lidando apenas com texto, existem livros com ilustra&ccedil;&otilde;es e voc&ecirc; pode querer escanear suas fotos pessoais tamb&eacute;m).

Os scanners de documentos do mercado tem at&eacute; 600 DPI (pontos por polegada) de resolu&ccedil;&atilde;o &oacute;ptica. Em termos de custo-benef&iacute;cio, eu optei pela multifuncional (impressora + scanner) da Epson, XP-204, que tem resolu&ccedil;&atilde;o de 1200x2400 se n&atilde;o me engano. Quando vou escanear ele permite fazer com at&eacute; 1200 DPI, por&eacute;m o arquivo final fica GIGANTE (exigindo um PC atual pra abrir sem problemas).

Procure por um scanner que apresente uma resolu&ccedil;&atilde;o de pelo menos 600 x 1.200 DPI. Esse que citei custou entre 200-300 reais na &eacute;poca.

A escolha n&atilde;o &eacute; um problema, pois a maioria dos scanners nessa faixa de pre&ccedil;o tem uma resolu&ccedil;&atilde;o adequada.

- Devo comprar um scanner de m&atilde;o?

N&atilde;o. Seguem os motivos, e o uso adequado desse equipamento:

- O scanner de m&atilde;o custa at&eacute; mais caro que o de mesa, em alguns casos passando dos R$ 300;

- Voc&ecirc; precisa ter habilidade em passar o scanner em cima do papel, pois se n&atilde;o passar em cima dele todo, a imagem ficar&aacute; cortada, ou ainda torta, obrigando a escanear DE NOVO.

At&eacute; d&aacute; pra escanear, mas em 90% dos casos voc&ecirc; n&atilde;o consegue escanear 100% (de cima at&eacute; embaixo), &eacute; na tentativa-e-muitos-erros. E n&atilde;o digo erro porque sua m&atilde;o tremeu, e sim erro de n&atilde;o capturar toda a informa&ccedil;&atilde;o contida no papel.

Isso seria aceit&aacute;vel se eu fosse escanear uma folha, mas fatal se o objetivo fosse escanear um livro de 400 p&aacute;ginas.

- N&atilde;o pode ver como ficar&aacute; o resultado final. Tem como ver na hora se voc&ecirc; ligar na USB de um computador. A&iacute;, ap&oacute;s passar o scanner, com um programa do fabricante, ele mostra a imagem gerada. Do contr&aacute;rio, ele salva num cart&atilde;o de mem&oacute;ria, que voc&ecirc; precisa tirar dele e ligar no PC pra ver as fotos.

- Pelo menos o modelo que comprei usa pilhas palito. E por relatos que li, essas gastam relativamente r&aacute;pido.

- A qualidade eu achei inferior &agrave; do scanner de mesa, apesar de permitir escanear em resolu&ccedil;&atilde;o parecida.

- O mesmo problema do scanner de mesa pra escanear livros colados. Eu comprei um de m&atilde;o achando que resolveria isso. Vou explicar essa quest&atilde;o dos livros mais na frente.

- O uso ideal do scanner de m&atilde;o &eacute; pra escanear algum documento na rua, apenas se voc&ecirc; n&atilde;o puder levar pra casa e colocar no SEU SCANNER DE MESA.

&Eacute; essa a &uacute;nica utilidade (ou finalidade) dele. N&atilde;o servir&aacute; para fazer um scan definitivo de qualquer coisa.

Serve pra por exemplo, se voc&ecirc; &eacute; um advogado e precisa escanear a folha de um processo que n&atilde;o vai levar pra casa.

******************************************************************
******************************************************************
******************************************************************
******************************************************************

Segundo: a prepara&ccedil;&atilde;o do material para ser escaneado

At&eacute; o momento eu escaneei apenas dois livros colados.

Livro com capa dura &eacute; isso:

Os dois livros que analisei est&atilde;o em portugu&ecirc;s e s&atilde;o novos. Ambos tem em torno de 300-400 p&aacute;ginas. E a capa/contracapa &eacute; da mesma grossura do resto.

O que &eacute; livro colado? Exatamente isso: colado, e n&atilde;o grampeado, como uma revista. Veja na foto:

Repare que ele n&atilde;o dobra no meio das p&aacute;ginas, porque tem cola. Se fosse grampeado, como uma revista, dobraria na metade das p&aacute;ginas (ex: a revista tem 100 p&aacute;ginas, os grampos ficariam na p&aacute;gina 50.

REGRA DE OURO: Todo livro, sem exce&ccedil;&atilde;o, precisa ser descolado antes de ser escaneado.

Por que isso? Simples: se voc&ecirc; tentar escanear um livro COLADO, n&atilde;o vai conseguir fazer isso direito, porque quando colocar no vidro do scanner, a p&aacute;gina n&atilde;o ir&aacute; ficar RENTE nele (ir&aacute; levantar) e a imagem ficar&aacute; borrada, desfocada, sem nitidez.

Em algum lugar do scan, a imagem ficar&aacute; assim, e pelo que observei, isso acontece justamente no CANTO ou ainda na parte mais baixa dela. Isso ir&aacute; impedir a cria&ccedil;&atilde;o de um arquivo DIGITAL com o livro escaneado, ou no m&iacute;nimo dificultar ao extremo.

Al&eacute;m do resultado final ficar sem fidelidade, ruim. Ou seja: ser&aacute; como se voc&ecirc; escaneasse de qualquer jeito. Talvez isso funcione com livros contendo apenas texto e mais nada. Ou ainda aqueles livros que n&atilde;o tem o tamanho de uma folha A4.

Mas quando um scan cont&eacute;m textos, formata&ccedil;&otilde;es espec&iacute;ficas e ilustra&ccedil;&otilde;es, n&atilde;o.

N&Atilde;O MESMO.

Pense o seguinte: quando vai fazer uma tomografia computadorizada, voc&ecirc; precisa ficar im&oacute;vel e deitado no equipamento. Quando vai escanear da maneira mais correta, &eacute; a mesma coisa.

Precisa escanear folha por folha, e n&atilde;o um amontoado de folhas, uma sobre a outra.

A SOLU&Ccedil;&Atilde;O: ENCADERNAR

Volto a frisar que s&oacute; fiz isso com dois livros e ambos n&atilde;o eram capa-dura. Ao mandar encadernar, gastei aqui R$ 5 por livro. O resultado ficou assim:

Dessa forma, foi poss&iacute;vel dobrar p&aacute;gina por p&aacute;gina e escanear cada uma, sem problema, no vidro do scanner.

O furo &eacute; feito no canto da p&aacute;gina e a espiral inserida, de forma que se o livro n&atilde;o cont&eacute;m informa&ccedil;&atilde;o alguma l&aacute; no cantinho, melhor ainda, mas se cont&eacute;m &oacute;bvio que o furinho ser&aacute; no meio dela.

Exemplo de furo em cima do conte&uacute;do do livro, apesar de ser no canto (clique no link para ver):

http://i.imgur.com/CjdAdOK.jpg

Exemplo de p&aacute;gina que n&atilde;o utiliza os cantos e que furando, n&atilde;o tem problema algum (clique no link para ver):

http://i.imgur.com/fOpBIvS.jpg

S&oacute; que tem um por&eacute;m - embora assim seja poss&iacute;vel escanear e preservar o livro (a menos que algu&eacute;m saiba como descolar tudo e depois de escanear, mandar encadernar), tamb&eacute;m tive o mesmo problema dele levantar e desfocar alguma &aacute;rea da p&aacute;gina.

Isso porque a espiral tamb&eacute;m prejudica o scan, obrigando voc&ecirc; a escanear de novo em alguns casos. Isso eu notei num livro de quase 400 p&aacute;ginas, mas n&atilde;o observei em outro de 300 onde a espiral ficou pequena.

Logo, o procedimento mais adequado seria:

1) Mandar encadernar, furando o livro todo no canto;

2) Levar tudo solto pra casa. Escanear folha por folha;

3) Levar de novo na gr&aacute;fica, todas as folhas juntas, pra passar a espiral.

E n&atilde;o furar, passar a espiral, e depois escanear.

Entenderam? Eu farei isso da pr&oacute;xima vez.

******************************************************************
******************************************************************
******************************************************************
******************************************************************

Terceiro: escaneando

REGRA DE OURO: Use sempre 600 DPI, mesmo que a fonte que voc&ecirc; pretenda escanear contenha apenas texto.

IMPORTANTE: Eu testei em 300 DPI um livro contendo apenas texto, por&eacute;m n&atilde;o prestou para seguir o &uacute;ltimo passo desse guia (OCR), acusando que a fonte estava muito pequena. Por isso, nunca escaneie qualquer material em resolu&ccedil;&atilde;o inferior a 600 DPI (mais que isso n&atilde;o &eacute; necess&aacute;rio pelo que verifiquei - a menos que voc&ecirc; queira escanear fotos pessoais).

Apenas texto (exemplo):

Texto e imagem eu j&aacute; postei l&aacute; em cima dois exemplos. O tempo que levou pra escanear em 600 DPI aqui foi de uns 2 minutos por p&aacute;gina.

A solu&ccedil;&atilde;o mais &oacute;bvia seria usar o programa que vem com o scanner e mandar escanear. Por&eacute;m, al&eacute;m de escanear, voc&ecirc; precisa editar o resultado final, pois a imagem pode ser gerada de cabe&ccedil;a pra baixo e voc&ecirc; precisa cortar os 4 cantos dela.

A SOLU&Ccedil;&Atilde;O: USAR O ADOBE PHOTOSHOP PARA AS DUAS COISAS

A vers&atilde;o que uso &eacute; a CS6 num Windows 8-32 bit, e meu PC &eacute; um Core Quad 9450 com 3 GB de RAM. N&atilde;o sei quanto a outras m&aacute;quinas e outras vers&otilde;es desse programa. Um motivo pra utilizar o mesmo, al&eacute;m da edi&ccedil;&atilde;o, foi que o programa que vinha com meu scanner n&atilde;o permitia configurar uma resolu&ccedil;&atilde;o mais alta (na &eacute;poca eu usava 1200 DPI pra fotos pessoais).

Como escanear com ele: com o Photoshop aberto v&aacute; em: Arquivo/Importar e clique no modelo de seu Scanner.

Abrir&aacute; a tela de digitaliza&ccedil;&atilde;o de seu Scanner.

Quando terminar de escanear, a fotografia abrir&aacute; dentro do Photoshop.

No meu caso, o Photoshop est&aacute; em ingl&ecirc;s. Eu vejo essa tela:

Menu File, Import, clico em WIA SUPPORT...

Nessa tela ele d&aacute; duas op&ccedil;&otilde;es: Open Acquired Image in Photoshop deve ficar marcada (abrir imagem escaneada no Photoshop). Devemos abrir, pois o objetivo &eacute; edit&aacute;-la.

A segunda deve ser desmarcada, pois ele ir&aacute; criar uma pasta com cada imagem escaneada no formato BMP e com cada uma gastando uns 100 MB. Limpe depois a pasta IMAGENS pois ele ir&aacute; criar c&oacute;pias de cada scan l&aacute;, gastando espa&ccedil;o do seu HD.

Clicando em Start, ele pergunta QUAL DISPOSITIVO VOC&Ecirc; QUER USAR? Clico no &iacute;cone do meu e depois em CONFIGURA&Ccedil;&Otilde;ES PERSONALIZADAS, coloco 600 DPI.

O ruim &eacute; que preciso colocar esse n&uacute;mero toda vez. Porque mesmo que voc&ecirc; coloque uma vez, na pr&oacute;xima ele mostrar&aacute; o n&uacute;mero padr&atilde;o que poder&aacute; ser diferente. Quer dizer, se eu for escanear 1000 vezes, preciso ir 1000 vezes em CONFIGURA&Ccedil;&Otilde;ES PERSONALIZADAS (resolu&ccedil;&atilde;o) e me certificar que est&aacute; em 600 DPI.

Depois de escanear, aparecer&aacute; no Photoshop o documento, e se estiver de cabe&ccedil;a pra baixo, v&aacute; em IMAGE - IMAGE ROTATION - 180 graus, pra girar. N&atilde;o precisa fazer isso se toda vez que for escanear, posicionar o papel do lado correto no vidro.

Outro ajuste que precisa ser feito &eacute; nos cantos da imagem, como falei. Digamos que eu queira pegar a imagem acima e recortar o AUTO TONE, removendo o resto.

No Photoshop, clique nesse &iacute;cone (ferramenta CROP):

Depois apenas clique e segure at&eacute; selecionar a &aacute;rea desejada.

Ao soltar, apenas aquela &aacute;rea ficar&aacute; selecionada.

D&ecirc; ENTER para recortar essa &aacute;rea e excluir o restante:

Bem simples. Como eu quero fazer isso nos cantos, digamos que eu tenha essa imagem:

Reparem que ali no canto esquerdo, d&aacute; pra ver os furos no papel. No canto direito, n&atilde;o d&aacute;.

Usando a ferramenta CROP, eu apenas ARRASTO a linha do canto da esquerda pra direita:

E agora fa&ccedil;o o qu&ecirc;? Dou ENTER, pra recortar.

Ficar&aacute; assim:

F&aacute;cil, n&atilde;o? S&oacute; precisa ser feito nos 4 cantos da imagem. Leva menos de 1 minuto pra isso.

Ap&oacute;s recortar, agora basta salvar a p&aacute;gina escaneada.

MENU ARQUIVO (ou FILE) - SALVAR COMO (OBS: Use salvar como (Save As no Photoshop em ingl&ecirc;s), e n&atilde;o Salvar/Save).

Escolha JPG.

Aqui basta dar OK, e pronto, arquivo salvo, p&aacute;gina escaneada. Eu deixo nessa configura&ccedil;&atilde;o de qualidade mesmo, fica a seu crit&eacute;rio, por&eacute;m n&atilde;o achei o resultado final ruim salvando em JPG e deixando na qualidade padr&atilde;o do Photoshop.

Em 600 DPI, o arquivo final seguindo esses passos fica em m&eacute;dia com 2 MB.

******************************************************************
******************************************************************
******************************************************************
******************************************************************

Quarto: como criar um arquivo digital a partir dos scans, com reconhecimento de caracteres.

REGRAS DE OURO: N&atilde;o tenha pressa em momento algum. Aqui todo cuidado &eacute; pouco. E mesmo ap&oacute;s gerar o arquivo digital, n&atilde;o se desfa&ccedil;a dos scans.

Depois que voc&ecirc; escanear todas as p&aacute;ginas do livro e salvar em JPG, deve mant&ecirc;-las em algum lugar, num backup de seguran&ccedil;a. Em momento algum apague esses arquivos, pois no futuro voc&ecirc; ou algu&eacute;m poder&aacute; precisar deles para fazer o mesmo procedimento ou mesmo para corrigir erros.

Eliminar os JPGs seria o mesmo que destruir os negativos de uma foto ou filme, que s&oacute; existe em formato editado. Seria como se eu apagasse um cantor (a pessoa) e ficasse apenas com uma grava&ccedil;&atilde;o de um show ou CD dele. A c&oacute;pia n&atilde;o &eacute; mais importante que o original.

Dica:

1) Compacte todas as imagens em um arquivo. Recomendo usar o WinRAR pra isso:
http://www.baixaki.com.br/download/winrar.htm

2) Renomeie a extens&atilde;o do arquivo de .RAR para .EXE. Ou se preferir, use a op&ccedil;&atilde;o de criar arquivo auto-execut&aacute;vel no pr&oacute;prio WinRAR. Arquivos auto-execut&aacute;veis s&atilde;o compactados, mas com extens&atilde;o EXE. Motivo: o Internet Archive n&atilde;o aceita RAR/ZIP, mas aceita EXE.

3) Crie um cadastro (&eacute; gratuito) no Internet Archive:

http://www.archive.org

4) Envie o arquivo para l&aacute;. Ser&aacute; seu backup de seguran&ccedil;a.

Sobre a cria&ccedil;&atilde;o de um arquivo digital - voc&ecirc; precisa do programa ABBYY FineReader pra isso. Ele atualmente est&aacute; na vers&atilde;o 11. Tenha sempre a &uacute;ltima vers&atilde;o para evitar problemas.

COMO CONFIGURAR CORRETAMENTE O ABBYY FINEREADER

A primeira coisa que voc&ecirc; deve fazer &eacute; deixar o ABBYY configurado direitinho pra que n&atilde;o precise mexer novamente. O objetivo &eacute; gerar um arquivo PDF de cada JPG que voc&ecirc; escaneou. E no meu caso, foi um livro com texto e ilustra&ccedil;&otilde;es.

Deixe marcado assim:

Em configura&ccedil;&otilde;es da imagem, clique em PERSONALIZAR, e deixe assim:

Voc&ecirc; deve tamb&eacute;m (ainda em op&ccedil;&otilde;es - Avan&ccedil;ado - Idioma da interface) - selecionar como idioma o PORTUGU&Ecirc;S-BRASIL. Ou l&aacute; em cima:

Se o livro for em portugu&ecirc;s.

Em hip&oacute;tese alguma deixe essa configura&ccedil;&atilde;o em AUTOM&Aacute;TICO.

COMO LIDAR COM CADA P&Aacute;GINA ESCANEADA

Feito tudo isso, mande abrir um JPG que voc&ecirc; escaneou. Digamos que meu livro tenha 400 p&aacute;ginas, e eu estou agora mexendo com a p&aacute;gina 41.

A p&aacute;gina 41 &eacute; essa, clique no link para ver (&eacute; a minha original):

http://i.imgur.com/ZmJWWSo.jpg

E &eacute; assim que o ABBYY reconhece a mesma:

http://i.imgur.com/w3wmpPW.jpg

Qual &eacute; o objetivo aqui? Simples, gerar um PDF em texto, pesquis&aacute;vel, onde eu n&atilde;o tenha apenas uma imagem, e sim texto, imagem, tudo bonitinho, e com tamanho bem menor que os 2 MB do arquivo original.

No final, eu terei as 400 p&aacute;ginas com um tamanho razo&aacute;vel, e vou poder ler tudo isso num tablet (como o iPAD) ou PC.

Eu consegui escanear um livro com umas 300 p&aacute;ginas e gastei ao todo 50 MB. Essas mesmas 300 p&aacute;ginas em JPG (600 DPI) consumiram 720 MB. E o melhor de tudo &eacute; que o PDF ficou perfeito, sem erros, sem problema algum na leitura, e igualzinho ao livro original. Preservei as imagens, e apenas dei um retoque nas fontes.

Como eu come&ccedil;o a ajustar essa p&aacute;gina 41?

Primeiro de tudo, aqui nessa &aacute;rea o programa est&aacute; com dificuldades de reconhecer o texto, nessas partes azuladas:

Voc&ecirc; deve olhar pro scan da esquerda e ver o que precisa ser ajustado:

Reparem que essa &aacute;rea do livro foi escaneada sem borrar, mas mesmo assim o ABBYY n&atilde;o leu 100%. Vejam como ficou minha corre&ccedil;&atilde;o:

Apliquei os espa&ccedil;os onde precisava e corrigi o Sic&iacute;lia que saiu incorreto ali.

Voc&ecirc;s lembram que eu comentei que todo livro precisa ser descolado, ficar RENTE no vidro do scanner, retinho, sem levantar?

Vejam a&iacute; um exemplo de canto de imagem desfocada:

E como o ABBYY leu essa parte:

Entenderam agora por que &eacute; fundamental que todo livro seja descolado? Nesse caso a&iacute; eu escaneei encadernado, mas com a ESPIRAL j&aacute; colocada. Da pr&oacute;xima vez, eu vou escanear primeiro, e colocar a espiral depois. Entenderam por que isso precisa ser feito? Pra que se economize muito tempo corrigindo textos assim.

Beleza, mas &eacute; s&oacute; isso que a gente precisa fazer no ABBYY?

Infelizmente n&atilde;o. Outros ajustes precisam ser feitos, e isso EM CADA P&Aacute;GINA. Se fosse apenas revisar texto, seria rapidinho.

Outra explica&ccedil;&atilde;o: reparem na imagem da esquerda:

E nessa que ser&aacute; o arquivo gerado:

A da esquerda est&aacute; selecionando a figura, em vermelho, e em verde, a &aacute;rea de reconhecimento.

Essa imagem tem cr&eacute;ditos em texto, por isso o ABBYY fez o seguinte: reconheceu o mapa, e os cr&eacute;ditos ele transformou em texto.

Mas e se eu quiser ao inv&eacute;s de um mapa com texto do lado, ser uma figura s&oacute;?

Simples: clique em cima da &aacute;rea verde e pressione DELETE:

Repare que n&atilde;o est&aacute; aparecendo mais nada no arquivo final:

Agora, basta clicar na &aacute;rea vermelha e mover at&eacute; ENQUADRAR os cr&eacute;ditos tamb&eacute;m.

Vejam como ficou:

E do lado direito, como ser&aacute; o resultado final:

Simples, n&atilde;o? O que era texto nos cr&eacute;ditos da imagem virou agora imagem do mapa + cr&eacute;ditos. Eu pessoalmente prefiro uma imagem s&oacute; dos dois porque me poupa tempo de revisar os cr&eacute;ditos, at&eacute; pelo tamanho pequeno da fonte.

Outra coisa: o ABBYY tenta enquadrar imagens como essa do mapa, mas ele sempre deixa um peda&ccedil;o beeeeeem pequeno cortado. Por via das d&uacute;vidas, deixe uma sobra, como nesse exemplo aqui:

Reparem que eu deixei mais cinza de fundo nos quatro cantos desse mapa. Porque o ABBYY corta bem preciso, mas pode deixar algo de fora. E normalmente o ABBYY cortaria s&oacute; o mapa, deixando os cr&eacute;ditos do lado esquerdo de fora. Nada que um pequeno ajuste n&atilde;o resolva.

Pr&oacute;xima dica: REDUZIR O TAMANHO DA FONTE:

Se eu olhasse apenas pro lado esquerdo da tela, diria que o texto n&atilde;o est&aacute; se chocando com a figura:

Mas eu preciso olhar do lado direito pra saber como ser&aacute; o arquivo final. E repare que est&aacute; ocorrendo esse choque, sim:

Isso pode ocorrer com um texto de um lado e um do outro. A solu&ccedil;&atilde;o &eacute; simples, v&aacute; l&aacute; em cima e reduza o tamanho da fonte, ap&oacute;s selecionar o texto todo.

Nesse exemplo, a fonte &eacute; Book Antiqua 9,5. Eu coloquei 9. Vejam como ficou:

Ah, mas quando eu vou saber se &eacute; pra reduzir ou n&atilde;o? Simples, imagine que em 100% dos casos voc&ecirc; precisa reduzir.

S&oacute; que dentro da mesma p&aacute;gina, eu tenho um texto menor que o principal:

Esse eu n&atilde;o mexo. Ou se for mexer, eu diminuo 0,5 ponto na fonte dele, da mesma forma que fiz com o outro.

- MAIS DICAS:

P - Digamos que eu tenha uma figura de um mapa, e al&eacute;m de estar vermelha, ela tenha texto em verde (verde = &aacute;rea de reconhecimento) no meio dela. &Eacute; s&oacute; deletar os verdes e deixar o vermelho?

R- N&atilde;o, voc&ecirc; deve deletar os verdes e o vermelho. E depois desenhar a figura de novo.

Exemplo de mistura de verde-vermelho:

Vermelho = a imagem de fundo
Verde = imagem tamb&eacute;m, mas o programa acha que deve virar texto

O resultado final ficaria:

Basta clicar em cima do verde, e deletar. Mas tem que fazer isso no vermelho tamb&eacute;m, sen&atilde;o no resultado final, borra.

Do lado direito, n&atilde;o tenho nada...

Desenho de novo em vermelho aquela &aacute;rea:

E pronto.

Isso pode ocorrer em imagens que pare&ccedil;am ter texto.

Eu n&atilde;o acho indicado misturar imagem com texto. Se a imagem tem texto dentro dela, eu deixo ela inteira como imagem, e o texto apenas se estiver do lado de fora dela. Mesmo que seja um gr&aacute;fico com estat&iacute;sticas, eu prefiro deixar em imagem. Isso tamb&eacute;m poupa tempo na revis&atilde;o.

********

P - Como fa&ccedil;o pra mudar uma figura pra uma &aacute;rea de reconhecimento e vice-versa?

R - Apenas clique com o bot&atilde;o direito em cima dela e escolha a desejada em ALTERAR TIPO DE &Aacute;REA.

P - Como fa&ccedil;o pra editar e salvar v&aacute;rios arquivos ao mesmo tempo?

R - Ap&oacute;s abrir v&aacute;rios scans (JPGs), e terminar de editar/revisar, clique l&aacute; em cima em SALVAR:

E criar um arquivo separado para cada p&aacute;gina ou arquivo &uacute;nico.

***************

GERANDO O ARQUIVO FINAL

Aqui eu uso o ADOBE ACROBAT pra juntar todos os arquivos PDF criados pelo ABBYY FineReader. Abro o primeiro PDF, e...

Seleciono o segundo PDF, e especifico onde colocar ele.

E assim vai. Arquivo, Salvar como... e pronto.

Aqui vai um exemplo de 1 p&aacute;gina escaneada, e PDF gerado a partir dela:

JPG:
http://i.imgur.com/6BKYnbO.jpg

PDF:
https://www.dropbox.com/s/ap9ywmdk105s2f4/PAG30.pdf

Vejam que d&aacute; pra selecionar o texto todinho, e colar em outro lugar. Ou mesmo ao abrir esse PDF num tablet, pesquisar por palavras-chave dentro desse arquivo.

A qualidade final no tablet eu gostei. Uma outra vantagem de se usar o ABBYY e reconhecer os caracteres &eacute; que voc&ecirc; pode ampliar o texto do ebook ao m&aacute;ximo. J&aacute; com imagem, mesmo isso sendo poss&iacute;vel, depois de uma certa amplia&ccedil;&atilde;o, ela ficaria degradada.

No entanto, s&atilde;o poucos os ebooks (PDFs gerados a partir de scans) que tenham passado pela parada do OCR.

CONSIDERA&Ccedil;&Otilde;ES FINAIS

Quanto ao tempo pra fazer isso tudo, infelizmente &eacute; coisa de 1-2 semanas no m&iacute;nimo. Eu cheguei a fazer em 1 semana, mas correndo. O procedimento mais demorado &eacute; o &uacute;ltimo, por&eacute;m eu poderia ter economizado um bom tempo na hora de escanear se tivesse feito folha por folha sem ele estar encadernado primeiro.

Por ser um livro com ilustra&ccedil;&otilde;es e v&aacute;rias p&aacute;ginas, o tamanho final ficou 50 MB, um pouco grande, mas &oacute;bvio que ficaria beeeeeeem menor se a maioria das p&aacute;ginas tivessem apenas texto.

Eu n&atilde;o conhe&ccedil;o outros tablets, mas ler um livro no iPAD (fica a dica de reduzir o brilho dele, porque isso &eacute; que cansa a vista e desestimula a usar) &eacute; &oacute;timo. Infelizmente &eacute; pra pouco$$$$$$$, por&eacute;m compensa e muito se voc&ecirc; quer se livrar das vers&otilde;es ultrapassadas em papel de livros e outras coisas.

Por que se dar a todo esse trabalho se voc&ecirc; j&aacute; tem o livro? N&atilde;o apenas pela praticidade, mas como forma de preservar esse material da melhor maneira poss&iacute;vel.

Se voc&ecirc; quiser ter uma id&eacute;ia do que seja um livro mal escaneado, visite o INTERNET ARCHIVE (que j&aacute; mencionei l&aacute; em cima) e baixe qualquer livro de dom&iacute;nio p&uacute;blico que o site tenha. N&atilde;o precisa nem ter um tablet pra entender o que estou falando - abra um deles no seu PC mesmo.

E veja como s&atilde;o extremamente pesados, e lentos pra carregar cada p&aacute;gina. Quando a gente l&ecirc; um livro, virar a p&aacute;gina &eacute; algo instant&acirc;neo. Mas um livro mal escaneado, mesmo que seja pequeno, pode ser um amontoado de imagens (sem reconhecimento de caracteres) que em qualquer equipamento demoram segundos pra serem visualizadas.

Infelizmente, nem tudo s&atilde;o flores, e o reconhecimento de caracteres n&atilde;o &eacute; perfeito. Por isso que voc&ecirc; precisa revisar direitinho cada p&aacute;gina, bater o olho e tentar localizar alguma palavra reconhecida erroneamente.

Pode levar tempo, mas no final compensa, e muito.

Quanto a outros programas ou alternativas n&atilde;o mencionadas no t&oacute;pico (eu citei programas pagos), desconhe&ccedil;o, mas se algu&eacute;m quiser recomendar, fique &agrave; vontade.

Answer

Pessoal, alguns acr&eacute;scimos/observa&ccedil;&otilde;es sobre esse guia:

- Seria interessante no futuro ver como escanear material em que cada p&aacute;gina seja MAIOR que o vidro do scanner.

- Eu retirei a informa&ccedil;&atilde;o de que se deve escanear em 300 DPI se o livro for apenas texto (sem ilustra&ccedil;&otilde;es de qualquer esp&eacute;cie). Infelizmente nessa qualidade o ABBYY Finereader tem dificuldade em reconhecer os caracteres, j&aacute; em 600 DPI isso n&atilde;o ocorre. E d&aacute; justamente o aviso que a resolu&ccedil;&atilde;o est&aacute; baixa. Logo, deve-se escanear em 600 DPI tamb&eacute;m se o livro for s&oacute; de texto.

Uma forma de economizar tempo seria escanear 2 p&aacute;ginas ao mesmo tempo, se ambas couberem no vidro do scanner, no caso de livros pequenos. A&iacute; seria s&oacute; o trabalho de no Photoshop mesmo salvar em 2 arquivos diferentes, ap&oacute;s recortar.

- Fui na gr&aacute;fica hoje e me responderam que &eacute; poss&iacute;vel apenas FURAR cada livro e passar a espiral depois. Vejam na foto um exemplo de p&aacute;ginas soltas, sem a espiral:

Isso deve ser feito porque como eu disse, a espiral levanta o livro na hora de escanear e isso acaba DESFOCANDO parte(s) da imagem, dificultando mais ainda mexer no ABBYY Finereader.

S&oacute; devemos tomar cuidado pra n&atilde;o misturar p&aacute;ginas que n&atilde;o estejam numeradas. Depois eu vou levar na gr&aacute;fica pra passar a espiral.

- Me disseram que &eacute; poss&iacute;vel furar livros de capa dura, tamb&eacute;m. Deixei 3 l&aacute; e vou buscar essa semana. Um deles, apesar de ser menor que folha A4, tem 1200 p&aacute;ginas, e nesse caso a maior espiral que eles tem n&atilde;o &eacute; da grossura dele. A solu&ccedil;&atilde;o vai ser dividir o livro em dois, claro.

- Alguns livros, como eu tamb&eacute;m alertei, possuem texto no canto da p&aacute;gina, onde justamente a gr&aacute;fica vai FURAR pra encadernar - mas isso s&oacute; na parte da capa dura, n&atilde;o nas folhas em si. A gr&aacute;fica que eu fui me alertou que nessas p&aacute;ginas em particular, o furo seria no meio desses textos.

Em um deles, eu escaneei com o livro COLADO mesmo, s&oacute; essas p&aacute;ginas, e ficou bom. Mas isso porque &eacute; na capa e contracapa. Se fosse na p&aacute;gina 200 por exemplo (na folha, n&atilde;o na capa dura), desfocaria porque ao abrir o livro inteiro no vidro, o scanner n&atilde;o alcan&ccedil;aria o canto justamente por conta da cola.

- A princ&iacute;pio eu n&atilde;o quis ter nenhum trabalho e apenas pesquisei os mesmos livros na internet. Mas uma quantidade muito grande de livros n&atilde;o foi sequer escaneada. N&atilde;o existe, portanto, nem gratuitamente e disponibilizado por algu&eacute;m, nem oficialmente, pela editora.

- Um pequeno c&aacute;lculo de tempo gasto: se um livro tem 500 p&aacute;ginas, e leva-se 2 minutos pra escanear, at&eacute; 1 pra arrumar no Photoshop, e 3 (d&aacute; pra levar at&eacute; menos que isso, mas depende, em alguns casos, o tempo pode ser maior, tem que ver que tipo de conte&uacute;do tem a p&aacute;gina), no total perde-se 3.000 minutos s&oacute; com esse livro, ou 50 horas / mais de 2 dias. Isso sem parar pra nada, claro.

Por isso que eu expliquei que &eacute; neg&oacute;cio de no m&iacute;nimo 1, 2 semanas, se voc&ecirc; estiver sem nada pra fazer e se dedicar s&oacute; a essa tarefa.

- O que leva mais tempo? Corrigir os caracteres detectados? N&atilde;o. Porque o ABBYY detecta quase 100% do texto como ele est&aacute; no livro original. A precis&atilde;o do programa &eacute; impressionante.

Somente quando o livro &eacute; mal escaneado ou est&aacute; em condi&ccedil;&otilde;es ruins (como sujo) que ele tem dificuldade. O tempo maior que voc&ecirc; vai levar &eacute; pra arrumar a fonte ou enquadrar imagens que existam na p&aacute;gina. Ou ainda pra desenhar em cima de &aacute;reas que o ABBYY n&atilde;o detectou. S&atilde;o esses detalhezinhos que consumir&atilde;o mais tempo. Mas precisam ser corrigidos, do contr&aacute;rio o resultado final vai ficar ruim.

Ent&atilde;o, se for pra arrumar 1 p&aacute;gina s&oacute; de um livro, em menos de 10 minutos no total, at&eacute; uma crian&ccedil;a faz isso. O problema n&atilde;o &eacute; a dificuldade. &Eacute; o tempo gasto.

&Eacute; que isso a&iacute; n&atilde;o &eacute; servi&ccedil;o pra uma pessoa s&oacute; fazer. Uma deveria escanear tudo, OK, mas distribuir pra outras (um grupo, que soubesse mexer no ABBYY e fazer o mesmo) converterem uma quantidade de JPG pra PDF (eu prefiro converter cada p&aacute;gina em um PDF separado, depois &eacute; que junto tudo).

Por isso que demora tanto, e por isso certamente que t&atilde;o poucos livros s&atilde;o escaneados (ou BEM escaneados). Isso &eacute; pior pra todos, porque o tempo dos livros de papel ocupando espa&ccedil;o, juntando poeira, nada pr&aacute;ticos, j&aacute; passou.

Answer

Parab&eacute;ns pelo t&oacute;pico. Fazia tempo que n&atilde;o via um guia t&atilde;o completo assim.

Answer

Texto de alta qualidade, parab&eacute;ns.

Answer

Clicando em Start, ele pergunta QUAL DISPOSITIVO VOC&Ecirc; QUER USAR? Clico  no &iacute;cone do meu e depois em CONFIGURA&Ccedil;&Otilde;ES PERSONALIZADAS, coloco 600  DPI.

O ruim &eacute; que preciso colocar esse n&uacute;mero toda vez. Porque mesmo que voc&ecirc;  coloque uma vez, na pr&oacute;xima ele mostrar&aacute; o n&uacute;mero padr&atilde;o que poder&aacute; ser  diferente. Quer dizer, se eu for escanear 1000 vezes, preciso ir 1000  vezes em CONFIGURA&Ccedil;&Otilde;ES PERSONALIZADAS (resolu&ccedil;&atilde;o) e me certificar que  est&aacute; em 600 DPI.

Hmmm... ser&aacute; que o seu scanner n&atilde;o est&aacute; configurado para uma resolu&ccedil;&atilde;o menor que 600 dpi? Se voc&ecirc; puder mudar a resolu&ccedil;&atilde;o padr&atilde;o do scanner para 600 dpi, pode ser que o Photoshop j&aacute; reconhe&ccedil;a automaticamente essa resolu&ccedil;&atilde;o e voc&ecirc; n&atilde;o precise mudar toda hora (s&oacute; um palpite meu).

Ou talvez o Photoshop mude para resolu&ccedil;&atilde;o de impress&atilde;o (que, por padr&atilde;o est&aacute; configurada para 300 dpi l&aacute; em Prefer&ecirc;ncias). Eu n&atilde;o tenho scanner pra testar, mas se quiser tente mudar esse valor para 600 dpi, pra ver se resolve...

Answer

Rog&eacute;rio Guerreiro disse: Hmmm... ser&aacute; que o seu scanner n&atilde;o est&aacute; configurado para uma resolu&ccedil;&atilde;o menor que 600 dpi? Se voc&ecirc; puder mudar a resolu&ccedil;&atilde;o padr&atilde;o do scanner para 600 dpi, pode ser que o Photoshop j&aacute; reconhe&ccedil;a automaticamente essa resolu&ccedil;&atilde;o e voc&ecirc; n&atilde;o precise mudar toda hora (s&oacute; um palpite meu).

Ou talvez o Photoshop mude para resolu&ccedil;&atilde;o de impress&atilde;o (que, por padr&atilde;o est&aacute; configurada para 300 dpi l&aacute; em Prefer&ecirc;ncias). Eu n&atilde;o tenho scanner pra testar, mas se quiser tente mudar esse valor para 600 dpi, pra ver se resolve...Quando eu clico em configura&ccedil;&otilde;es personalizadas, ele mostra 100 na caixa de DPI.

&Eacute; bagun&ccedil;a do Photoshop mesmo, &eacute; um saco ter que clicar l&aacute; toda vez pra alterar, mas t&aacute; desse jeito.

Esse scanner a&iacute; consegue escanear at&eacute; mesmo em 1200 DPI, mas assim o arquivo fica gigante, SE voc&ecirc; optar por salvar sem perda de qualidade do JPG. Mas salvando em JPG, fica numa qualidade muito boa (e tipo, uns 10, 20 MB de tamanho), e fotos eu s&oacute; salvo assim.

Se salvar sem compress&atilde;o em 1200 DPI, o arquivo fica com mais de 100 MB se n&atilde;o me engano. E fica pesad&atilde;o pra abrir.

Se me lembro bem, eu escaneei uma vez em 100 DPI ou algo assim e depois ele passou a considerar 100 como o n&uacute;mero padr&atilde;o daquela caixa. Mas nos pr&oacute;ximos scans mesmo se voc&ecirc; alterar pra 600 ele volta pra 100. Talvez exista um jeito de alterar isso pra n&atilde;o ter que mexer toda vez, mas se tem eu n&atilde;o sei.

Infelizmente &eacute; mais demorado escanear em 600 DPI (levei uns 2-3 dias pra escanear um livro de quase 300 p&aacute;ginas), mas se escanear em 300 DPI o ABBYY Finereader n&atilde;o reconhece direito os caracteres e manda voc&ecirc; aumentar a resolu&ccedil;&atilde;o.

A minha multifuncional &eacute; a Epson XP-204, se voc&ecirc; pesquisar por a&iacute; (n&atilde;o estou encontrando um link agora) deve achar a refer&ecirc;ncia que ela escaneia at&eacute; em 1200 DPI.

P.S. J&aacute; fui no painel de controle e est&aacute; assim:

&Eacute; coisa do meu Photoshop, ent&atilde;o.

Answer

Recebi da gr&aacute;fica hoje os livros com capa dura que mandei furar pra  futuramente passar a espiral. Felizmente foi poss&iacute;vel furar a capa dura  da mesm&iacute;ssima forma que as folhas normais, sem nenhuma diferen&ccedil;a.  Inclusive j&aacute; mandei encadernar (colocar a espiral) em 1 livro que  terminei de escanear essa semana, que n&atilde;o tinham colocado a meu pedido  DESSA VEZ.

http://i.imgur.com/tX83tMW.jpg

Em um dos casos, eu reparei que eles n&atilde;o deixaram furos, como pode ser visto na imagem abaixo:

http://i.imgur.com/XvvQPct.jpg

Apenas  cortaram, ou seja, fiquei com folhas soltas. Eu reclamaria que foi um  erro, mas entendi a l&oacute;gica do que fizeram: se o furo fosse no canto de  cada p&aacute;gina ficaria ruim, pelo menos nesse caso em particular. Ficaria  talvez muito pr&oacute;ximo do texto e/ou imagens.

A solu&ccedil;&atilde;o vai ser colocar todas as p&aacute;ginas nisso aqui:

Uma pasta com pl&aacute;sticos pra colocar papel dentro.

Os  demais livros ficaram perfeitos, iguaizinhos &agrave; foto acima, com os furos  no canto, sem tocar no texto. Um deles foi um dicion&aacute;rio de umas 700  p&aacute;ginas e o outro um livro menor que uma folha A4, mas com 1.200  p&aacute;ginas, que quando eu for passar a espiral, vai ter que ser dividido em  dois.

Answer

Pessoal, fazendo um adendo a esse guia, eu experimentei escanear 1  p&aacute;gina de uma revista de jogos, pois tenho ainda Gamers e outras, e  infelizmente vi que nada disso de OCR funciona direito. O esquema  correto &eacute; esse que alguns sites/pessoas adotaram, de escanear a parada e  salvar tudo como imagem (sim, PDF s&oacute; com imagens), ou seja, sem texto  puro, selecion&aacute;vel.

Isso porque a imagem se choca com o texto.  Reparem que a &aacute;rea verde pode virar texto, mas ficaria podando os  lados da imagem que est&aacute; no centro:

Daria  pra aplicar um desenho de imagem de fundo a&iacute;, ou figura mesmo, por&eacute;m  por melhor que o cara fizesse acho que seria muit&iacute;ssimo trabalhoso e o  resultado final ficaria ruim com certeza.

Quando voc&ecirc; vai gerar  OCR de livro s&oacute; de texto, voc&ecirc; faz muuuuuuuuuito mais r&aacute;pido que livro  contendo texto e ilustra&ccedil;&atilde;o. A&iacute; entra na quest&atilde;o de se a qualidade do  PDF s&oacute; com imagens que t&aacute; na internet &eacute; melhor que a sua, se voc&ecirc;  escanear e salvar. E tamb&eacute;m se a do cara &eacute; lido tranquilo mesmo com  qualidade n&atilde;o 100% e a sua ter&aacute; lag.

Aqui vai um exemplo de 1 p&aacute;gina de um PDF s&oacute; com imagem:

https://dl.dropboxusercontent.com/u/53143167/gamers_58.pdf

O original do cara tem 68 p&aacute;ginas e 56 MB. S&oacute; 1 p&aacute;gina (eu removi as outras de dentro dele) gastou 926 KB.

J&aacute; a mesma p&aacute;gina escaneada e salva em 600 DPI (JPG) gastou 4 MB.

Aqui vai a mesma: https://www.dropbox.com/sc/5z2xxpnajiqpqtq/seW60oldPA

Abrindo pelo ABBYY esse JPG e salvando s&oacute; como imagem dentro de PDF, gastei 740 KB, 20% menos.

https://dl.dropboxusercontent.com/u/53143167/meuscan.pdf

Qual  dos dois ficou melhor, eu n&atilde;o parei pra ver. Mas mesmo que o meu tenha  ficado melhor, fica a quest&atilde;o do lag na minha gera&ccedil;&atilde;o da parada. Porque  toda vez que voc&ecirc; vai abrir um PDF com imagem ele demora mais pra  carregar a p&aacute;gina inteira.

N&atilde;o sei como esses caras  geram PDFs com imagens, mas mesmo com arquivos grandes, eles carregam  mais r&aacute;pido. Talvez porque sejam mais comprimidos, mas isso sacrifica a  qualidade.

E pra revistas n&atilde;o rola encaderna&ccedil;&atilde;o pelo  que eu vi mesmo. Acho que tem que usar um tira-grampos, e levantar cada  grampo no meio dela, tirar, e depois recolocar e dobrar de novo. Esse  exemplo a&iacute; eu escaneei sem fazer isso, mas fica muito ruim pra ajustar  cada p&aacute;gina, o cara tamb&eacute;m perde bem mais tempo e certamente precisa  reescanear se n&atilde;o colocar em cima do vidro direito.

Mais  uma coisa, eu peguei um terceiro livro did&aacute;tico de umas 200-300 p&aacute;ginas  e escaneei todo. Mas esse a&iacute;, talvez pela fonte ser branca, o ABBYY n&atilde;o  reconheceu o texto dela (foi 1 p&aacute;gina s&oacute;). Mas agora h&aacute; pouco escaneei  de novo e ele fez o reconhecimento direitinho. Isso de n&atilde;o reconhecer  direito da primeira vez e na segunda reconhecer escaneando do mesmo  jeito nunca tinha ocorrido. E eu escaneei nas duas vezes com o livro  descolado.

O n&atilde;o reconhecimento foi gritante, porque ele s&oacute;  reconheceu 1 de v&aacute;rias linhas da p&aacute;gina. Talvez tenha sido como eu  coloquei em cima do vidro ou o pr&oacute;prio scanner desfocando um scan dentre  in&uacute;meros aleatoriamente.

Answer

E vai aqui uma dica pro pessoal que quer escanear um livro, mas n&atilde;o usar o m&eacute;todo de OCR:

Eu testei pelo programa ADOBE FIREWORKS reduzir o tamanho/qualidade dos scans e salvar assim mesmo em PDF. Sendo assim, logo ap&oacute;s escanear, em quest&atilde;o de minutos o PDF j&aacute; ficaria pronto.

O primeiro passo ao escanear &eacute; nomear cada p&aacute;gina PELA ORDEM. Assim quando for lidar com cada uma, ficaria por exemplo a capa PAGINA0.JPG, a p&aacute;gina seguinte como PAGINA1.JPG at&eacute; chegar em PAGINA290.JPG, vamos colocar assim. Mas isso &eacute; j&aacute; na hora que voc&ecirc; estiver escaneando e salvando.

Depois de tudo pronto, com o Fireworks aberto, escolha no menu OPEN o BATCH PROCESS...

http://i.imgur.com/N2avlKE.png

Vejam que nessa tela eu selecionei e cliquei em ADD. Os arquivos apareceram na caixa. Clique em NEXT.

http://i.imgur.com/SJt7vfu.png

Clique em Export, e depois em ADD. Em Scale e depois em ADD. Isso pra que ambos apare&ccedil;am em INCLUDE IN BATCH, ali na direita.

Pr&oacute;ximo passo: v&aacute; em Scale e selecione SCALE TO PERCENTAGE. Digite 50 na caixa, como mostra a imagem acima.

http://i.imgur.com/pQ8Iwj1.png

Por &uacute;ltimo, v&aacute; em EXPORT e selecione CUSTOM... Depois clique em EDIT (se a caixa de di&aacute;logo n&atilde;o abrir):

http://i.imgur.com/6BvYlgt.png

Selecione JPG e depois digite 50 na caixa. D&ecirc; OK.

Depois clique em NEXT.

http://i.imgur.com/PSJ9wEk.png

Clique em BATCH e aguarde at&eacute; a conclus&atilde;o. O programa ir&aacute; converter todos os arquivos JPG (os scans originais em 600 DPI) em vers&otilde;es com 50% de perda de qualidade, e 50% menores. Ele faz isso mesmo se voc&ecirc; tem, digamos, 1.000 arquivos JPG, caso tenha selecionado todos.

Assim evita ter que fazer esse ajuste manualmente, em cada um.

Ap&oacute;s o t&eacute;rmino ele ir&aacute; salvar numa pasta os arquivos modificados e manter os originais.

&Uacute;ltimo passo: baixe e instale o programa abaixo:

http://fm-pdf.com/jpg-to-pdf-free.html

Com ele aberto, clique em ADD IMAGE e selecione todos os JPG modificados:

http://i.imgur.com/m0FTJYU.png

Clique em OUTPUT e digite o nome do arquivo PDF que ser&aacute; salvo.

Clique em START e aguarde a conclus&atilde;o. Cuidado pra n&atilde;o selecionar os arquivos fora da ordem, por ex., a p&aacute;gina 10 antes da 1. Uma dica &eacute; selecionar com a tecla SHIFT todos os arquivos, mas de baixo pra cima, do &uacute;ltimo para o primeiro.

Vejam que quando eu seleciono de cima pra baixo, ele n&atilde;o adiciona na ordem que eu quero:

http://i.imgur.com/uJHvTW7.png

J&aacute; de baixo pra cima, reparem que fica na ordem, direitinho:

http://i.imgur.com/hMN9R4H.png

Alguns c&aacute;lculos:

- Um livro de 700 p&aacute;ginas (dicion&aacute;rio, ou seja, s&oacute; texto) escaneado em 600 DPI gastou 1,77 GB. Salvando nesse esquema em PDF, sem OCR, gastou 423 MB.

- Um livro de 320 p&aacute;ginas (semelhante a revistas, ou seja, cada p&aacute;gina tem texto e imagem) escaneado em 600 DPI gastou 1,27 GB. Salvando nesse esquema em PDF, sem OCR, gastou 175 MB.

- Um livro de 1.300 p&aacute;ginas (s&oacute; texto) escaneado em 600 DPI gastou 1,84 GB. Salvando nesse esquema em PDF, sem OCR, gastou 427 MB.

O tamanho final depende do quanto cada p&aacute;gina gasta. Uma que contenha imagens/texto pode gastar por ex. 3 MB, e uma s&oacute; com texto, 1 MB.

- Os mesmos livros com OCR gastariam em torno de 13 MB pro dicion&aacute;rio, 108 MB pro de 320 p&aacute;ginas (gasta tudo isso porque tem muita imagem misturada com texto) e 7 MB pro de 1.300 p&aacute;ginas.

Logo, utilizar o OCR &eacute; essencial pra quem precisa n&atilde;o apenas ter as vantagens dele, mas economizar muito espa&ccedil;o de armazenamento.

Outro detalhe: n&atilde;o tem LAG nenhum o arquivo em PDF somente com imagens. E a qualidade final ficou boa pra ser lido num iPAD (tablet).

Quem quiser comparar a qualidade do scan original versus o mesmo arquivo salvo nessas configura&ccedil;&otilde;es pelo Fireworks, ta&iacute; os links:

Original em 600 DPI:

http://i.imgur.com/Ot6l4T6.jpg

Reduzido:

http://i.imgur.com/apFUeIf.jpg

Answer

Pessoal, um alerta pra quem pretende usar a &uacute;ltima vers&atilde;o do Photoshop:

A &uacute;ltima vers&atilde;o em 64 bit (agora uso um Core i7 e fica rapidinho pra editar e fazer outras coisas, ainda mais num SSD) tem um bug. &Eacute; a CC 2014, para refer&ecirc;ncia, a 20140508.r.58.x264.

Quando voc&ecirc; clica numa das op&ccedil;&otilde;es j&aacute; marcadas como mostra a tela acima, o programa fecha automaticamente.

Pesquisando na internet constatei outros usu&aacute;rios com mesmo problema. &Eacute; poss&iacute;vel escanear normal, por&eacute;m sem alterar essas duas op&ccedil;&otilde;es. O &uacute;nico inconveniente &eacute; que cada arquivo BMP ter&aacute; o mesmo nome e ficar&aacute; armazenado numa pasta criada s&oacute; pra ele, com a data do dia do scan.

Al&eacute;m disso ap&oacute;s o scan o arquivo obrigatoriamente abrir&aacute; no Photoshop.

Isso &eacute; inconveniente porque &eacute; poss&iacute;vel 1) n&atilde;o abrir autom&aacute;tico e 2) criar arquivos com cada final diferente, tipo 001, 002, etc.

Isso em vers&otilde;es diferentes.

EDITADO:

E acabei de descobrir um programa que pode renomear de uma s&oacute; vez todos os arquivos de uma pasta.

&Eacute; gratuito: http://www.advancedrenamer.com/download

O m&eacute;todo de renomear seria &uacute;til nesse caso do Photoshop na vers&atilde;o 64-bit por conta do bug, j&aacute; que voc&ecirc; teria que renomear manualmente todos os BMPs que est&atilde;o cada um com nome IMG.BMP em uma pasta.

Com o programa aberto, clique com o bot&atilde;o direito e escolha ADICIONAR.

Ap&oacute;s isso, clique no &iacute;cone da pasta IMAGENS, e digite IMG na caixa de pesquisa. Todos os arquivos IMG.BMP de cada diret&oacute;rio aparecer&atilde;o na lista. Selecione todos e d&ecirc; OK.

Pr&oacute;ximo passo &eacute; inserir isso. Menu Adicionar M&eacute;todo, Novo Nome. Veja na tela abaixo:

Percebam que todos os arquivos da pasta IMAGENS do Windows (onde o Photoshop salva ap&oacute;s escanear) ter&atilde;o uma ordem. Pode n&atilde;o ser a exata, mas isso j&aacute; poupa muito tempo de renomea&ccedil;&otilde;es manuais.

Answer

E uma nota importante do porqu&ecirc; n&atilde;o se deve escanear com a tampa (do scanner) aberta:

(Cliquem para ampliar)

As imagens mostram que com a tampa aberta a folha n&atilde;o &eacute; escaneada corretamente, ficando transparente (mistura o outro lado com o escaneado), que arruina o resultado final. Notem que, quando fechada a tampa, a folha &eacute; escaneada quase sem isso.

Eu tentei escanear sem fechar a tampa porque ao fechar reparei que as folhas balan&ccedil;am um pouquinho de nada &agrave;s vezes e o scan entorta (bem pouco, mas voc&ecirc; nota).

Answer

Daria tamb&eacute;m para usar um scanner de m&atilde;o tipo esse:

A&iacute; voc&ecirc; tem como vistualizar o que foi scaneado.

Answer

material excelente pra quem &eacute; da area , e para quem quer aprender a scanear , muito bom mesmo !

Answer

Boa  tarde !

Muito  &uacute;til este t&oacute;pico .

Abra&ccedil;os

Answer

aureoh disse: Daria tamb&eacute;m para usar um scanner de m&atilde;o tipo esse:
A&iacute; voc&ecirc; tem como vistualizar o que foi scaneado.Eu j&aacute; tive scanner de m&atilde;o mas vendi. Voc&ecirc; n&atilde;o v&ecirc; se n&atilde;o tiver um PC no local. E pra escanear qualquer coisa &eacute; bem ruim de manejar e tem 90% de chances de n&atilde;o fazer isso direito, n&atilde;o recomendo nem pra quem vai levar pra escanear na rua. Melhor fazer isso direitinho, com scanner mesmo, em casa.

Ferramentas

Mover Tópico