Logo Hardware.com.br
Penitante
Penitante Geek Registrado
1.6K Mensagens 246 Curtidas

[Tutorial] Como escanear corretamente livros e afins (+ gerar arquivos digitais)

#1 Por Penitante 14/12/2013 - 15:36
Mais algumas infos que postei em outro fórum, apenas reiterando:

- O Adobe Acrobat é um programa pago, o gratuito é que é o Reader. O Reader não serve para edições.

- Tem sites que juntam imagens enviadas e convertem em PDF, porém nunca é bom usá-los porque sempre tem limitações. Sem contar que pelo Acrobat você faz isso da maneira ideal.

- Pra juntar imagens o programa usado é esse, que é gratuito:
http://fm-pdf.com/jpg-to-pdf-free.html

O modo como isso é feito foi explicado no tópico.

- Exemplo de site que diz juntar imagens e gerar PDF: http://www.convert-jpg-to-pdf.net/

- Nunca é bom usar versões desatualizadas de nenhum programa, pois sempre contém algum bug, ainda mais no caso do ABBYY que mesmo numa versão bem recente ainda assim trocou letras na hora de reconhecer.

Na verdade é preciso revisar o texto inteiro de cada página, o que leva bem mais tempo que bater o olho, pois você não pode corrigir apenas o que ele indicar como "impreciso" (no programa essas áreas estão avermelhadas) na hora do reconhecimento de caracteres e deixar o resto que não sublinhou sem analisar.

- O tamanho do arquivo só é reduzido quando aplicado OCR e SOMENTE SE a maior parte dele não contiver imagens. Muitos livros atuais são recheados de imagens e isso em cada página, de modo que se torna impossível sem comprometer muito a qualidade gerar um arquivo com alguns Megabytes.

- Tem ebook aí com puro texto e centenas de páginas que não consome nem 1 Megabyte, já um dos primeiros que gerei gastou 50 MB mesmo com OCR aplicado em todo ele, porque estava cheio de fotos TAMBÉM.

- Sinceramente, o procedimento que não usa o ABBYY é bem mais prático, apesar de igualmente demorado, o arquivo pode ficar gigante mas pra ler num iPAD ou PC fica perfeito.

- O último ebook que criei foi de um livro de Matemática que no total tinha 642 páginas, levei 1 semana pra gerar um PDF de 218 MB, melhor isso que meses pra arrumar tudo (OCR) e ainda assim pode não ficar bom.

- Eu acho que PDF com OCR só presta quando o livro é puro texto, ainda assim é serviço pra editora do livro fazer, ou um grupo de várias pessoas. Eu fiz só nas primeiras vezes, depois parei DE VEZ.

O problema é que ninguém faz, nem editora e nem leitores, e no Brasil a escassez de ebooks é enorme.

- Esses tamanhos de arquivo podem parecer absurdos mas tendo um iPAD você não vai ter problemas de espaço. O meu é de 64 GB.

- A maior desvantagem do Kindle é essa, nele cabe quase 2 GB. Porém os arquivos que você gera são formiguinhas perto dos elefantes dos PDFs. O Kindle não serve pra ler qualquer PDF, nele você lê MOBI ou o PCR lá que o programa MOBIPOCKET CREATOR gera.

O problema é que a conversão de PDF pra Kindle é sempre imperfeita. Já presenciei cortes de trechos dos PDFs, e se for excessivamente formatado e com imagens vai estragar quando passar por esse programa. O Kindle não mostra, por exemplo, imagens coloridas, e sim em preto-e-branco.

- Já se for pra converter de MOBI ou EPUB pra PDF, eu uso sempre esse site:
http://ebook.online-convert.com/convert-to-pdf

- Calibre nem uso, não presta pra converter.

- Se for pra pegar um texto (arquivo de Bloco de Notas) e converter pra PDF, use esse programa:
http://www.baixaki.com.br/download/free-text-to-pdf-converter.htm

O PDF eu pego e converto pro formato do Kindle com o MOBIPOCKET CREATOR:
http://www.mobipocket.com/en/downloadsoft/productdetailscreator.asp

Essa é uma dica nova que estou dando, pra quem quer apenas pegar um texto qualquer e jogar tanto no iPAD como no KINDLE rapidamente. Fiz isso com artigos da Internet quando precisei estudar algumas matérias.

Reuni os textos e salvei em TXT, depois converti tudo.
Penitante
Penitante Geek Registrado
1.6K Mensagens 246 Curtidas
#16 Por Penitante
17/12/2014 - 21:24
Mais algumas infos que postei em outro fórum, apenas reiterando:

- O Adobe Acrobat é um programa pago, o gratuito é que é o Reader. O Reader não serve para edições.

- Tem sites que juntam imagens enviadas e convertem em PDF, porém nunca é bom usá-los porque sempre tem limitações. Sem contar que pelo Acrobat você faz isso da maneira ideal.

- Pra juntar imagens o programa usado é esse, que é gratuito:
http://fm-pdf.com/jpg-to-pdf-free.html

O modo como isso é feito foi explicado no tópico.

- Exemplo de site que diz juntar imagens e gerar PDF: http://www.convert-jpg-to-pdf.net/

- Nunca é bom usar versões desatualizadas de nenhum programa, pois sempre contém algum bug, ainda mais no caso do ABBYY que mesmo numa versão bem recente ainda assim trocou letras na hora de reconhecer.

Na verdade é preciso revisar o texto inteiro de cada página, o que leva bem mais tempo que bater o olho, pois você não pode corrigir apenas o que ele indicar como "impreciso" (no programa essas áreas estão avermelhadas) na hora do reconhecimento de caracteres e deixar o resto que não sublinhou sem analisar.

- O tamanho do arquivo só é reduzido quando aplicado OCR e SOMENTE SE a maior parte dele não contiver imagens. Muitos livros atuais são recheados de imagens e isso em cada página, de modo que se torna impossível sem comprometer muito a qualidade gerar um arquivo com alguns Megabytes.

- Tem ebook aí com puro texto e centenas de páginas que não consome nem 1 Megabyte, já um dos primeiros que gerei gastou 50 MB mesmo com OCR aplicado em todo ele, porque estava cheio de fotos TAMBÉM.

- Sinceramente, o procedimento que não usa o ABBYY é bem mais prático, apesar de igualmente demorado, o arquivo pode ficar gigante mas pra ler num iPAD ou PC fica perfeito.

- O último ebook que criei foi de um livro de Matemática que no total tinha 642 páginas, levei 1 semana pra gerar um PDF de 218 MB, melhor isso que meses pra arrumar tudo (OCR) e ainda assim pode não ficar bom.

- Eu acho que PDF com OCR só presta quando o livro é puro texto, ainda assim é serviço pra editora do livro fazer, ou um grupo de várias pessoas. Eu fiz só nas primeiras vezes, depois parei DE VEZ.

O problema é que ninguém faz, nem editora e nem leitores, e no Brasil a escassez de ebooks é enorme.

- Esses tamanhos de arquivo podem parecer absurdos mas tendo um iPAD você não vai ter problemas de espaço. O meu é de 64 GB.

- A maior desvantagem do Kindle é essa, nele cabe quase 2 GB. Porém os arquivos que você gera são formiguinhas perto dos elefantes dos PDFs. O Kindle não serve pra ler qualquer PDF, nele você lê MOBI ou o PCR lá que o programa MOBIPOCKET CREATOR gera.

O problema é que a conversão de PDF pra Kindle é sempre imperfeita. Já presenciei cortes de trechos dos PDFs, e se for excessivamente formatado e com imagens vai estragar quando passar por esse programa. O Kindle não mostra, por exemplo, imagens coloridas, e sim em preto-e-branco.

- Já se for pra converter de MOBI ou EPUB pra PDF, eu uso sempre esse site:
http://ebook.online-convert.com/convert-to-pdf

- Calibre nem uso, não presta pra converter.

- Se for pra pegar um texto (arquivo de Bloco de Notas) e converter pra PDF, use esse programa:
http://www.baixaki.com.br/download/free-text-to-pdf-converter.htm

O PDF eu pego e converto pro formato do Kindle com o MOBIPOCKET CREATOR:
http://www.mobipocket.com/en/downloadsoft/productdetailscreator.asp

Essa é uma dica nova que estou dando, pra quem quer apenas pegar um texto qualquer e jogar tanto no iPAD como no KINDLE rapidamente. Fiz isso com artigos da Internet quando precisei estudar algumas matérias.

Reuni os textos e salvei em TXT, depois converti tudo.
Penitante
Penitante Geek Registrado
1.6K Mensagens 246 Curtidas
#17 Por Penitante
19/01/2015 - 21:08
Eu falei que livros maiores que o scanner seriam um problema, até conhecer um pequeno:

Imagem

Dessa mesma editora eu recebi dois, mas em uma condição que permitia esticar com as mãos as páginas ao máximo e escanear de alguma forma. Ainda que os cantos ficassem ruins, não era um problema considerável.

Porém, esse da foto está como se fosse novo, apesar de ser um livro de décadas. Não dá pra escanear sem furar porque nenhuma página "abre" o bastante pro scanner pegar.

O problema é que se furar aí vai pegar bem no canto do livro, que não está formatado com margem, de modo a dar uma distância entre o conteúdo e o canto de cada folha. Eu nem sei se rola até mesmo furar, porque é coisa de milímetros mesmo, ao furar já pega em qualquer foto que esteja na folha e pode pegar até o texto.

Talvez a solução seja furar, mas não pra passar espiral, e sim fazer um corte reto, tal como foi feito aqui:

http://i.imgur.com/tX83tMW.jpg

Engraçado que eu recebi um livro de igual tamanho, que também cabe na minha mão (esse é bem mais recente), e que foi editado como livros devem ser, com margem, mantendo espaço em branco nos cantos.

Acontece que se eu fizer um corte reto não vai ser mais possível juntar tudo, a menos que você use algo tipo aqueles álbuns de fotografia, pra passar cada página.

Esse é daqueles livros tão bem colados que você não consegue escanear sem mandar encadernar como eu expliquei.

A menos que saiba descolar todo ele.

Depois eu posto o que consegui fazer.
Penitante
Penitante Geek Registrado
1.6K Mensagens 246 Curtidas
#18 Por Penitante
29/01/2015 - 19:35
Fui na gráfica e infelizmente constatei que essa tática de cortar o livro pra encadernar não funciona com vários. Não só os pequenos que cabem na mão, mas vários livros são editados de um jeito que se você for deixar aqueles furinhos pra passar a espiral não só irá pegar na gravura (não só quando ela toma o espaço de 2 páginas), mas também no próprio texto, o que estragaria o livro de vez.

A solução seria mandar fazer o corte reto, só que aí pra ler o livro de novo você teria que colocar numa pasta, e tratá-lo como se fosse um álbum de fotografias.

Assim:

Imagem

Ao furar assim é que podemos passar a espiral:

http://i.imgur.com/cwSbckP.jpg

Só que nem sempre dá.

Como não quero juntar livros em papel vou mandar fazer o corte reto mesmo, se for o único jeito de escanear e nem der pra passar espiral mais. Porque nele a perda é a mínima possível. É uma pena, mas como só aceito livro escaneado, vou optar por fazer mesmo assim.

Tem muitos livros que dão espaço pra ficar como na segunda foto sem perda alguma, mas deve haver um número igual que não permite isso.
Penitante
Penitante Geek Registrado
1.6K Mensagens 246 Curtidas
#19 Por Penitante
23/02/2015 - 14:33
E um alerta importante pra quem pensa em escanear revistas ou mesmo livros com páginas de fundo preto: ao tocar com os dedos (mesmo totalmente limpos) eu notei que sempre deixava uma mancha na folha. O pior é que isso acabava saindo no arquivo depois que escaneava.

A solução pra evitar isso (e que usam ao escanear documentos antigos) é uma luva. Improvisei protegendo os dedos com um plástico, como pode ser visto na foto (cliquem nas duas para ampliar):

Imagem Imagem

Com relação às revistas, eu disse que tinha dúvidas se era possível escanear, mas é, repetindo o mesmo procedimento dos livros.

Fazem na gráfica um corte reto, levo as folhas soltas pra casa, escaneio, trago de volta e só assim faço os furos pra passar a espiral. Nas primeiras vezes que escaneei haviam feito um corte já com os furos, o que foi errado.

O perigo é que dependendo do livro há grandes chances de pegar nas letras ou no conteúdo, já que revistas por ex. sempre tem alguma ilustração que toma espaço de 2 páginas (na verdade é uma só, dividida pelos grampos). Mas isso é o de menos se o objetivo é escanear.

Sobre os livros bem pequenos (felizmente são minoria), não dá pra encadernar mesmo.
Penitante
Penitante Geek Registrado
1.6K Mensagens 246 Curtidas
#21 Por Penitante
06/08/2015 - 13:47
Pessoal, segue aqui uma dica final pra quem quer criar ebooks pro KINDLE.

Após criar um cadastro no site da Amazon.com.br, é possível enviar pra "nuvem" (deixar armazenado no servidor deles) os ebooks que você tenha, e pelo Kindle mesmo baixar cada um. Assim pode-se economizar espaço no aparelho, só baixando aqueles que interessem. Sendo que o envio é feito por email, dentro das configurações da sua conta você recebe um email personalizado, tipo [EMAIL]minhaconta@kindle.com[/EMAIL], e envia como anexo os ebooks pra ele, sendo convertidos pela própria Amazon e armazenados lá.

Eu havia proposto aqui o uso do MOBIPOCKET READER, só que isso não é prático, pois são criados arquivos de extensão .PCR, e o envio só poderia ser feito via USB. Na época eu desconhecia o sistema da nuvem.

Além disso, não dá pra ver (pelo menos não descobri ainda) como fica o .PCR depois de criado no Windows, além da conversão de um PDF sempre ficar ruim pra MOBI ou qualquer formato.

O que aconselho é procurar sempre pelo ebook em extensão .ePuB ou .MOBI. Se estiver em MOBI você pode enviar até mesmo por USB pro Kindle. Se enviar EPUB pra Amazon ela não aceita.

Aí basta visitar esse site e mandar converter o EPUB pra MOBI, primeiro:
http://ebook.online-convert.com/convert-to-mobi

*******

Porém, no caso de você querer criar um ebook já pronto pro Kindle em MOBI, como fazer? Pelo ABBYY FINEREADER, se for criação de ebook OCR, deve ser possível escolher além de PDF outros formatos.

Mas o que me refiro não é a escanear, revisar e depois criar o MOBI. É criar um MOBI a partir de um PDF que exista, ou mesmo de um site na internet.

Ou seja, eu tenho o PDF/site com todo o texto (ao invés de imagens), ou então 90% texto E algumas imagens. Não preciso usar o ABBYY FINEREADER. O que fazer?

******

Bom, vou dar um exemplo de página na internet:
http://www.theabsolute.net/minefield/woman.html

Se eu quiser converter isso aí em ebook pro Kindle:

1) Caso tenha imagens, eu escolho no navegador (preferível o Firefox, mas outros podem ser usados) a opção Salvar página da Web Completa. Se escolher Salvar página da Web, Somente HTML ele não vai salvar imagens. É preferível sempre optar pela opção COMPLETA. Para salvar, o atalho do navegador é control + S.

2) Faça o download desses programas:

http://www.baixaki.com.br/download/nvu.htm

http://www.baixaki.com.br/download/sigil.htm

O primeiro é um editor de páginas da internet e o segundo irá auxiliar na conversão.

3) O NVU pode ser usado pra editar cada página. A edição fica ao cargo de cada um, podendo ser adicionado texto, retirado algum item, ou simplesmente corrigido. Note que o site do ABSOLUTE que eu indiquei tem atalhos pra cada "capítulo", e isso seria o índice do ebook. Opte por deixar a página da web com isso, pois facilitará que você avance até um ponto desejado e não tenha que procurar em meio a muitas páginas sempre.

4) Depois de mexer no NVU, use o SIGIL para abrir a página e escolha SALVAR COMO. Ele irá salvar no formato ePUB.

5) Use o programa CALIBRE:
http://calibre-ebook.com/download

Para converter o ePUB em MOBI. Adicione o ePUB a ele, e com botão direito escolha Converter livros - Converter individualmente.

Coloque em Formato de Saída a opção MOBI. Preencha o título e autor(es). Em Configurações de Página, escolha como perfil de saída o KINDLE PAPERWHITE:

Imagem

Apenas isso, após terminar de criar, botão direito e Abrir conteúdo da pasta. O MOBI estará lá.

*********

Uma última dica é baixar esse programa:
http://jarrin.net/MOBIeditor

Caso você queira apenas editar o título, nome do autor, data de lançamento... de um arquivo. Caso tenha feito algo errado ou o arquivo que pegou não venha com dados corretos (ou nenhum). O MOBIEDITOR irá abrir o MOBI e você poderá editar isso, salvando como MOBI de novo.

******

Frisando novamente: caso o ebook que você obtenha esteja com extensão ePUB, basta converter pra MOBI aqui:
http://ebook.online-convert.com/convert-to-mobi

E enviar pra nuvem ou via USB pro KINDLE. Caso esteja em PDF, a conversão poderá até rolar, mas não vai ficar boa.

Sobre o iPAD, é bom lembrar que na APP STORE ele tem um aplicativo KINDLE que simula o mesmo, e que pode ser usado para também baixar da nuvem da AMAZON. O iPAD, como eu já disse, é que deve ser usado pra ler PDFs, especialmente os que só tem imagem e tamanho bem maior que os ebooks do KINDLE.
Penitante
Penitante Geek Registrado
1.6K Mensagens 246 Curtidas
#22 Por Penitante
26/09/2015 - 10:57
Pessoal, segue mais uma dica pra quem costuma ler PDFs num iPAD: baixe o app FOXTIT MOBILE. Eh melhor que o IBOOKS, possui mais recursos, dentre eles a possibilidade de selecionar um trecho (palavra) e ver o significado no dicionario, algo que o KINDLE tem (inclusive no app do KINDLE para o iPAD) mas o IBOOKS nao.

Somente esses livros abaixo eu nao consegui reproduzir no FOXIT sem problemas (o texto fica todo junto), mas ja avisei aos desenvolvedores do bug. Provavelmente eh relativo a forma como eles foram criados, a formataçao dos mesmos:

Sociologia_Hoje_-_Ensino_Medio_-_Vol._Unico_-_2013
Historia_Geral_e_do_Brasil_-_Claudio_Vicentino_e_Gianpaolo_Dorigo_-_2013 (em 3 volumes)
Geografia_Geral_e_do_Brasil_-_Versao_Digital_-_Ensino_Medio_-_2013 (em 3 volumes)

Todos foram feitos da mesma forma. Os demais ebooks que testei foram lidos sem quaisquer problemas, sendo ebooks de mais variados tipos, em ingles, portugues, com e sem OCR, de variados tamanhos...

Pra transferir ebooks eu uso o aplicativo (tambem gratuito na APPLE STORE) Documents, da empresa READDLE. Pra armazenar os arquivos, eu recomendo usar ou Dropbox ou Google Drive.

Eu passei tudo que tinha no DROPBOX pro Google Drive, pois enquanto o primeiro tem inicialmente 2 GB de armazenamento gratuito, o Google Drive fornece 15 GB. E da pra criar mais de uma conta, seria cadastro da GOOGLE, aquele que permite usar Youtube e outras coisas. Voce cria um email do GMAIL na hora de criar uma conta (tentei com email pessoal, mas nao consegui finalizar o cadastro).

Depois de baixar pelo DOCUMENTS, basta mandar COPIAR pro FOXIT (ou IBOOKS) e deletar a copia que fica no DOCUMENTS.

******

E so pra constar, se em materia de PDFs eu reuni 2193 ebooks (sem contar 320 numa pasta chamada FORA DO IPAD, MAS NO KINDLE), de arquivos MOBI (servem apenas pro KINDLE) eu reuni 655. Entao, a diferença do numero de ebooks disponiveis somente em PDF (somente imagem, ou OCR) pros outros eh brutal. Por isso que nao da pra ter so um Kindle e dispensar um iPAD, se o objetivo eh ler ebooks.
Penitante
Penitante Geek Registrado
1.6K Mensagens 246 Curtidas
#23 Por Penitante
24/10/2017 - 15:30
Um update importante pra esse tópico:

- Quem usa a multifuncional L395 da Epson (que é mais cara que essas antigas tipo XP-204, só que mais econômica por usar aqueles tanques) tem a mesma qualidade de scanner, só que melhor, mais rápido dependendo do documento e da resolução. O negócio é tão bom que quando eu coloco duas folhas distintas ele consegue salvar até mesmo em dois arquivos diferentes.

- Pra escanear em resoluções altas continua demorado, por ex. pra ser em 1200 DPI leva uns 5 minutos. Mas aí é até compreensível, dada a complexidade.

- O programa que vem com a impressora, o tal Epson Scan (agora na versão 2) foi melhorado.

- O Photoshop mesmo na última versão não consegue escanear (nessa L395) em resolução maior que 300 DPI (pelo WIA). Verifiquei se havia como mudar isso nesse programa e mesmo no Windows (uso o 10, de 64 bit), sendo que no painel de controle os perfis de digitalização estão travados em 300 DPI. Não achei como. Então deve ser frescura do Windows, ou algo complexo que só resolva com reinstalação de driver, o que pessoalmente duvido, pois instalei tudo bonitinho.

Já no Epson Scan 2 você escaneia acima de 300 numa boa. Considerando as melhorias do programa eu diria que o Photoshop deixou de ser necessário pra escanear qualquer coisa, sendo útil apenas para editar os arquivos. O Epson Scan 2 salva já em JPG.

- Eu testei aqui um livro que mistura textos e fotos. Ao escanear no modo "fotografia" é possível que em alguns momentos o scanner ignore o texto e apenas salve a imagem daquela página.

Exemplo:
https://imgur.com/a/gfkLo

Além disso pode-se perceber que a imagem acima está com muito brilho.

- Já no modo "documento" (e em 1200 DPI) a mesma página é escaneada na sua totalidade, e como dá pra ver pelo link abaixo, em cores vivas:
https://www.dropbox.com/s/oldiz3g8rs1i1nx/LIVRODEFOTOSDESUPERGIRL0013-A.jpg?dl=0

Então sempre escolham o modo "documento" mesmo quando o material que precisar ser escaneado consistir principalmente de imagens.

Segue a tela do programa:
0dd27a0dac604535641c17e23e352bce
© 1999-2024 Hardware.com.br. Todos os direitos reservados.
Imagem do Modal