Tenho o seguinte problema: Trabalho no meio acadêmico, e, após encher um arquivo com artigos científicos, decidi que era melhor fazer isso em modo digital. Como resultado, tenho feito o "scaneamento" de página por página de um determinado artigo, abro um documento no OpenOffice, colo página por página e gero um PDF. Isso toma tempo!
Pergunta: Existe um software para Linux que faça a digitalização de várias páginas para um único arquivo, e que depois eu possa transformar em PDF (ou faça a digitalização já na forma de PDF), como em empresas de Xerox?
Uso atualmente o Kubuntu 9.04, mas até o fim de semana pretendo instalar o 9.10.
Agradeço antecipadamente qualquer dica.
- Home
- >
- Fórum
- >
- GNU-Linux, Free...
- >
- Interfaces, apl...
- >
- Digitalização em Lote
Encontrei este aqui: http://gscan2pdf.sourceforge.net/
Jose Monteiro disse: Encontrei este aqui: http://gscan2pdf.sourceforge.net/
Olá Jose Monteiro,
Grato pela rápida resposta. Vou instalar, testar, e, se tudo der certo, volto para fechar o tópico, ou para encher de perguntas!
Abraço!
Conforme prometido: Fantástico! Exatamente o que eu precisava. Ainda tem um monte de recursos que eu preciso aprender a usar, mas mesmo com minha simples multifuncional, consigo resultados rápidos em relação ao processo manual.
Tive mais problemas para deixar o Scanner funcionando que o programa. E na primeira tentativa, não percebi que o programa interpretava a webcam como scanner, e, enquanto segurava a página no scanner, vi, com surpresa, minha cara aparecer na tela do programa....
Recomendo o programa!
Abraços.
Eu faço isso com o xsane. Também é muito bom.
Fiz isso recentemente com o Imagemagick...
Marcacini e Jqueiroz,
Grato pelas dicas. Sou uma pessoa prática, e como o programa atendeu, fico feliz e vou usando. Mas as dicas estão anotadas. Quando tiver um tempo, experimento outros programas.
Abraços.
Uso o Tesseract, um OCR em linha de comando com suporte a portugues. Altamente preciso.
Core_Dump disse: Uso o Tesseract, um OCR em linha de comando com suporte a portugues. Altamente preciso.
Caro Core_Dump,
Eu mal uso a interface gráfica.... Ainda tenho muito que aprender para usar a linha de comando. Mas se tens alguns passos que eu posso seguir, por favor, compartilhe. Quem sabe eu tente? Para começar, como instalar o Tesseract COM suporte ao português, e depois, como chamar o programa e fazê-lo funcionar?
Abraço e obrigado pelo comentário.
Se voce nao esta familiarizado com a linha de comando no Linux nao recomendo o Tesseract. Se quiser tentar o projeto esta hospedado no Google Code:
http://code.google.com/p/tesseract-ocr/downloads/list
Instalei no Slackware atraves do SlackBuild. Nao custa verificar se existe um pacote nos repositorios atraves do Synaptic. Caso nao encontre, voce pode compilar o pacote. Vou tentar ajuda-lo:
Baixe o pacote:
http://tesseract-ocr.googlecode.com/files/tesseract-2.04.tar.gz
Descompactar o pacote:
tar -xvf tesseract-2.04.tar.gz
Entre no diretorio tesseract-2.04:
cd tesseract-2.04
Basta executar os comandos como usuario normal:
./configure
Apos finalizar o comando anterior:
make
E finalmente instalar como super-usuario:
sudo make install
Para instalar o suporte a Portugues, baixe o pacote:
http://tesseract-ocr.googlecode.com/files/tesseract-2.01.por.tar.gz
Basta descompactar na pasta tessdata:
Localizar a pasta tessdata:
find / -iname *tessdata*
Mover o pacote para a pasta e descompactar:
sudo mv tesseract-2.01.por.tar.gz /pasta/tessdata
cd /pasta/tessdata
sudo tar -xvf tesseract-2.01.por.tar.gz
O suporte a Portugues ja esta instalado. Para obter a leitura de caracteres de uma imagem basta escanear em preto e branco e salvar no formato .tiff. Se o seu programa de scan nao salva no formato .TIFF basta abrir a imagem no Gimp e salvar no formato.
Para usar o tesseract e so fornecer o arquivo de imagem e linkar para portugues:
tesseract imagem.tiff novo_nome_da_imagem -l por
O arquivo com o texto sera salvo com sufixo .txt.
Olá Core_Dump,
Gratíssimo pela dica. Farei isso assim que resolver meu problema de rede no Linux (estou acessando via Windows, visto que desinstalei o que pensei ser uns utilitários de rede e a rede foi junto....)
Estou abrindo um novo tópico onde peço ajuda sobre como resolver o problema, na parte de redes. Se tiver alguma dica, apareça por lá. Abraço.