Logo Hardware.com.br
RubensH
RubensH Novo Membro Registrado
21 Mensagens 0 Curtidas

[Resolvido] Digitalização em Lote

#1 Por RubensH 10/11/2009 - 04:14
Tenho o seguinte problema: Trabalho no meio acadêmico, e, após encher um arquivo com artigos científicos, decidi que era melhor fazer isso em modo digital. Como resultado, tenho feito o "scaneamento" de página por página de um determinado artigo, abro um documento no OpenOffice, colo página por página e gero um PDF. Isso toma tempo! trabalho_duro.gif
Pergunta: Existe um software para Linux que faça a digitalização de várias páginas para um único arquivo, e que depois eu possa transformar em PDF (ou faça a digitalização já na forma de PDF), como em empresas de Xerox?
Uso atualmente o Kubuntu 9.04, mas até o fim de semana pretendo instalar o 9.10.
Agradeço antecipadamente qualquer dica.
Responder
RubensH
RubensH Novo Membro Registrado
21 Mensagens 0 Curtidas
#4 Por RubensH
13/11/2009 - 05:18
Conforme prometido: Fantástico! Exatamente o que eu precisava. Ainda tem um monte de recursos que eu preciso aprender a usar, mas mesmo com minha simples multifuncional, consigo resultados rápidos em relação ao processo manual.
Tive mais problemas para deixar o Scanner funcionando que o programa. E na primeira tentativa, não percebi que o programa interpretava a webcam como scanner, e, enquanto segurava a página no scanner, vi, com surpresa, minha cara aparecer na tela do programa....
Recomendo o programa!
Abraços.
RubensH
RubensH Novo Membro Registrado
21 Mensagens 0 Curtidas
#9 Por RubensH
14/11/2009 - 13:15
Core_Dump disse:
Uso o Tesseract, um OCR em linha de comando com suporte a portugues. Altamente preciso.


Caro Core_Dump,

Eu mal uso a interface gráfica.... Ainda tenho muito que aprender para usar a linha de comando. Mas se tens alguns passos que eu posso seguir, por favor, compartilhe. Quem sabe eu tente? Para começar, como instalar o Tesseract COM suporte ao português, e depois, como chamar o programa e fazê-lo funcionar?

Abraço e obrigado pelo comentário.
Core_Dump
Core_Dump General de Pijama Registrado
3.2K Mensagens 111 Curtidas
#10 Por Core_Dump
14/11/2009 - 14:38
Se voce nao esta familiarizado com a linha de comando no Linux nao recomendo o Tesseract. Se quiser tentar o projeto esta hospedado no Google Code:

http://code.google.com/p/tesseract-ocr/downloads/list

Instalei no Slackware atraves do SlackBuild. Nao custa verificar se existe um pacote nos repositorios atraves do Synaptic. Caso nao encontre, voce pode compilar o pacote. Vou tentar ajuda-lo:

Baixe o pacote:

http://tesseract-ocr.googlecode.com/files/tesseract-2.04.tar.gz

Descompactar o pacote:


tar -xvf tesseract-2.04.tar.gz
Entre no diretorio tesseract-2.04:

cd tesseract-2.04
Basta executar os comandos como usuario normal:

./configure
Apos finalizar o comando anterior:

make
E finalmente instalar como super-usuario:

sudo make install
Para instalar o suporte a Portugues, baixe o pacote:

http://tesseract-ocr.googlecode.com/files/tesseract-2.01.por.tar.gz

Basta descompactar na pasta tessdata:

Localizar a pasta tessdata:

find / -iname *tessdata*
Mover o pacote para a pasta e descompactar:

sudo mv tesseract-2.01.por.tar.gz /pasta/tessdata
cd /pasta/tessdata
sudo tar -xvf tesseract-2.01.por.tar.gz
O suporte a Portugues ja esta instalado. Para obter a leitura de caracteres de uma imagem basta escanear em preto e branco e salvar no formato .tiff. Se o seu programa de scan nao salva no formato .TIFF basta abrir a imagem no Gimp e salvar no formato.

Para usar o tesseract e so fornecer o arquivo de imagem e linkar para portugues:


tesseract imagem.tiff novo_nome_da_imagem -l por
O arquivo com o texto sera salvo com sufixo .txt.
adeus.gif
RubensH
RubensH Novo Membro Registrado
21 Mensagens 0 Curtidas
#11 Por RubensH
15/11/2009 - 07:04
Olá Core_Dump,

Gratíssimo pela dica. Farei isso assim que resolver meu problema de rede no Linux (estou acessando via Windows, visto que desinstalei o que pensei ser uns utilitários de rede e a rede foi junto....)
Estou abrindo um novo tópico onde peço ajuda sobre como resolver o problema, na parte de redes. Se tiver alguma dica, apareça por lá. Abraço.
Responder Tópico
© 1999-2024 Hardware.com.br. Todos os direitos reservados.
Imagem do Modal