CONVERSÃO PDF EM WORD Tópico cartaz: Manuela Domingues
|
Bom dia, caros colegas
Como iniciei a minha atividade de Tradutora com maior quantidade de trabalhos este ano, nunca precisei de ferramentas CAT. No entanto, como pretendo apenas comprar no próximo ano, deparo-me com um problema com um cliente. Enviou-me um ficheiro pdf, que já tentei converter com o OMNIPAGE, MATECAT, ZAMBAR, ABBY Finereader, e o documento nunca fica igual. Já abordei a questão com o cliente, que insiste em mandar-me o ficheiro com maior definição, mas cujo t... See more Bom dia, caros colegas
Como iniciei a minha atividade de Tradutora com maior quantidade de trabalhos este ano, nunca precisei de ferramentas CAT. No entanto, como pretendo apenas comprar no próximo ano, deparo-me com um problema com um cliente. Enviou-me um ficheiro pdf, que já tentei converter com o OMNIPAGE, MATECAT, ZAMBAR, ABBY Finereader, e o documento nunca fica igual. Já abordei a questão com o cliente, que insiste em mandar-me o ficheiro com maior definição, mas cujo texto não aparece devidamente legível. Já não sei o que fazer, pois era importante traduzir no próprio documento, uma vez que se trata de um catálogo de produtos congelados. É verdade que não tenho os programas de origem, sendo que provavelmente não consigo editar por causa desse pormenor. No entanto, o original não está a 100%. Como posso resolver? Alguma sugestão da vossa parte em termos de programas?
Obrigada ▲ Collapse | | |
Com certeza a colega deve estar a se referir a pdfs "mortos", ou seja pdfs em que o texto não seja copiável, sendo necessário o processo de OCR.
O processo não é simples, porque o pdf foi projetado para não ser copiado. Portanto, depois do OCR, vai ser necessário corrigir os detalhes de formatação.
Eu uso o Omnipage com relativo êxito, mas sempre preciso fazer correções no documento. A configuração do Omnipage é importante, para que ele saiba qual é o idioma a ser rec... See more Com certeza a colega deve estar a se referir a pdfs "mortos", ou seja pdfs em que o texto não seja copiável, sendo necessário o processo de OCR.
O processo não é simples, porque o pdf foi projetado para não ser copiado. Portanto, depois do OCR, vai ser necessário corrigir os detalhes de formatação.
Eu uso o Omnipage com relativo êxito, mas sempre preciso fazer correções no documento. A configuração do Omnipage é importante, para que ele saiba qual é o idioma a ser reconhecido, e demarcar as áreas com texto, tabelas, desenhos. Ele pode fazer isso automaticamente, mas pode interpretar erradamente, e aí vamos gastar mais tempo com as correções. Além disso, a qualidade do documento fonte é importante: resolução, fidelidade e contraste. O Omnipage permite que se melhore um pouco o contraste e sejam eliminados elementos desnecessários antes do OCR. Isso pode ajudá-la, mas não faz milagres com documentos semi-legíveis.
Portanto, é importante investir um certo tempo no aprendizado do software de conversão. Gasta-se um bom tempo, mas o retorno compensa bastante.
Acredito que todos esses softwares citados se usados com configuração adequada e seleção das áreas a converter podem dar melhores resultados, mas nunca a conversão vai ser perfeita.
P.S. Entendo que esse cliente queira mais do que uma tradução. Quer a transformação de um texto semi-ilegível em um texto decente. Isso deve se refletir no preço a ser cobrado.
[Edited at 2015-12-09 12:12 GMT]
[Edited at 2015-12-09 12:13 GMT]
[Edited at 2015-12-09 12:13 GMT] ▲ Collapse | | | Manuela Domingues Portugal Local time: 12:50 francês para português + ... CRIADOR(A) DO TÓPICO
Salvador Scofano and Gry Midttun wrote:
Com certeza a colega deve estar a se referir a pdfs "mortos", ou seja pdfs em que o texto não seja copiável, sendo necessário o processo de OCR.
O processo não é simples, porque o pdf foi projetado para não ser copiado. Portanto, depois do OCR, vai ser necessário corrigir os detalhes de formatação.
Eu uso o Omnipage com relativo êxito, mas sempre preciso fazer correções no documento. A configuração do Omnipage é importante, para que ele saiba qual é o idioma a ser reconhecido, e demarcar as áreas com texto, tabelas, desenhos. Ele pode fazer isso automaticamente, mas pode interpretar erradamente, e aí vamos gastar mais tempo com as correções. Além disso, a qualidade do documento fonte é importante: resolução, fidelidade e contraste. O Omnipage permite que se melhore um pouco o contraste e sejam eliminados elementos desnecessários antes do OCR. Isso pode ajudá-la, mas não faz milagres co documentos semi-legíveis.
Portanto, é importante investir um certo tempo no aprendizado do software de conversão. Gasta-se um bom tempo, mas o retorno compensa bastante.
Acredito que todos esses softwares citados se usados com configuração adequada e seleção das áreas a converter podem dar melhores resultados, mas nunca a conversão vai ser perfeita.
P.S. Entendo que esse cliente queira mais do que uma tradução. Quer a transformação de um texto semi-ilegível em um texto decente. Isso deve se refletir no preço a ser cobrado.
[Edited at 2015-12-09 12:12 GMT]
[Edited at 2015-12-09 12:13 GMT]
Pois, mas neste caso não compensa! Realmente vou ter de aprofundar o software de conversão então. Obrigada pela ajuda. | | | Às vezes o OmniPage se atrapalha... | Dec 9, 2015 |
... com arquivos PDF. Nestes casos exporto o PDF para JPG (uso o Infix, mas muitos outros programas podem fazer isso) a 300 dpi, colorido ou em tons de cinza (não B&P).
Claro, será um JPG por página. Depois carrego todos no OmniPage, e costuma funcionar. Se o zoneamento automático não der certo, faço-o manualmente. | |
|
|
PDF escaneado | Dec 10, 2015 |
A dificuldade com os conversores é que confrme destacou o Salvador, nem todo o pdf pode ser convertido facilmente.
Essa pergunta me veio a calhar, pois hoje mesmo recebi um histórico escolar em pdf. escaneado.
O problema é que não consegui carregar o documento no MateCat pois deve ser um daqueles pdfs "mortos" que funcionam como imagem. E o cliente faz questão de que fique igual ao original.
Qual seria o melhor software nesse caso?
Agradeço sugestões.
Peço d... See more A dificuldade com os conversores é que confrme destacou o Salvador, nem todo o pdf pode ser convertido facilmente.
Essa pergunta me veio a calhar, pois hoje mesmo recebi um histórico escolar em pdf. escaneado.
O problema é que não consegui carregar o documento no MateCat pois deve ser um daqueles pdfs "mortos" que funcionam como imagem. E o cliente faz questão de que fique igual ao original.
Qual seria o melhor software nesse caso?
Agradeço sugestões.
Peço desculpas à Manuela por pegar carona na pergunta dela.
Daniela ▲ Collapse | | | Mario Freitas Brasil Local time: 09:50 Membro (2014) inglês para português + ... PDFs mortos - Meus pêsames. | Dec 10, 2015 |
Por uma lado, parece ser uma tremenda falta de consideração do cliente enviar esse tipo de documento. Eu pelo menos sinto assim. Porém, como tradutores, não temos um preço para traduzir, por exemplo, uma carta manuscrita ou um artigo de jornal antigo digitalizado? É claro que devemos ter um preço especial para isto, como bem frisou o amigo Salvador.
Mas os conversores PDF>DOC nesses casos são uma lástima. Eu já fiz inúmeros trabalhos do gênero (diplomas, documentos, cert... See more Por uma lado, parece ser uma tremenda falta de consideração do cliente enviar esse tipo de documento. Eu pelo menos sinto assim. Porém, como tradutores, não temos um preço para traduzir, por exemplo, uma carta manuscrita ou um artigo de jornal antigo digitalizado? É claro que devemos ter um preço especial para isto, como bem frisou o amigo Salvador.
Mas os conversores PDF>DOC nesses casos são uma lástima. Eu já fiz inúmeros trabalhos do gênero (diplomas, documentos, certidões, cartões de vacinação, etc.) digitalizados, na maioria das vezes nem mesmo alinhado às bordas, ou seja, aqueles "scans" diagonais que dão até ânsia de vômito. Mas fiz todos.
Minha opinião é a seguinte:
1. O preço é mais alto, conforme a legibiliade do documento. A gente dá um preço definitivo antes de fechar o serviço. Se o cliente aceitar, bem, se não aceitar, amém.
2. O cliente deve abrir mão expressamente de qualquer tipo de formatação, cores, imagens, etc. Você traduz tão somente o texto e faz o possível para ficar mais ou menos do mesmo tamanho e no mesmo espaço. Nada além disto.
3. O prazo de entrega é igualmente prorrogado. Nada de urgência nesse tipo de serviço, muito menos prioridade.
Tudo isto deve ser combinado antes de aceitar o trabalho. Uma vez negociado o preço e o prazo e expressamente aceito pelo cliente, mãos à obra. Agora, se você aceitou o trabalho para avaliar o documento depois, vou ficar aqui com pena de você, mas vai valer muito como "lessons learned". Você não fará mais isto.
Bom trabalho! ▲ Collapse | | | Abordagem diferente | Dec 10, 2015 |
O Mário Freitas e eu, em tradução, somos como um tecladista de rock e um pianista clássico, daqueles que gostam de surpreender quando um toca músicas do repertório do outro.
Pode ser útil para a plateia comparar os pontos de vista.
Mario Freitas wrote:
Por um lado, parece ser uma tremenda falta de consideração do cliente enviar esse tipo de documento. Eu pelo menos sinto assim.
Não é falta de consideração. Qualquer tradutor juramentado (a lei no Brasil é de 1943, inalterada, pressupõe caneta tinteiro ou máquina de escrever, e é tudo em papel) vive isso diariamente. Se o cliente me manda os documentos originais, vou escanear para fazer OCR. Evidentemente o gótico e o manuscrito terão de ser redigitados.
Se o cliente escaneia adequadamente os originais, a 300 dpi, em cores ou tons de cinza, para mim é uma operação a menos. Ele economiza em correio, motoboy e tempo, assim ficamos quites.
O problema é quando a secretária iniciante de um advogado comemora que "o scanner está rápido hoje" e me manda um contrato de 40 páginas escaneado a 72 dpi.
Mario Freitas wrote:
Porém, como tradutores, não temos um preço para traduzir, por exemplo, uma carta manuscrita ou um artigo de jornal antigo digitalizado? É claro que devemos ter um preço especial para isto, como bem frisou o amigo Salvador.
Já tivemos, lembra? Antigamente era assim.
Não foi nenhum medo da concorrência, nem a globalização, nem a tradução automática que me levaram a manter exatamente o mesmo preço por lauda de tradução em reais inalterado desde julho de 1994. Foi o avanço da tecnologia.
Com computadores bem mais rápidos, impressoras idem, o fato de poder receber e mandar quase tudo via Internet, não precisar usar o correio nem percorrer a cidade para buscar/trazer disquetes, papéis impressos etc., ferramentas CAT, dicionários e pesquisas online, ficou possivel traduzir cada vez mais em cada vez menos tempo. Isso cobriu regiamente a inflação e o aumento do custo de vida e da carga tributária.
Mario Freitas wrote:
Mas os conversores PDF>DOC nesses casos são uma lástima. Eu já fiz inúmeros trabalhos do gênero (diplomas, documentos, certidões, cartões de vacinação, etc.) digitalizados, na maioria das vezes nem mesmo alinhado às bordas, ou seja, aqueles "scans" diagonais que dão até ânsia de vômito. Mas fiz todos.
Ao contrário, eles são muito bons. O OmniPage até alinha scans tortos. questão é que o nosso preço "normal" hoje em dia é para traduzir de um arquivo DOC para outro arquivo DOC.
Mario Freitas wrote:
Minha opinião é a seguinte:
1. O preço é mais alto, conforme a legibiliade do documento. A gente dá um preço definitivo antes de fechar o serviço. Se o cliente aceitar, bem, se não aceitar, amém.
Certamente. Se quiser uma analogia, pense no seguinte...
A primeira vez que vi um hambúrguer (o sanduíche) no Brasil foi na década de 1960. A lanchonete se chamava Hot Dog's, tinha uma loja (em São Paulo) na Rua Augusta, ao lado do Cine Paulista, que ficava na esquina com a Rua Oscar Freire (hoje é um shopping/galeria). Tinham outra loja no Guarujá, na Av. Puglisi (a que vem da balsa para a praia).
O menu era sumário. Cachorro quente (que vinha numa caixinha de cartolina, cercado de batatas chips) e hambúrguer... com ou sem molho vinagrete. (Tinha suco de uva ou laranja também, ambos naturais.)
Pense nos dias de hoje. Imagine um McDonald's, Burger King, ou Bob's que se dispusesse a atender todos os seus caprichos. Vá lá e peça um hambúrguer com molho vinagrete. Quanto iriam cobrar para um funcionário ir comprar os ingredientes, picar o tomate e a cebola, temperar e misturar tudo?
Em tempo... as lanchonetes tradicionais da época em SP (por exemplo, Joakin's e New's - anteriormente New Dog - ambas na Rua Joaquim Floriano) que não são fast-food, TÊM hambúrguer com molho vinagrete no cardápio. Mas compare os preços com os das redes de fast-food...
Então se não for fast-food DOC-to-DOC, por que os tradutores não deveriam cobrar por isso?
Mario Freitas wrote:
2. O cliente deve abrir mão expressamente de qualquer tipo de formatação, cores, imagens, etc. Você traduz tão somente o texto e faz o possível para ficar mais ou menos do mesmo tamanho e no mesmo espaço. Nada além disto.
3. O prazo de entrega é igualmente prorrogado. Nada de urgência nesse tipo de serviço, muito menos prioridade.
O cliente não precisa abrir mão de nada, apenas terá de pagar por tudo o que for comprar. São serviços diferentes.
É como uma praça de alimentação de shopping. Tem a lanchonete de tradução, a lanchonete de DTP, a de legendagem, a juramentada etc. Algumas delas têm coisas que "não fazem parte", como temaki numa de comida mineira, pizza numa de comida chinesa etc.
Mario Freitas wrote:
Tudo isto deve ser combinado antes de aceitar o trabalho. Uma vez negociado o preço e o prazo e expressamente aceito pelo cliente, mãos à obra. Agora, se você aceitou o trabalho para avaliar o documento depois, vou ficar aqui com pena de você, mas vai valer muito como "lessons learned". Você não fará mais isto.
Sem dúvida. A lanchonete de tradução é SOMENTE à la carte. Não dá para cobrar por quilo nem por pessoa, no meu exemplo. | | | Manuela Domingues Portugal Local time: 12:50 francês para português + ... CRIADOR(A) DO TÓPICO José Henrique | Dec 10, 2015 |
Muito obrigada! Os seus argumentos exemplificados com hot-dog fizeram-me extremamente rir! FABULOSO!
Concordo plenamente, e mais uma vez, tal como disse o Mário "lessons learned"! Obrigada a todos! | |
|
|
Obrigada também da minha parte ao Mario e ao José Henrique | Dec 10, 2015 |
Agradeço os comentários valiosos.
Acabei recusando o trabalho prevendo que a formatação daria muito mais trabalho do que a própria tradução. E como o cliente é uma agência há menos espaço para negociação.
Estou me prevenindo para uma próxima vez. Vou já atrás do Omnipage.
Bom trabalho a todos!
Daniela | | | Mario Freitas Brasil Local time: 09:50 Membro (2014) inglês para português + ... Acho que pensamos igual de maneiras diferentes... | Dec 10, 2015 |
Não vou dar "quotes" aqui, mas acho que, como costuma acontecer nos foruns aqui do ProZ, a soma dos comentários gera um ótimo resultado. O Amigo J.H. acrescentou comentários valiosos aos meus e tenho certeza de que o conjunto foi útil para todos nós.
Somente em relação ao Omnipage, eu ainda não conheço porque estou usando o Adobe Pro. De todos os softwares que eu experimentei, o Adobe faz as melhores conversões. Mas não tem esse recurso de alinhar as páginas (eu acho). ... See more Não vou dar "quotes" aqui, mas acho que, como costuma acontecer nos foruns aqui do ProZ, a soma dos comentários gera um ótimo resultado. O Amigo J.H. acrescentou comentários valiosos aos meus e tenho certeza de que o conjunto foi útil para todos nós.
Somente em relação ao Omnipage, eu ainda não conheço porque estou usando o Adobe Pro. De todos os softwares que eu experimentei, o Adobe faz as melhores conversões. Mas não tem esse recurso de alinhar as páginas (eu acho). Meu Adobe Pro é piratão (desculpe) porque o oficial é caro demais e um pobre tradutor não tem como... bom, eu paguei pelo Office 365, pelo MemoQ, pelo Windows 7... não tenho dor na consciência por ter um adobezinho pirata.
No mais, fico satisfeito pelo fórum ter ajudado. ▲ Collapse | | | expressisverbis Portugal Local time: 12:50 Membro (2015) inglês para português + ...
e valem o que valem
Para documentos em pdf digitalizados e converter em Word:
http://www.onlineocr.net/
Para documentos em pdf não digitalizados e converter em Word e/ou noutros formatos:
http://www.zamzar.com/
N�... See more e valem o que valem
Para documentos em pdf digitalizados e converter em Word:
http://www.onlineocr.net/
Para documentos em pdf não digitalizados e converter em Word e/ou noutros formatos:
http://www.zamzar.com/
Não fica uma beleza, mas pode ajudar.
Há um programa que testei e com o qual fiquei satisfeita que é o Foxit no que toca ao OCR. O Abbyy é porreiro, mas fiquei mais bem servida com este último.
Bons trabalhos a todos! ▲ Collapse | | | Manuela Domingues Portugal Local time: 12:50 francês para português + ... CRIADOR(A) DO TÓPICO Expressisverbis | Dec 10, 2015 |
expressisverbis wrote:
e valem o que valem
Para documentos em pdf digitalizados e converter em Word:
http://www.onlineocr.net/
Para documentos em pdf não digitalizados e converter em Word e/ou noutros formatos:
http://www.zamzar.com/
Não fica uma beleza, mas pode ajudar.
Há um programa que testei e com o qual fiquei satisfeita que é o Foxit no que toca ao OCR. O Abbyy é porreiro, mas fiquei mais bem servida com este último.
Bons trabalhos a todos!
Obrigada pelas sugestões, mas posso dizer-lhe que nem com os dois sites que enviou eu consegui converter o documento. É um grande desespero! Estou a perder imenso tempo com o formato. A cliente até me sugeriu passar para word, mas depois acabou por me enviar outro original que lhe parecia melhor. No entanto, o documento em si é uma verdadeira dor de cabeça, porque tenho o espanhol de um lado (esquerdo) e o inglês do lado direito. Quando converto o documento, o inglês transforma-se em "chinês", e as imagens ficam cortadas, sendo que estamos a falar de um catálogo. Talvez por ter os programas pirateados, não consigo obter um documento word em condições, mas tal como disseram aqui, trata-se de um ficheiro morto. Mas aprendi que nunca mais voltarei a aceitar esse tipo de documento, sem analisar melhor o ficheiro, pois a tradução já não é paga conforme o valor do mercado, e este trabalho de formatação acaba por ser totalmente gratuito. Como já estou a enlouquecer, só vou mesmo traduzir. Obrigada a todos. | | | To report site rules violations or get help, contact a site moderator: You can also contact site staff by submitting a support request » CONVERSÃO PDF EM WORD CafeTran Espresso | You've never met a CAT tool this clever!
Translate faster & easier, using a sophisticated CAT tool built by a translator / developer.
Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools.
Download and start using CafeTran Espresso -- for free
Buy now! » |
| TM-Town | Manage your TMs and Terms ... and boost your translation business
Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.
More info » |
|
| | | | X Sign in to your ProZ.com account... | | | | | |