Blog

Quem tem medo de MT? Introdução ao tema

Republicação do texto da Michele Santiago para o número 1 da revista Metáfrase, de setembro de 2016.

 

Nenhuma tecnologia parece assustar e fascinar mais do que o processo de tradução automatizada de uma língua natural. Ela nasceu oficialmente em 1949, tendo por trás motivos como a necessidade de comunicação, importância militar e de inteligência governamental e a pesquisa. Tradução automática e computadores andam de mãos dadas. Com a evolução e a pesquisa contínua de tecnologias para tradução automática, outros produtos acabaram sendo desenvolvidos, como as ferramentas de tradução assistida por computador (TAC). Com o volume de informação aumentando cada vez mais, a tradução automática se mostra uma ferramenta cada vez mais útil para o tradutor.

 

Quem tem medo do tradutor automático? Tenho certeza de que, ao ler o título deste editorial, você sorriu ou franziu a sobrancelha. Você não ficou apático. Este é um assunto que amamos ou odiamos, defendemos ou atacamos, porque nenhuma tecnologia parece assustar e fascinar mais do que a tradução automática em nossa profissão, talvez pelo medo de sermos substituídos por um software ou pelo fascínio por ver uma máquina fazer algo tão complexo. E tão rápido! A busca pelo Tradutor Universal, quebrando a maior barreira de comunicação humana.

 

Se você tem medo de ser substituído pelo Google Tradutor ou se tem dúvida sobre como usar melhor a tecnologia a seu favor, este texto é para você. Nosso objetivo será apresentar um assunto complexo em miúdos, para que você possa tomar uma decisão informada, independentemente de amar ou odiar, e aproveitar a tecnologia a seu favor se assim decidir. Também queremos apresentar o assunto de forma prática, para que você possa aproveitá-lo imediatamente, porque tempo é dinheiro (contado em número de palavras traduzidas, obviamente).

 

Não podemos ignorar a tradução automática como ignoramos as CAT tools (ou ferramentas de tradução assistida por computador, que passaremos a tratar pela sigla traduzida – TAC), correndo o risco de ver o mesmo saldo, com ferramentas desenvolvidas para agências e não para tradutores. A tradução automática é o processo de tradução automatizada de uma língua natural, “sem a intervenção de tradutores humanos”, segundo definição do Google, estando inserida no campo de Aprendizagem de Máquina.

 

A tradução de machine translation como tradução automática pode ser problemática, por dar a ideia de que basta dar o texto para a máquina, apertar um botão e a tradução vai aparecer prontinha. Alguns tradutores preferem o termo “tradução de máquina”, que seria o mais preciso, ou tradução automatizada. Manteremos o termo consagrado de “tradução automática”, mas achamos importante essa ressalva.

 

Embora diversas tentativas tenham sido feitas desde o século XVII, quando foi produzido um documento que descrevia uma metalinguagem matemática que visava descrever o significado de frases escritas em qualquer língua, a história da tradução automática começa oficialmente em 1949, com a publicação de um documento sugerindo que computadores fizessem traduções. Os motivos por trás da tentativa de um sistema de tradução automática são muitos, incluindo motivos práticos (a necessidade de se comunicar com indivíduos cuja língua não dominamos), idealismo (a quebra de barreiras linguísticas), importância militar e de inteligência governamental, pesquisa pura (a compreensão dos mecanismos envolvidos e a limitação dos computadores) e, por último, motivos comerciais e econômicos (um produto com demanda comercial).

 

Algo que precisa ficar claro sobre essa tecnologia é que ela anda de mãos dadas com os computadores. Assim, conforme a tecnologia computacional evoluir, também evoluirá a tradução automática. Computadores menores e mais rápidos, além da computação em nuvem, permitiram que a tradução automática evoluísse para o estado atual, em que qualquer pessoa pode abrir o Google Tradutor e traduzir uma frase ou um website rapidamente ou encontrar uma lista de softwares pagos disponíveis para ter um tradutor automático off-line.

 

Com a evolução e a pesquisa contínua de tecnologias para tradução automática, outros produtos foram criados, quase que por acidente. É o caso das ferramentas de tradução assistida por computador (TAC), praticamente indispensáveis para tradutores hoje e, mais recentemente, de um dispositivo chamado Pilot que cabe em sua orelha e que foi apresentado por um americano apaixonado por uma francesa cuja finalidade é ultrapassar a barreira linguística. O projeto do Pilot foi lançado em uma campanha de crowdfunding e atingiu a meta em apenas 15 minutos. Permaneceu aberto por dois meses e conseguiu arrecadar 3.175% da meta: US$ 2.666.740 no total.

 

Esses números são importantes porque nos mostram o interesse e a necessidade por tradução automática, ainda mais quando cabem, literalmente, no bolso. A computação pequenina, dentro de um smartphone, também cabe aqui. Assim, o Google Tradutor pode acompanhar e traduzir a palavra escrita e a palavra ditada, usando reconhecimento de voz. Tudo sem a necessidade de pagamento, embora não seja gratuito, já que o usuário autoriza que as informações fornecidas para tradução sejam mantidas e armazenadas pelo Google.

 

A computação em nuvem também permitiu que outro uso da tradução automática fosse aplicado: a tradução instantânea de fotocópias, pela XeroxTM. O usuário introduz um documento na copiadora, seleciona os idiomas de partida e de chegada e recebe impresso o documento traduzido. Sem falar do Lilt, um programa on-line que combina a tradução automática a recursos de TAC, como previsão de texto (predictive typing), para acelerar a produtividade. Você provavelmente usa algum fruto da pesquisa de tradução automática sem se dar conta. Se quiser entender melhor como chegamos aqui, você pode ler a história completa da TA até 2010: http://ceur-ws. org/Vol-867/Paper17.pdf

 

Atualmente, há dois tipos de sistemas de tradução automática definidos com base na tecnologia usada pelo programa. Existem os Sistemas Baseados em Regras (Rule-Based Machine Translation), nos quais um conjunto de informações de morfologia, sintaxe e semântica é usado para gerar a tradução, e os Sistemas Empíricos (Corpus-Based), que extraem o conhecimento para traduzir automaticamente a partir de exemplos em um corpus bilíngue. Sistemas estatísticos (Statistical Machine Translation), que fazem a tradução com base em uma análise estatística do corpus bilíngue inserido no sistema, são sistemas empíricos. Eles foram a grande aposta na década de 1990, já que a Computação deu um salto, e também por se tratar de um sistema de tradução automática que não se apoiava em uma configuração extensa prévia (de regras), uma grande novidade na época.

 

No entanto, era preciso sair do esquema palavra por palavra do SMT e, assim, surgiram sistemas baseados em exemplos (Example-Based Machine Translation) ou baseados em modelos (Model-Based Machine Translation), nos quais o sistema faz uma análise semântica e sintática do texto de partida antes da tradução, e busca exemplos similares para escolher uma tradução (presente no corpus bilíngue) adequada. Também existem sistemas híbridos, que combinam regras e dados empíricos, usando bases de dados com traduções prévias para melhorar os resultados. É o caso do Google Tradutor e de alguns softwares disponíveis no mercado. Os sistemas de tradução automática podem ser uma ferramenta útil se determinadas condições forem atendidas e se soubermos aproveitar seu potencial.

 

A priori, textos denotativos e com vocabulário específico geralmente apresentam uma tradução com qualidade superior em comparação com textos de ficção. Contudo, também devemos considerar o tipo de sistema, e se as regras foram configuradas corretamente e/ou se o corpus bilíngue é de qualidade. Para saber mais detalhes de como cada sistema funciona, consulte http://nopr. niscair.res.in/bitstream/123456789/11057/1/ALIS%20 57(4)%20388-393.pdf. Sabemos que o volume de informação disponível na Web hoje é inimaginável, e só cresce. Tanto conteúdo precisa estar disponível a qualquer público, não há fronteiras na Internet. Algumas informações precisam estar disponíveis na velocidade de um click. Eis porque tanta gente usa tradução automática, pela tríade 1) baixo custo, 2) qualidade razoável/inteligível e 3) facilidade de uso.

 

No momento em que escrevo este artigo, as máquinas não se revoltaram, e a tradução automática não parece que nos deixará sem trabalho, mas o papel do tradutor já mudou. Não somos apenas tradutores, somos consultores da língua. Traduzimos, revisamos, fazemos pós-edição, oferecemos mais soluções do que o nome indica. Somos especialistas — no idioma, na cultura e no público-alvo do país em questão. Por isso, devemos nos perguntar: a tradução automática morde mesmo? Então por que o medo dessa tecnologia que pode nos ajudar? Ainda dá tempo de moldarmos a forma como trabalhamos com ela.

 

Quer contribuir para o blog? Envie-nos um e-mail para metafrase@abrates.com.br.

  • Tags:

Deixe um Comentário