Industry guru Dave Taylor answers free tech support questions about a wide variety of business and technical topics, including blogging, Google AdSense, MySpace, Sony PSP, Apple iPod, Mp3 players, management, Linux, SEO, Mac OS X, Facebook, Twitter, LinkedIn and Microsoft Windows.

Is machine translation as good as a native-language translator?

I've been assigned to convert some of our documentation and marketing collatoral into French for entry into the European market and am thinking that we can save a lot of money by just using a computer-based translation system. They're supposed to be quite good. Before I do, can you explain exactly how machine language translation works and whether it's as good as hiring a native language translator?


Dave's Answer:

I believe that it will always be the case that a native-language human translator with expertise in both the source and target language will do a superior job to even the most expensive and fanciest machine translator. But I didn't want to just share my opinion, so I asked a professional translator, Amadou M. Sall, who has been working both as a translator and cross-cultural communication strategist for over 35 years, and here's what he had to share:

Let's try Wikipedia for a good, not too technical description: "Machine translation, sometimes referred to by the acronym MT, is a sub-field of computational linguistics that investigates the use of computer software to translate text or speech from one natural language to another."

For many years, machine translation, in particular online free services like Altavista, Babelfish, Systran, Yahoo, Google, etc. has been the favorite subject of (human) translators jokes.

Kaija Poysti gives this example on "Globalization blog": "My very old favourite is the MT system which translated the biblical sentence 'The flesh is weak but the sprit lasts' into Russian as 'The steak is rotten but the vodka is good' on the days before
Glasnost"

In the specialized literature you sometimes encounter expressions such as "60% or 80% accuracy, etc." What do these figures mean and how can one measure "accuracy" so precisely? The answer can be that when a machine translates a text, it "cuts it up" into units. So all you have to do is count the units and see which ones are accurately translated.

The closer the translation is to 100%, the better. Of course as we all know even human translation is not always 100% accurate!

Now, the question is: can machine translation replace human translation?

The more "scientific" a text, the easier it will be to translate with MT. Literary texts, in particular poetry, present an insurmountable challenge to MT.

The hitherto almost unanimously negative answer to our question is now being re-examined in light of truly impressive new developments in machine language translation technology. US Army researchers are now talking of aiming for 90% accuracy.

The best we have now in the translation industry is Jeff Allen's MT PE Method (Machine Translation + Postediting) i.e. , first using MT then having it postedited by very good translators. With this method, a translator can work 3 to 4 times faster - for example translate 8400 words instead of the normal 2400 words per day (see Jeff Allen's exhaustive compilation of articles, books, theses, dissertations and other documents on the topic). His method is also successfully used by Spanish translator Lorena Guerra.

So, if you want to combine MT speed with a good human translator's accuracy, use MT PE!

[[ To demonstrate what we're talking about here, I asked Amadou to offer up two translations of his answer, one with Google Translator as an example of the state of the art in machine translation, and one with him manually translating the material. If you speak French, you can assess the differences yourself... ]]

Google Translate

Essayons Wikipedia pour un bien, pas trop technique: "La traduction automatique, parfois désignée par l'acronyme MT, est un sous-domaine de la linguistique computationnelle qui mène des enquêtes sur l'utilisation de logiciels pour traduire du texte ou d'un discours en langue naturelle à l'autre ».

Pendant de nombreuses années, de la traduction automatique, notamment des services gratuits en ligne, comme Altavista, Babelfish, Systran, Yahoo, Google, etc a été le sujet favori des traducteurs (humain) des plaisanteries.

Kaija Poysti donne cet exemple sur le thème "Mondialisation blog": "Mon très vieux favori est le système de MT, qui a traduit la phrase biblique" La chair est faible mais l'esprit dure en russe «Le steak est pourrie mais la vodka est bonne' Jours avant la Glasnost »

Dans la littérature spécialisée vous rencontrent parfois des expressions telles que "60% ou 80% de précision, etc" Qu'est-ce que ces chiffres signifient et comment peut-on mesurer la "précision" de manière précisément? La réponse peut être que quand une machine traduit un texte, il "coupes it up" en unités. Donc, tout ce que vous avez à faire est de compter les unités et de voir quels sont ceux qui sont fidèlement traduits.

La traduction la plus proche est à 100%, mieux c'est. Bien sûr, comme nous le savons tous, même la traduction humaine n'est pas toujours précis à 100%!

Maintenant, la question est: peut-MT remplacer la traduction humaine?

La quasi-unanimité jusqu'ici réponse négative à notre question est actuellement réexaminée à la lumière des nouveaux développements vraiment impressionnante dans la technique MT. US Army chercheurs parlent maintenant de viser 90% de précision.

Le mieux que nous avons maintenant dans l'industrie de la traduction est Jeff Allen's PE Méthode MT (Machine Translation +

Post édition) c'est-à-dire, la première en utilisant MT ayant alors il postedited par de très bons traducteurs. Avec cette méthode, un traducteur peut travailler 3 à 4 fois plus rapide - par exemple traduire 8400 mots au lieu de la normale 2400 mots par jour (voir Jeff Allen http://www.geocities.com/mtpostediting compilation exhaustive d'articles, de livres, de thèses , Les thèses et autres documents sur le sujet). Sa méthode est également utilisée avec succès par le traducteur espagnol Lorena http://www.sceuromix.com/ Guerra.

Manual Translation

Essayons Wikipedia pour une bonne description, pas trop technique: "La traduction automatique, parfois appelée TA, est un sous-domaine de la linguistique computationnelle qui fait des recherches sur l'utilisation de logiciels pour la traduction d'un texte ou d'un discours d'une langue naturelle à l'autre ».

Pendant de nombreuses années, la traduction automatique, notamment des services gratuits en ligne, comme Altavista, Babelfish, Systran, Yahoo, Google, etc a constitué un sujet de plaisanterie favori pour les traducteurs (humains).

Kaija Poysti donne l'exemple suivant dans «Globalization blog» : «Mon exemple favori, qui date de longtemps, est le système de TA, qui a traduit la phrase biblique "La chair est faible mais l'esprit est eternel" en russe par "Le steak est pourri mais la vodka est bonne", dans la période d'avant la Glasnost.»

Dans la littérature spécialisée on rencontre parfois des expressions telles que "60% ou 80% de précision, etc". Qu'est-ce que ces chiffres signifient et comment peut-on mesurer la "précision" d'une manière si précise? Réponse possible à cette question : quand une machine traduit un texte, elle le "découpe" en unités. Il ne vous reste donc plus qu'à compter les unités et voir celles sont fidèlement traduites.

Plus la traduction est proche de 100% mieux elle est. Bien sûr, comme nous le savons tous, même la traduction humaine n'est pas toujours précise à 100%!

Maintenant, la question qui se pose est: est-ce que la TA peut remplacer la traduction humaine?

Plus un texte est «scientifique», plus il sera facile à traduire avec la TA. Les textes littéraires, la poésie en particulier, présentent un défi insurmontable à la TA.

La réponse jusqu'ici quasi-unanimement négative à notre question est actuellement en train d'être réexaminée à la lumière des nouvelles évolutions techniques vraiment impressionnantes en matière de TA. Les chercheurs de l'armée américaine déclarent maintenant avoir pour objectif une précision de 90%.

Actuellement, ce qu'il y a de mieux dans l'industrie de la traduction c'est la méthode de Jeff Allen (TA + PR ou Traduction Automatique + «Post Relecture») c'est-à-dire, utilisation préalable de la Traduction Automatique suivie de «post relecture» par de très bons traducteurs. Avec cette méthode, un traducteur peut travailler 3 à 4 fois plus vite - par exemple traduire 8400 mots par jour au lieu de 2400 (vitesse normale de traduction) (voir Jeff Allen http://www.geocities.com/mtpostediting/, une compilation exhaustive d'articles, de livres, de thèses et autres documents sur le sujet). Sa méthode est également utilisée avec succès par la traductrice espagnole Lorena Guerra http://www.sceuromix.com/.

Amadou M.Sall is a 35+ year veteran translator, strategic cross-cultural communication and marketing coach and consultant very active on the online networking scene. He is the founder of the Translator Power Network (Translator Power blog, Translator Power Social Networking site for Translators, Translator Power website) and also runs a Translation Agency called Translation Trophy.


Help others find this article at Del.icio.us, Digg, Netscape, Reddit, and Simpy.

Subscribe!

Never miss another useful Q&A article again! Subscribe to AskDaveTaylor with Google Reader.

Comments

I completely agree with Amadou. If you don't want to take our word for it do a test yourself. Even if you don't speak a foreign language do this.

1. Take an English sentence.
2. Put it through a free Machine Translation tool into any foreign language.
3. Now copy and paste it and translate it back to English.
4. be amazed by how horrible and far away from the original message that new English sentence is. Now obviously it will be slightly less horrible on the first translation into the foreign language but this gives you an idea of what to expect.

Additionally if it is slightly off on a simple and straight forward sentence then imagine how far off it would if it were a complicated one that had implied meaning, words with multiple meanings or technical terms.

Posted by: Chica at January 21, 2008 12:44 AM

I have a lot to say, but ...
Starbucks coffee cup I have a lot to say, and questions of my own for that matter, but most of all I'd like to say thank you for all your efforts on this Web site by buying you a chai!

I do have a comment, now that you mention it!









Remember personal info?


Please note that I will never send you any unsolicited commercial email. Ever.

While I'm at it, please note that by submitting a question or comment you're agreeing to my terms of service, which are: you relinquish any subsequent rights of ownership to your material by submitting it on this site.









Search
Find just the answers you seek from among our 1700+ free tech support articles by using our Lijit search engine.


Help!





Subscribe to
Ask Dave Taylor!

Add to Google Reader
Add to My Yahoo!
Subscribe in NewsGator Online

RDF   XML

Free Updates!
Sign up and get free weekly updates and special offers on books, seminars, workshops and more.


Recent Entries
Join the List!
Join my author info mailing list, where you'll learn about my upcoming books, speaking gigs, and more!


Book Links
© 2002 - 2008 by Dave Taylor. All Rights Reserved.

Note: This web site is for the purpose of disseminating information for educational purposes, free of charge, for the benefit of all visitors. We take great care to provide quality information. However, we do not guarantee, and accept no legal liability whatsoever arising from or connected to, the accuracy, reliability, currency or completeness of any material contained on this web site or on any linked site.

[whiteboard marker tray]