Skip to content
December 4, 2008 / ICL

Inter-professional Dialogue: Computational Linguistics | Diálogo interprofesional: lingüística computacional

Since translation, though considered more of an “art”, can actually be a mixture of various (scientific) techniques/technologies related to language (in our current times mostly related to computers), I thought of starting this “inter-professional dialogue” series with a Computational Linguistics’ expert, Mr. Harald Oertle, who graduated from the prestigious Computational Linguistics Department of the University of Stuttgart (in Germany).

1) In your professional experience, is translation automation, in regard to Machine Translation (MT), already a crucial tool in the translation industry or is it still years away from being so?

At the moment, only 1 % of sales volume inside the translation market results from “Machine Translation”. So, MT is not crucial up to now but it is expected that it gets more crucial / important in the future.

Reasons:

a) There are more and more digital texts (e.g. in the Internet) which also have to be translated frequently. It’s not realistic and cost-efficient to do this with human translators.

b) Additionally, Machine Translation (for spoken language) will be more relevant in the future — e.g. within automatic translation of digital audio files and (audio parts of) digital video clips (e.g. TV / radio news, interviews, lectures, …), which is not realistic to be carried out by human interpreters.

It is not easy to give a figure (how many years) because development in MT is a gradual process but the share of MT in the translation industry will increase steadily.

Sources:

http://de.wikipedia.org/wiki/
Maschinelle_%C3%9Cbersetzung


http://www.tc-star.org/
pubblicazioni/D17_HLT_DE.pdf

[Very interesting document (in German).]

2) If you are familiar with “controlled language” usage for technical documentation, since such kind of language is aimed at facilitating Machine Translation, could it affect negatively the freedom or even the quality of technical writing by imposing a rigid style of writing?

As a Computational Linguist I want to refer to the newest trend in technical documentation, which is “automatic text generation”. This is an area of Computational Linguistics / Artificial Intelligence. With such software systems, a text is generated automatically (with the help of a controlled language) on the basis of a non-textual form, i.e. a corporate knowledge base. Such a system can generate texts in different languages simultaneously (= multilingual text generation).

Sources:

http://www.doku.net/artikel/
dertechnis.htm


http://www.tekom.de/
index_neu.jsp?url=/servlet/
ControllerGUI?action=voll&id=766

3) As you are familiar with Translation Memory technology, do you consider the idea of a “globally” accessible translation memory database, or “global memory sharing”, as a useful resource or one that could cause, among other problems, copyright infringements?

If such a global translation memory will be provided, then the question raised will be who should manage the translation memory contents. Is every company / person allowed to edit the Translation Memory system? And which consequences will it have relating to quality if “everyone” can edit the global Translation Memory system? Moreover, it’s also a technical matter. I.e., it must be guaranteed that a lot of automatic requests can be processed simultaneously.

(I think that the resulting copyright infringements and other legal problems are especially a matter for attorneys).

4) In your professional experience, how would you compare the current technological development and advances between Germany and, for example, the USA (specifically, the Silicon Valley area)?

Since 2001, there are different orientations in Europe and USA in regards to language technology in general and Machine Translation in particular.
In the USA, research projects and the promotion of companies with focus on national security are dominant, whereas in the European Union research projects and companies with administrative or commercial focus are dominant (because of Europe’s multilingualism).

Source:

http://www.tc-star.org/
pubblicazioni/D17_HLT_DE.pdf

5) You are familiar with the German “spontaneous (automatic) speech translation” project called “Verbmobil”
(
http://en.wikipedia.org/
wiki/Verbmobil
):

Did this program achieve its objective?

Yes, it did. This project won the German Future Prize (Deutscher Zukunftspreis) in the year 2001, sponsored by German President (Bundespräsident).

Source:
http://de.wikipedia.org/wiki/
Deutscher_Zukunftspreis

Is this program already being used as a commercial application or software?

Yes, indirectly. Several products base upon verbmobil and several spin-off companies were founded.

Source:

http://www.3sat.de/3sat.php?


http://www.3sat.de/nano/
serien/26141/

Could it serve as a machine translation substitute for the kind of simultaneous translation that is usually carried out by a professional interpreter?

No. This translation system was a scientific demonstrator for a restricted application area (“date agreements” for two persons who do not speak the same language). But there are other similar commercial systems created by IBM.

Source:

http://domino.watson.ibm.com/
comm/research.nsf/pages/
r.uit.innovation.html

Dado que la traducción, aunque considerada más bien un “arte”, puede ser en realidad una mezcla de varias técnicas/tecnologías (científicas) relacionadas con el lenguaje (actualmente más que todo con la informática), pensé en iniciar esta serie de “diálogos interprofesionales” con un experto en lingüística computacional, el Sr. Harald Oertle, alemán que cursó sus estudios en el Departamento de Lingüística Computacional de la prestigiosa Universidad de Stuttgart (de Alemania).

1) Según su experiencia profesional, ¿se puede considerar ya la automatización de la traducción, concretamente en lo relacionado con la Traducción Automática (TA), una herramienta decisiva en la industria de la traducción o aún está a años luz de serlo?

Por el momento, solamente un 1 % del volumen de ventas del mercado de la traducción es el resultado de la TA, así que hasta ahora la TA no es decisiva, pero se estima que irá ganando más importancia en el futuro.

Razones:

a) Hay cada vez más textos digitales (por ejemplo, en Internet) que a menudo también tienen que ser traducidos. No es realista ni rentable llevar a cabo dichas traducciones recurriendo a traductores humanos.

b) Asimismo, la TA (en el caso del lenguaje hablado) tendrá más relevancia en el futuro. Por ejemplo, la TA de archivos digitales de audio y los segmentos de audio de los videoclips digitales (tales que noticias de la TV o la radio, entrevistas, conferencias, etc.), algo que tampoco es realista que lleven a cabo intérpretes humanos.

No es fácil proporcionar una cifra exacta (de cuántos años se tardará), ya que el desarrollo de la TA es un proceso gradual, pero el volumen de TA en la industria de la traducción irá creciendo de forma continua.

Fuentes:

http://de.wikipedia.org/wiki/
Maschinelle_%C3%9Cbersetzung


http://www.tc-star.org/
pubblicazioni/D17_HLT_DE.pdf

[Documento muy interesante (en alemán).]

2) Si está familiarizado con el uso del “lenguaje controlado” para la documentación técnica, dado que tal tipo de lenguaje tiene como objetivo facilitar la Traducción Automática, ¿puede ésta afectar negativamente la libertad o incluso la calidad de la redacción técnica al imponer un estilo rígido de redacción?

Como experto en Lingüística Computacional me gustaría hacer referencia a la más reciente tendencia en documentación técnica, la cual se conoce como “generación automática de textos”. Se trata de un campo de la Linguística Computacional y la Inteligencia Artificial. Mediante tal tipo de sistema de software se puede generar un texto de forma automática (con la ayuda del lenguaje controlado), a partir de segmentos que no son textos; por ejemplo, una base de conocimiento [información] corporativa. Tal sistema permite generar simultáneamente textos en varios idiomas (es decir, la generación de textos multilingües).

Fuentes:

http://www.doku.net/artikel/
dertechnis.htm


http://www.tekom.de/
index_neu.jsp?url=/servlet/
ControllerGUI?action=voll&id=766

3) Si está familiarizado con la tecnología de Memoria de Traducción (MT), ¿considera la idea de una base de datos de memorias de traducción accesible a escala “global”, o bien la idea de “compartir memorias [de traducción] globalmente”, un recurso útil o algo que podría acarrear, entre otros problemas, violaciones de los derechos de autor?

En caso de que se pueda llegar a proporcionar tal tipo de memoria de traducción global, la cuestión que ha de plantearse entonces es quién debe encargarse de administrar el contenido de dicha memoria de traducción: ¿podrá cada empresa/persona editar el sistema de memoria de traducción? ¿Qué consecuencias tendrá, en cuanto a la calidad, el hecho de que “todo el mundo” pueda editar el sistema de memoria de traducción global? Es más, también hay que tener en cuenta las cuestiones técnicas como, por ejemplo, garantizar que sea posible procesar simultáneamente un gran número de solicitudes automáticas.

(Creo que los problemas relacionados con la violación de los derechos de autor y demás problemas legales son cuestiones que debe resolver un abogado.)

4) Según su experiencia profesional, ¿cómo se comparan tanto el desarrollo, como los avances tecnológicos actuales entre Alemania y, por ejemplo, los Estados Unidos (concretamente, el área de Silicon Valley)?

Desde el año 2001, Europa y Estados Unidos han seguido diferentes tendencias en cuanto a la tecnología del lenguaje en general y en cuanto a la Traducción Automática concretamente. En los Estados Unidos han predominado los proyectos de investigación y el fomento de empresas dedicadas a la seguridad nacional, mientras que en Europa han predominado los proyectos de investigación y la empresas dedicadas a desarrollos administrativos o comerciales (debido al multilingüismo de Europa).

Fuente:

http://www.tc-star.org/
pubblicazioni/D17_HLT_DE.pdf

5) Dado que está familiarizado con el proyecto alemán de “traducción espontánea (automática) del lenguaje hablado” conocido como “Verbmobil” (véase
http://en.wikipedia.org/
wiki/Verbmobil
):

¿Considera que dicho programa logró su objetivo?

Sí, en efecto. Dicho proyecto ganó el premio alemán del futuro (“Deutscher Zukunftspreis”) en el año 2001 y recibió el patrocinio del presidente alemán (“Bundespräsident”).

Fuente:

http://de.wikipedia.org/wiki/
Deutscher_Zukunftspreis

¿Se utiliza dicho programa como aplicación o software comercial?

Sí, indirectamente. Se han creado muchos productos y algunas empresas derivadas a partir de “verbmobil”.

Fuente:

http://www.3sat.de/3sat.php?


http://www.3sat.de/nano/
serien/26141/

¿Podría dicho programa servir como sustituto de traducción automática en el caso de la traducción simultánea que generalmente lleva a cabo un intérprete profesional?

No. Este sistema de traducción se utilizó como un “demostrador” [vehículo de demostración] científico para un área de aplicación limitada (“fechas coincidentes” para dos personas que no hablan un mismo idioma). Pero se han creado sistemas similares que se han comercializado, por ejemplo, por IBM.

Fuente:

http://domino.watson.ibm.com/
comm/research.nsf/pages/
r.uit.innovation.html

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: