Todo lo que le hubiese gustado saber sobre… UNL

Publicado el 12 Mar 2002

80135_38

Romper las barreras de los medios de comunicacin a nivel mundial era uno de los principales objetivos del nacimiento de Internet, que rpidamente se ha convertido en su primera razn de ser.

Pero como la tecnologa parece no conocer fronteras, internacionales, la intencin de los investigadores se centra en esos momentos, en romper tambin con las barreras idiomticas que impiden la comunicacin universal.

De este modo, el objetivo de satisfacer la creciente necesidad de utilizar Internet como un medio para la divulgacin cultural, la educacin y la expansin de los negocios, slo se encuentra con un freno en la actualidad, la diversidad lingstica.

Con la intencin de traspasar esta barrera, el Instituto de Estudios Avanzados (IAS) de las Naciones Unidas puso en marcha en 1996 el proyecto UNL (Universal Networking Language), con la participacin inicial de 15 lenguas.

La idea originaria, y los primeros fondos de financiacin privada, provienen de Japn, donde al frente del proyecto a nivel internacional se encuentra Hiro-shi Uchida, quien se encarg de buscar grupos en cada lengua que fueran capaces de desarrollar los componentes asociados a cada lengua, hasta localizar 15, entre los que se encuentran el ruso, el indi, rabe, portugus, espaol o francs, entre otros, explica Jess Cardeosa Lera, director del programa UNL de la universidad Politcnica de Madrid.

La idea en la que se basa todo el proyecto es la crear un idioma intermedio, para ordenadores, en el que se eliminen con la mayor precisin posible las ambigedades a las que los traductores tradicionales nos tienen acostumbrados, y que permitiera hacer el cambio a diferentes idiomas. Este idioma, sera el intermediario entre la lengua inicial y la traducida.

De este modo, este lenguaje nuevo que se crea para ordenadores representa los trminos, conceptos y relaciones de cualquiera de las lenguas existentes, resolviendo el problema de la ambigedad mediante la participacin humana que se encarga de traducir a mano cada una de las palabras del lenguaje inicial a UNL.

Cuando el director del proyecto lleg a Espaa para invitarnos a participar en este proyecto, relata Cardeosa, nos hizo responsables de los componentes de la lengua espaola. En ese momento haba dos esenciales el Diccionario Universal y el generador de espaola, al que en un primer momento se le dio la mayor prioridad, con lo que obtuvimos una primera versin del lenguaje UNL. En estos momentos todo esto se ha ido mejorando y ya existen tres versiones.

Para desarrollar el diccionario, el grupo espaol tuvo que crear 100.000 palabras universales, es decir, una palabra vlida en cualquier idioma, de este modo para gato, la palabra universal es cat en ingles, y el hecho de seleccionar los grafismos de esta lengua como intermediarios se debe a que existen en el mercado diccionarios en todas las lenguas, y si tiene que ser universal ha de ser transmisible a todas las dems. Pero a esta palabra se le aaden los acrnimos del lenguaje UNL, para asociar a las palabras informacin de tipo semntico. Los criterios que se siguieron para incluir la informacin semntica fueron la cobertura temtica, hicimos un estudio de temas del mundo mundial y tambin utilizamos el libro de las 12.000 palabras ms utilizadas por la lengua castellana.

Esta ha sido una labor que an no ha terminado, a pesar de que el grupo espaol ha conseguido introducir 300.000 pares, pero en nuestro idioma existen varios millones pero quin lo va a hacer?, se pregunta el responsable del proyecto en Espaa, porque nosotros no tenemos capacidad para eso. Por lo que el crecimiento en cuanto a lengua espaola tendr que llevarse a cabo a travs de colaboradores. El pasado ao llevamos una propuesta al Ministerio para implantarlo en los institutos y comenzar a producir UNL de forma masiva, pero no ha sido aprobada.

El verdadero beneficio de este desarrollo radica en ser multilinge masivamente y, sobre todo, en idiomas poco comunes.

UNL es un lenguaje artificial diseado para expresar la informacin contenida en frases de lenguaje natural a travs de un lenguaje independiente. Sus componentes esenciales son las palabras universales que representan conceptos vlidos para todas las lenguas, atributos, que pueden modificar el significado de las palabras universales, y las relaciones, que expresan la relacin semntica entre dos palabras.

Hay que tener en cuenta que en todo momento estamos hablando de una tecnologa abierta, cuya patente est en manos de las Naciones Unidas, y las especificaciones del lenguaje son pblicas y estn al alcance de cualquiera. La arquitectura bsica del sistema est compuesta por un generador de una lengua, junto con un analizador, un diccionario UNL y una base documental de UNL (que es donde realmente est escrito este cdigo).

El generador de la lengua y el diccionario UNL, forman el servidor de la lengua. Por otra parte se encuentran los editores UNL, que cada equipo ha desarrollado a su modo en base a su idioma origen, y estn compuestos por el diccionario y el analizador.

De una manera sencilla, a travs de los editores de cada idioma se genera el texto en el idioma destino. Los editores UNL tienen incluidos analizadores clsicos (sintctico, morfosintctico y lxico, entre otros). Estos sistemas ya existan en los mtodos comerciales de traduccin, por lo que algunos grupos simplemente los han integrado en sus editores, y a partir de ah solo es necesario un pequeo mdulo para convertir el resultado del anlisis en UNL.

Con toda la infraestructura en marcha, el proceso no es muy complicado. Los documentos escritos en un lenguaje natural se introduce en el editor de UNL. A partir de ah, los documentos se generan automticamente en tantas lenguas como generadores de idioma estn disponibles. Los generadores utilizan la base de documentos UNL, y estos registros se almacenan para permitir su reutilizacin tantas veces como sea necesario.

La tecnologa ya lo permite, ahora slo falta que las entidades gubernamentales estn verdaderamente concienciadas y preparadas para mejorar la comunicacin entre todos los pueblos del mundo y apoyen proyectos como ste, que incrementan exponencialmente el potencial de Internet.

¿Qué te ha parecido este artículo?

Tu opinión es importante para nosotros.

R
Redacción RedesTelecom

Artículos relacionados

Artículo 1 de 3