Crónica

 

Curso de tecnologías de la lengua en la UIMP

 

Language technology course at the UIMP

 

Toni Badia

 

_______________________________________________________________________________________

 

El curso «Tecnologies de la llengua: traducció automàtica i tractament de la parla»  («Tecnologías de la lengua: traducción automática y tratamiento del habla»), que se celebró en Barcelona el pasado mes de julio representó un paso importante en la difusión de las nuevas tecnologías aplicadas al lenguaje, tanto entre los estudiosos de la lingüística como entre el público en general. El curso, organizado en el marco de los cursos de verano que el Consorcio de la Universidad Internacional Menéndez Pelayo (UIMP) celebra en Barcelona, fue impulsado y patrocinado por el Ayuntamiento de Barcelona y el Forum Universal de las Culturas Barcelona 2004, y tuvo una difusión en los medios de comunicación como no lo suelen tener este tipo de eventos. La dirección del mismo corrió a cargo del profesor Marsal Gavaldà, de la Carnegie Mellon University (Pittsburgh, Estados Unidos) y la secretaría académica estuvo a cargo del autor de esta crónica.

_______________________________________________________________________________________

 

Varios son los aspectos dignos de reseñar. En primer lugar, los contenidos del curso, así como los profesores que los impartieron. En segundo, las sesiones de demostración de productos comerciales en el campo de las tecnologías de la lengua. Y, finalmente, el impacto que el curso tuvo entre el público asistente y en la sociedad en general. A cada uno de estos tres temas dedicamos los apartados que siguen.

 

Los contenidos

 

El curso estuvo dividido en cuatro grandes temas, a los que se dedicaron varias sesiones de conferencias, debates y demostraciones: el reconocimiento del habla, el procesamiento del lenguaje natural, la traducción automática y la síntesis de voz. Asimismo, en las mesas redondas se abordaron temas como el futuro de las tecnologías de la lengua, el papel de la Administración y la relación entre las tecnologías de la lengua y la aproximación cognitiva al lenguaje humano.

El primer tema, el reconocimiento del habla, estuvo a cargo de los profesores Alex Waibel de la Carnegie Mellon University (Pittsburgh, Estados Unidos) y José Mariño de la Universitat Politècnica de Catalunya (UPC). El profesor Mariño, en su primera lección sobre «Producción, percepción y codificación del habla», trató de la producción y percepción del habla, así como de los diferentes modos de representación del la misma, para terminar centrándose en el procesamiento digital de la señal acústica. De este modo, estaban sentadas las bases para su segunda lección, sobre «Descodificación de la señal acústica», que abordó la cuestión de cómo se plantea actualmente el reconocimiento del habla; en este contexto, presentó varias técnicas ampliamente usadas: los modelos ocultos de Markov para representar un modelo acústico, los modelos estocásticos (con variación de N-gramas) como modelos de lenguaje, y finalmente algoritmos de búsqueda, como el de Viterbi. Por su parte, el profesor Waibel ofreció una lección sobre «Sistemas completos de reconocimiento del habla». En ella discutió las características básicas de estos sistemas (dependencia o independencia en relación con el hablante; reconocimiento de palabras aisladas de habla continua o de habla espontánea; tamaño del vocabulario, etc.). Asimismo comentó los usos principales de los sistemas de reconocimiento del habla (dictado, traducción automática, reconocimiento de órdenes habladas, sistemas de conversación). Finalmente, presentó el sistema experimental C-Star de intercomunicación multilingüe usuario-ordenador. Este sistema, en el que, por ejemplo, un usuario angloparlante puede consultar una base de datos o un informador alemán a través del teléfono y en tiempo real, ejemplifica lo que realmente puede hacerse hoy en día en el campo del reconocimiento del habla, así como en síntesis de voz y en traducción automática.

El tema del procesamiento del lenguaje natural fue impartido por los profesores Hans Kamp de la Stuttgart Universität (Alemania), Horacio Rodríguez de la UPC y Sergi Balari de la Universitat Autònoma de Barcelona (UAB). El profesor Rodríguez  presentó, en «Análisis morfosintáctico y tagging», las técnicas que han ido imponiéndose en los últimos años como más adecuadas y robustas para tratar automáticamente texto libre o no restringido. En este sentido, presentó las técnicas usuales (lingüísticas, estadísticas e híbridas) de tratamiento de la morfología, de resolución de las ambigüedades morfológicas y de análisis sintáctico superficial. Para finalizar, se refirió a los aspectos en que es necesario investigar todavía (segmentación de frases, reconocimiento de nombres propios, compuestos o palabras desconocidas, extracción de relaciones sintácticas...). Por su parte, el profesor Sergi Balari, en su lección «Gramáticas y parsing», presentó los problemas computacionales que conlleva el procesamiento del lenguaje natural. Así, partiendo del concepto de gramática (tal y como lo define la teoría de los lenguajes formales) y de las estrategias habituales de parsing, repasó los problemas computacionales que se tienen que resolver para llevar a cabo exitosamente el procesamiento automático del lenguaje. Por último, el profesor Hans Kamp impartió una lección sobre «Análisis semántico y del discurso». En primer lugar, abordó el tema de la interpretación semántica de las expresiones lingüísticas; en este contexto destacó la importancia del principio de composicionalidad, y trató de la resolución de la anáfora y de la elipsis. A continuación discutió los aspectos generales de la representación del conocimiento y del razonamiento lógico, que están íntimamente relacionados con el tratamiento de la semántica. Y finalmente mostró los planteamientos más recientes sobre el análisis del discurso.

La traducción automática contó con los profesores Hiroshi Uchida de la Universidad de las Naciones Unidas (Tokio, Japón), Arturo Trujillo (Vocalis plc) y J. Gabriel Amores de la Universidad de Sevilla. El profesor Trujillo, en su lección «Fundamentos de la traducción automática», describió algunos aspectos básicos de la estructura interna de los sistemas de traducción automática. Tras una breve introducción histórica, presentó las estrategias básicas que se suelen adoptar al construir un sistema de traducción automática (traducción directa, traducción basada en la transferencia, traducción basada en una interlingua y traducción basada en ejemplos). Asimismo expuso algunos aspectos esenciales del proceso de generación de un texto, que son relevantes tanto para traducción automática (en la generación del texto en lengua meta) como para la producción autónoma de un texto; en este sentido trató de la planificación del contenido, de la modelización del usuario, de pragmática, de gramáticas de generación y de la selección léxica. El profesor Amores presentó una lección sobre «Sistemas completos de traducción automática». En ella discutió los aspectos más externos de estos sistemas, presentándolos sobre todo desde la perspectiva del usuario. Así, hizo referencia a la distinción, generalmente aceptada hoy en día, entre sistemas de traducción automática y entornos de traducción asistida; y a las características específicas de los textos que un sistema puede tratar satisfactoriamente (dentro de un dominio especializado, o para el lenguaje general). En este contexto, señaló la importancia creciente de los llamados lenguajes controlados, que facilitan que los sistemas de traducción automática actúen con mejores resultados (ya que se enfrentan con textos que no sobrepasan ciertos límites, tanto sintácticos como léxicos). Finalmente se refirió al proceso de traducción mediante un sistema de traducción automática, y especialmente a los tres momentos de participación del usuario: en la preparación del texto (preedición), durante el proceso mismo de la traducción y en la corrección de los resultados obtenidos (postedición). Por su parte, el profesor Uchida dio una lección sobre «The Universal Networking Language», un proyecto de gran envergadura auspiciado por las Naciones Unidas. Se trata de construir un sistema de representación de contenidos que pueda actuar como interlingua en el proceso de traducción entre cualquier par de lenguas de las tratadas. Para ello, se trabaja en una doble dirección: en la elaboración del sistema de representación abstracta, y en las gramáticas de conversión (o traducción) de los textos de cada lengua a la representación abstracta (y viceversa). En el desarrollo del proyecto, se da clara preferencia a las lenguas con más hablantes en el mundo.

El último tema básico del curso, la síntesis de la voz, contó con la exposición del profesor Alan Black (Carnegie Mellon University, Pittsburgh, EUA). El profesor Black explicó en su exposición los aspectos más básicos de la producción automática de habla. En primer lugar hizo hincapié en las maneras más comúnmente aceptadas de procesar los sonidos: combinaciones de formas, de un sonido, de dos sonidos..., y el uso de algoritmos (como los modelos ocultos de Markov). También trató de los modelos prosódicos que se suelen usar para dar cuenta de factores como el acento prosódico, la combinación duración-intensidad del sonido, etc. En este sentido presentó las ventajas que comporta trabajar mediante corpus de producciones reales para elaborar de manera fehaciente estos modelos de lenguaje. Finalmente, se refirió al lenguaje de marcación SABLE que permite controlar el output de un proceso de producción fónica.

Un aspecto digno de reseñar también fueron las dos mesas redondas celebradas durante el curso, que permitieron discutir algunos aspectos colaterales de las tecnologías de la lengua: el futuro de este tipo de investigación y sus aplicaciones, y el papel de la administración en este campo. En la primera, en que intervinieron los profesores Maria Antònia Martí de la Universitat de Barcelona (UB), Horacio Rodríguez y Arturo Trujillo, así como quien suscribe esta crónica y Marsal Gavaldà, que actuó de moderador, se discutió sobre las perspectivas de futuro de las tecnologías de la lengua, tanto desde la vertiente investigadora como desde la aplicada; y se comentaron las diferencias existentes en la iniciativa privada y la financiación pública entre Estados Unidos de América y los países de la Unión Europea. La segunda mesa redonda, que contó con la participación de los profesores Núria Bel de la UB, Hans Kamp y Francisco A. Marcos-Marín, de la Universidad Autónoma de Madrid (UAM) y director académico del Instituto Cervantes, trató sobre el papel de las administraciones públicas en el impulso en este campo. Cada uno de los tres participantes conocía un nivel de la Administración: Hans Kamp había intervenido en proyectos europeos y de colaboración entre Europa y América; Francisco A. Marcos-Marín, como responsable del Instituto Cervantes, hace lo propio en los proyectos de la Administración del Estado español, y Núria Bel ha participado en los trabajos del comisionado para la sociedad de la información de la Generalitat de Catalunya. Los tres, cada uno desde su punto de vista particular, insistió en la necesidad del compromiso por parte de las administraciones en la promoción de las investigaciones en el área de las tecnologías de la lengua.

 

La participación de empresas en las sesiones de demostración

 

Como se ha indicado, las lecciones fueron complementadas por dos sesiones de demostraciones, que permitieron a los asistentes hacerse una idea del estado real de la tecnología en que revierten los estudios teóricos presentados. Las dos sesiones de demostración estuvieron dedicadas, respectivamente, a reconocimiento y producción de voz, y a procesamiento de texto y traducción automática.

En la primera, dedicada al tratamiento del habla, se contó con la participación de dos empresas y un grupo de investigación aplicada de la UPC. Ambas empresas, Dragon Systems y Philips, presentaron sus sistemas de reconocimiento de voz, que comercializan en forma de dictáfonos. Ambos sistemas comprenden las dos utilidades de escribir al dictado y de poder recibir comandos orales. Por su parte, el grupo de investigación de la UPC mostró un sistema de consulta telefónica de valores de bolsa, que han desarrollado para una institución financiera; una característica importante del sistema es que se encarga de recibir y transmitir datos diferentes cada día, en función de las variaciones que se producen en el mercado.

La segunda sesión de demostración estuvo dedicada fundamentalmente a sistemas de traducción automática, con alguna muestra de trabajos en procesamiento del lenguaje natural. En ella intervinieron algunas de las empresas afincadas en Barcelona que se dedican a este campo. En primer lugar, el representante de la empresa Ampersand presentó el producto de traducción asistida que su empresa comercializa (Déjà vu). En su presentación señaló las diferencias, desde el punto de vista del usuario, entre los entornos de traducción asistida y los sistemas de traducción automática; mostró las ventajas que los primeros tienen respecto a los segundos, e indicó cuáles van a ser las mejoras que se van a ir incorporando en ellos en el futuro inmediato. A continuación, los representantes de Incyta presentaron su sistema de traducción del castellano al catalán (que se usa para traducir diariamente el diario El Segre de Lleida y región); se trata de un sistema clásico de traducción por transferencia (derivado del antiguo sistema Metal, desarrollado por Siemens); y en la mayoría de las ocasiones se accede a su uso a través de Internet, de manera que la traducción se realiza en un servidor centralizado residente en la sede de Incyta. La demostración siguiente mostró una manera distinta de abordar un problema semejante: los representantes de El Periódico presentaron el sistema que se usa diariamente para la traducción del diario del castellano al catalán; se trata de un producto desarrollado por la empresa SoftLibrary, que aprovecha las funcionalidades actuales en términos de indexación y acceso a la información para proporcionar, en unos tiempos muy reducidos, propuestas de traducción que luego un equipo de posteditores se encarga de validar o corregir; el sistema está totalmente integrado en el entorno computarizado de producción del diario. Seguidamente la empresa Sail-Labs mostró uno de los sistemas de traducción automática que han desarrollado; se trata de uno de una serie de productos que están desarrollando como sistemas de traducción automática completos para distintos pares de lenguas, que se comercializan autónomamente para ser instalados en PC en el entorno Windows; son sistemas clásicos de traducción automática por transferencia, herederos también del antiguo sistema Metal, que presentan una muy cuidada interfaz con el usuario (facilidad de gestión del léxico, posibilidad de interacción con memorias de traducción, etc.). A continuación, el profesor Amores presentó el sistema de traducción automática EngSpan-SpanEng, desarrollado por la PAHO (Organización Panamericana de la Salud); este sistema, relativamente antiguo ya, ha ido mejorando con el tiempo, especialmente en cuanto a la amigabilidad del entorno y a la interfaz con el usuario, de manera que su última versión funciona en el entorno Windows y permite un cierto grado de adaptación a los requisitos específicos de cada usuario. Finalmente, un representante del equipo de investigación en tratamiento del lenguaje natural de la UPC presentó alguno de los productos en que han estado trabajando últimamente: un diccionario multilingüe y un paquete de herramientas para el marcaje de textos catalanes.

 

El impacto del curso

 

Como se ha visto en los apartados anteriores, el curso contó con un programa de alto nivel, con la participación de numerosos investigadores, tanto catalanes y españoles como extranjeros. Sin duda, este hecho contribuyó a la importante participación de estudiantes con que contó: una matrícula de algo más de 50 estudiantes para un tema tan especializado como el del curso resulta altamente significativo. La gran mayoría de asistentes eran estudiantes de doctorado o investigadores de los grupos de investigación de las universidades catalanas o de las empresas privadas dedicadas a este campo.

La oferta de formación de tercer ciclo (es decir, posterior a la licenciatura o ingeniería) existente en Cataluña en este campo es relativamente reducida. Por una parte, se ofrecen grupos de asignaturas sobre este campo en algunos programas de doctorado más generales, como los de los departamentos de Teoría de señal y comunicaciones y de Lenguajes y sistemas informáticos, el del Departamento de Lingüística general de la UB, el de los departamentos de Filología catalana y española de la UAB, o el del Institut de Lingüística Aplicada de la UPF. Por otra parte, departamentos de la UAB, la UB, la UPF y la Universitat Rovira i Virgili (URV) ofrecen un doctorado en Ciencia cognitiva y lenguaje, con un número importante de asignaturas dedicadas al procesamiento del lenguaje natural y a las tecnologías de la lengua. Pues bien, muchos de los asistentes al curso eran estudiantes, o antiguos estudiantes, de estos programas. Ello muestra indudablemente el interés que el curso tuvo a nivel científico: al tratarse de un curso de presentación general, relativamente panorámica, de los distintos aspectos que intervienen en el campo de las tecnologías de la lengua, los especialistas en cada aspecto concreto pueden tener (de hecho demostraron tener) interés en la visión general. Así pues, el curso tuvo una clara repercusión entre las personas que trabajan en esta área.

Un segundo nivel de impacto del curso fue el de los medios de comunicación. La celebración de una rueda de prensa durante el curso, y la presentación en la misma del prototipo C-Star de intercomunicación multilingüe usuario-ordenador, tuvieron como consecuencia la presencia de las tecnologías de la lengua en los diarios y emisiones de radio de aquellos días. Como éste no es un hecho habitual, merece la pena constatar que durante aquellos días (y las dos semanas siguientes) el tema de la tecnología lingüística estuvo más presente que nunca en los medios de comunicación.

Finalmente, debemos subrayar la importancia que tuvo el acto de clausura del curso, que contó con la participación del alcalde de Barcelona, Joan Clos, e investigadores en campos afines al de las tecnologías de la lengua: los profesores Jaume Bertranpetit de la UPF, Manuel García-Carpintero de la UB y Josep M. Vendrell de la UAB. En una mesa redonda muy dinámica, presidida por Joan Clos, se debatió intensamente sobre la relación de las investigaciones y aplicaciones en tecnología lingüística con los trabajos de la aproximación pluridisciplinaria al lenguaje humano desde una perspectiva cognitiva. Cada uno de los profesores mencionados presentó la perspectiva de su aproximación al lenguaje humano: Jaume Bertranpetit desde la vertiente biológica y antropológica, Manuel García-Carpintero desde los aspectos cognitivos más generales aportados por la filosofía, y Josep M. Vendrell desde su actividad como investigador de los trastornos lingüísticos. Este acto mostró, por una parte, el interés de las autoridades municipales por el campo de las tecnologías de la lengua y, por otra, las grandes posibilidades que existen de interacción entre los distintos campos que estudian el lenguaje humano (en todas sus vertientes, desde las más teóricas hasta las más prácticas).

A modo de conclusión, podemos afirmar que el tema de la tecnología aplicada al tratamiento lingüístico resulta de interés para la sociedad catalana en general. Asimismo, el curso de la Universidad Internacional Menéndez Pelayo constituyó un punto de encuentro para los investigadores en tecnología lingüística de los distintos grupos de investigación públicos o privados, de manera que en los debates posteriores a las sesiones o en las mesas redondas se puso de manifiesto la utilidad de intercambiar experiencias y establecer vínculos. Desde aquí señalamos este interés y reiteramos la conveniencia de que este curso se siga celebrando en los próximos años.

 

Toni Badia

Profesor de lingüística computacional en la Universitat Pompeu Fabra (Barcelona). Sus intereses de investigación se centran en la descripción formal del lenguaje y en su tratamiento automático, especialmente en las dimensiones sintáctica y semántica. Ha trabajado en el desarrollo de diferentes proyectos de investigación, básica y aplicada, de traducción automática y lingüística computacional.

toni.badia@trad.upf.es