Crónica
Curso
de tecnologías de la lengua en la UIMP
Language
technology course at the UIMP
Toni Badia
_______________________________________________________________________________________
El curso «Tecnologies de la
llengua: traducció automàtica i tractament de la parla» («Tecnologías de la lengua: traducción
automática y tratamiento del habla»), que se celebró en Barcelona el pasado mes de julio representó un paso
importante en la difusión de las nuevas tecnologías aplicadas al lenguaje,
tanto entre los estudiosos de la lingüística como entre el público en general.
El curso, organizado en el marco de los cursos de verano que el Consorcio de la
Universidad Internacional Menéndez Pelayo (UIMP) celebra en Barcelona, fue
impulsado y patrocinado por el Ayuntamiento de Barcelona y el Forum Universal
de las Culturas Barcelona 2004, y tuvo una difusión en los medios de
comunicación como no lo suelen tener este tipo de eventos. La dirección del
mismo corrió a cargo del profesor Marsal Gavaldà, de la Carnegie Mellon
University (Pittsburgh, Estados Unidos) y la secretaría académica estuvo a
cargo del autor de esta crónica.
_______________________________________________________________________________________
Varios son los aspectos
dignos de reseñar. En primer lugar, los contenidos del curso, así como los
profesores que los impartieron. En segundo, las sesiones de demostración de
productos comerciales en el campo de las tecnologías de la lengua. Y,
finalmente, el impacto que el curso tuvo entre el público asistente y en la
sociedad en general. A cada uno de estos tres temas dedicamos los apartados que
siguen.
El curso estuvo dividido
en cuatro grandes temas, a los que se dedicaron varias sesiones de
conferencias, debates y demostraciones: el reconocimiento del habla, el
procesamiento del lenguaje natural, la traducción automática y la síntesis de
voz. Asimismo, en las mesas redondas se abordaron temas como el futuro de las
tecnologías de la lengua, el papel de la Administración y la relación entre las
tecnologías de la lengua y la aproximación cognitiva al lenguaje humano.
El primer tema, el
reconocimiento del habla, estuvo a cargo de los profesores Alex Waibel de la
Carnegie Mellon University (Pittsburgh, Estados Unidos) y José Mariño de la Universitat Politècnica de Catalunya (UPC). El profesor Mariño, en su primera lección sobre
«Producción, percepción y codificación del habla», trató de la producción y
percepción del habla, así como de los diferentes modos de representación del la
misma, para terminar centrándose en el procesamiento digital de la señal
acústica. De este modo, estaban sentadas las bases para su segunda lección,
sobre «Descodificación de la señal acústica», que abordó la cuestión de cómo se
plantea actualmente el reconocimiento del habla; en este contexto, presentó
varias técnicas ampliamente usadas: los modelos ocultos de Markov para
representar un modelo acústico, los modelos estocásticos (con variación de
N-gramas) como modelos de lenguaje, y finalmente algoritmos de búsqueda, como
el de Viterbi. Por su parte, el profesor Waibel ofreció una lección sobre
«Sistemas completos de reconocimiento del habla». En ella discutió las
características básicas de estos sistemas (dependencia o independencia en
relación con el hablante; reconocimiento de palabras aisladas de habla continua
o de habla espontánea; tamaño del vocabulario, etc.). Asimismo comentó los usos
principales de los sistemas de reconocimiento del habla (dictado, traducción
automática, reconocimiento de órdenes habladas, sistemas de conversación).
Finalmente, presentó el sistema experimental C-Star de intercomunicación
multilingüe usuario-ordenador. Este sistema, en el que, por ejemplo, un usuario
angloparlante puede consultar una base de datos o un informador alemán a través
del teléfono y en tiempo real, ejemplifica lo que realmente puede hacerse hoy
en día en el campo del reconocimiento del habla, así como en síntesis de voz y
en traducción automática.
El tema del procesamiento
del lenguaje natural fue impartido por los profesores Hans Kamp de la Stuttgart
Universität (Alemania), Horacio
Rodríguez de la UPC y Sergi Balari de la Universitat Autònoma de
Barcelona (UAB). El profesor
Rodríguez presentó, en «Análisis
morfosintáctico y tagging», las
técnicas que han ido imponiéndose en los últimos años como más adecuadas y
robustas para tratar automáticamente texto libre o no restringido. En este
sentido, presentó las técnicas usuales (lingüísticas, estadísticas e híbridas)
de tratamiento de la morfología, de resolución de las ambigüedades morfológicas
y de análisis sintáctico superficial. Para finalizar, se refirió a los aspectos
en que es necesario investigar todavía (segmentación de frases, reconocimiento
de nombres propios, compuestos o palabras desconocidas, extracción de
relaciones sintácticas...). Por su parte, el profesor Sergi Balari, en su
lección «Gramáticas y parsing», presentó
los problemas computacionales que conlleva el procesamiento del lenguaje
natural. Así, partiendo del concepto de gramática (tal y como lo define la teoría
de los lenguajes formales) y de las estrategias habituales de parsing, repasó los problemas computacionales
que se tienen que resolver para llevar a cabo exitosamente el procesamiento
automático del lenguaje. Por último, el profesor Hans Kamp impartió una lección sobre «Análisis semántico y del discurso». En primer
lugar, abordó el tema de la interpretación semántica de las expresiones
lingüísticas; en este contexto destacó la importancia del principio de
composicionalidad, y trató de la resolución de la anáfora y de la elipsis.
A continuación discutió los aspectos generales de la representación del conocimiento
y del razonamiento lógico, que están íntimamente relacionados con el
tratamiento de la semántica. Y finalmente mostró los planteamientos más
recientes sobre el análisis del discurso.
La traducción automática
contó con los profesores Hiroshi Uchida de la Universidad de las Naciones
Unidas (Tokio, Japón), Arturo Trujillo (Vocalis plc) y J. Gabriel Amores
de la Universidad de Sevilla. El profesor Trujillo, en su lección «Fundamentos
de la traducción automática», describió algunos aspectos básicos de la
estructura interna de los sistemas de traducción automática. Tras una breve
introducción histórica, presentó las estrategias básicas que se suelen adoptar
al construir un sistema de traducción automática (traducción directa,
traducción basada en la transferencia, traducción basada en una interlingua y
traducción basada en ejemplos). Asimismo expuso algunos aspectos esenciales del
proceso de generación de un texto, que son relevantes tanto para traducción
automática (en la generación del texto en lengua meta) como para la producción
autónoma de un texto; en este sentido trató de la planificación del contenido,
de la modelización del usuario, de pragmática, de gramáticas de generación y de
la selección léxica. El profesor Amores presentó una lección sobre «Sistemas
completos de traducción automática». En ella discutió los aspectos más externos
de estos sistemas, presentándolos sobre todo desde la perspectiva del usuario.
Así, hizo referencia a la distinción, generalmente aceptada hoy en día, entre
sistemas de traducción automática y entornos de traducción asistida; y a las
características específicas de los textos que un sistema puede tratar
satisfactoriamente (dentro de un dominio especializado, o para el lenguaje
general). En este contexto, señaló la importancia creciente de los llamados
lenguajes controlados, que facilitan que los sistemas de traducción automática
actúen con mejores resultados (ya que se enfrentan con textos que no sobrepasan
ciertos límites, tanto sintácticos como léxicos). Finalmente se refirió al
proceso de traducción mediante un sistema de traducción automática, y
especialmente a los tres momentos de participación del usuario: en la
preparación del texto (preedición), durante el proceso mismo de la traducción y
en la corrección de los resultados obtenidos (postedición). Por su parte, el
profesor Uchida dio una lección sobre «The
Universal Networking Language», un
proyecto de gran envergadura auspiciado por las Naciones Unidas. Se trata de
construir un sistema de representación de contenidos que pueda actuar como
interlingua en el proceso de traducción entre cualquier par de lenguas de las
tratadas. Para ello, se trabaja en una doble dirección: en la elaboración del
sistema de representación abstracta, y en las gramáticas de conversión (o
traducción) de los textos de cada lengua a la representación abstracta (y
viceversa). En el desarrollo del proyecto, se da clara preferencia a las
lenguas con más hablantes en el mundo.
El último tema básico del
curso, la síntesis de la voz, contó con la exposición del profesor Alan Black
(Carnegie Mellon University, Pittsburgh, EUA). El profesor Black explicó en su
exposición los aspectos más básicos de la producción automática de habla. En
primer lugar hizo hincapié en las maneras más comúnmente aceptadas de procesar
los sonidos: combinaciones de formas, de un sonido, de dos sonidos..., y el uso
de algoritmos (como los modelos ocultos de Markov). También trató de los
modelos prosódicos que se suelen usar para dar cuenta de factores como el
acento prosódico, la combinación duración-intensidad del sonido, etc. En este
sentido presentó las ventajas que comporta trabajar mediante corpus de
producciones reales para elaborar de manera fehaciente estos modelos de
lenguaje. Finalmente, se refirió al lenguaje de marcación SABLE que permite
controlar el output de un proceso de
producción fónica.
Un aspecto digno de
reseñar también fueron las dos mesas redondas celebradas durante el curso, que
permitieron discutir algunos aspectos colaterales de las tecnologías de la lengua:
el futuro de este tipo de investigación y sus aplicaciones, y el papel de la
administración en este campo. En la primera, en que intervinieron los
profesores Maria Antònia Martí de la Universitat de Barcelona (UB), Horacio
Rodríguez y Arturo Trujillo, así como quien suscribe esta crónica y Marsal
Gavaldà, que actuó de moderador, se discutió sobre las perspectivas de futuro
de las tecnologías de la lengua, tanto desde la vertiente investigadora como
desde la aplicada; y se comentaron las diferencias existentes en la iniciativa
privada y la financiación pública entre Estados Unidos de América y los países
de la Unión Europea. La segunda mesa redonda, que contó con la participación de
los profesores Núria Bel de la UB, Hans Kamp y Francisco A. Marcos-Marín, de la
Universidad Autónoma de Madrid (UAM) y director académico del Instituto
Cervantes, trató sobre el papel de las administraciones públicas en el impulso
en este campo. Cada uno de los tres participantes conocía un nivel de la
Administración: Hans Kamp había intervenido en proyectos europeos y de
colaboración entre Europa y América; Francisco A. Marcos-Marín, como
responsable del Instituto Cervantes, hace lo propio en los proyectos de la
Administración del Estado español, y Núria Bel ha participado en los trabajos
del comisionado para la sociedad de la información de la Generalitat
de Catalunya. Los tres, cada uno
desde su punto de vista particular, insistió en la necesidad del compromiso por
parte de las administraciones en la promoción de las investigaciones en el área
de las tecnologías de la lengua.
La participación de empresas en las sesiones de
demostración
Como se ha indicado, las
lecciones fueron complementadas por dos sesiones de demostraciones, que
permitieron a los asistentes hacerse una idea del estado real de la tecnología
en que revierten los estudios teóricos presentados. Las dos sesiones de
demostración estuvieron dedicadas, respectivamente, a reconocimiento y
producción de voz, y a procesamiento de texto y traducción automática.
En la primera, dedicada
al tratamiento del habla, se contó con la participación de dos empresas y un
grupo de investigación aplicada de la UPC. Ambas empresas, Dragon Systems y Philips,
presentaron sus sistemas de reconocimiento de voz, que comercializan en forma
de dictáfonos. Ambos sistemas comprenden las dos utilidades de escribir al
dictado y de poder recibir comandos orales. Por su parte, el grupo de
investigación de la UPC mostró un sistema de consulta telefónica de valores de
bolsa, que han desarrollado para una institución financiera; una característica
importante del sistema es que se encarga de recibir y transmitir datos
diferentes cada día, en función de las variaciones que se producen en el
mercado.
La segunda sesión de
demostración estuvo dedicada fundamentalmente a sistemas de traducción
automática, con alguna muestra de trabajos en procesamiento del lenguaje
natural. En ella intervinieron algunas de las empresas afincadas en Barcelona
que se dedican a este campo. En primer lugar, el representante de la empresa
Ampersand presentó el producto de traducción asistida que su empresa
comercializa (Déjà vu). En su presentación señaló las diferencias, desde el
punto de vista del usuario, entre los entornos de traducción asistida y los
sistemas de traducción automática; mostró las ventajas que los primeros tienen
respecto a los segundos, e indicó cuáles van a ser las mejoras que se van a ir
incorporando en ellos en el futuro inmediato. A continuación, los
representantes de Incyta presentaron su sistema de traducción del castellano al
catalán (que se usa para traducir diariamente el diario El Segre de Lleida y región); se trata
de un sistema clásico de traducción por transferencia (derivado del antiguo
sistema Metal, desarrollado por Siemens); y en la mayoría de las ocasiones se
accede a su uso a través de Internet, de manera que la traducción se realiza en
un servidor centralizado residente en la sede de Incyta. La demostración
siguiente mostró una manera distinta de abordar un problema semejante: los representantes
de El Periódico presentaron el sistema que se usa diariamente para la
traducción del diario del castellano al catalán; se trata de un producto
desarrollado por la empresa SoftLibrary, que aprovecha las funcionalidades
actuales en términos de indexación y acceso a la información para proporcionar,
en unos tiempos muy reducidos, propuestas de traducción que luego un equipo de
posteditores se encarga de validar o corregir; el sistema está totalmente
integrado en el entorno computarizado de producción del diario. Seguidamente la
empresa Sail-Labs mostró uno de los sistemas de traducción automática que han
desarrollado; se trata de uno de una serie de productos que están desarrollando
como sistemas de traducción automática completos para distintos pares de
lenguas, que se comercializan autónomamente para ser instalados en PC en el
entorno Windows; son sistemas clásicos de traducción automática por
transferencia, herederos también del antiguo sistema Metal, que presentan una
muy cuidada interfaz con el usuario (facilidad de gestión del léxico,
posibilidad de interacción con memorias de traducción, etc.). A continuación,
el profesor Amores presentó el sistema de traducción automática
EngSpan-SpanEng, desarrollado por la PAHO (Organización Panamericana de la
Salud); este sistema, relativamente antiguo ya, ha ido mejorando con el tiempo,
especialmente en cuanto a la amigabilidad del entorno y a la interfaz con el
usuario, de manera que su última versión funciona en el entorno Windows y
permite un cierto grado de adaptación a los requisitos específicos de cada
usuario. Finalmente, un representante del equipo de investigación en
tratamiento del lenguaje natural de la UPC presentó alguno de los productos en que han
estado trabajando últimamente: un diccionario multilingüe y un paquete de
herramientas para el marcaje de textos catalanes.
Como se ha visto en los
apartados anteriores, el curso contó con un programa de alto nivel, con la
participación de numerosos investigadores, tanto catalanes y españoles como
extranjeros. Sin duda, este hecho contribuyó a la importante participación de
estudiantes con que contó: una matrícula de algo más de 50 estudiantes para un
tema tan especializado como el del curso resulta altamente significativo. La gran
mayoría de asistentes eran estudiantes de doctorado o investigadores de los
grupos de investigación de las universidades catalanas o de las empresas
privadas dedicadas a este campo.
La oferta de formación de
tercer ciclo (es decir, posterior a la licenciatura o ingeniería) existente en
Cataluña en este campo es relativamente reducida. Por una parte, se ofrecen
grupos de asignaturas sobre este campo en algunos programas de doctorado más
generales, como los de los departamentos de Teoría de señal y comunicaciones y
de Lenguajes y sistemas informáticos, el del Departamento de Lingüística
general de la UB, el de los departamentos de Filología catalana y española de
la UAB, o el del Institut de Lingüística Aplicada de la UPF. Por otra parte,
departamentos de la UAB, la UB, la UPF y la Universitat Rovira i Virgili (URV)
ofrecen un doctorado en Ciencia cognitiva y lenguaje, con un número importante
de asignaturas dedicadas al procesamiento del lenguaje natural y a las
tecnologías de la lengua. Pues bien, muchos de los asistentes al curso eran
estudiantes, o antiguos estudiantes, de estos programas. Ello muestra
indudablemente el interés que el curso tuvo a nivel científico: al tratarse de
un curso de presentación general, relativamente panorámica, de los distintos aspectos
que intervienen en el campo de las tecnologías de la lengua, los especialistas
en cada aspecto concreto pueden tener (de hecho demostraron tener) interés en
la visión general. Así pues, el curso tuvo una clara repercusión entre las
personas que trabajan en esta área.
Un segundo nivel de
impacto del curso fue el de los medios de comunicación. La celebración de una
rueda de prensa durante el curso, y la presentación en la misma del prototipo
C-Star de intercomunicación multilingüe usuario-ordenador, tuvieron como
consecuencia la presencia de las tecnologías de la lengua en los diarios y
emisiones de radio de aquellos días. Como éste no es un hecho habitual, merece
la pena constatar que durante aquellos días (y las dos semanas siguientes) el
tema de la tecnología lingüística estuvo más presente que nunca en los medios
de comunicación.
Finalmente, debemos
subrayar la importancia que tuvo el acto de clausura del curso, que contó con
la participación del alcalde de Barcelona, Joan Clos, e investigadores en
campos afines al de las tecnologías de la lengua: los profesores Jaume
Bertranpetit de la UPF, Manuel García-Carpintero de la UB y Josep M. Vendrell
de la UAB. En una mesa redonda muy dinámica, presidida por Joan Clos, se
debatió intensamente sobre la relación de las investigaciones y aplicaciones en
tecnología lingüística con los trabajos de la aproximación pluridisciplinaria
al lenguaje humano desde una perspectiva cognitiva. Cada uno de los profesores
mencionados presentó la perspectiva de su aproximación al lenguaje humano:
Jaume Bertranpetit desde la vertiente biológica y antropológica, Manuel
García-Carpintero desde los aspectos cognitivos más generales aportados por la
filosofía, y Josep M. Vendrell desde su actividad como investigador de los
trastornos lingüísticos. Este acto mostró, por una parte, el interés de las
autoridades municipales por el campo de las tecnologías de la lengua y, por
otra, las grandes posibilidades que existen de interacción entre los distintos
campos que estudian el lenguaje humano (en todas sus vertientes, desde las más
teóricas hasta las más prácticas).
A modo de conclusión,
podemos afirmar que el tema de la tecnología aplicada al tratamiento
lingüístico resulta de interés para la sociedad catalana en general. Asimismo,
el curso de la Universidad Internacional Menéndez Pelayo constituyó un punto de
encuentro para los investigadores en tecnología lingüística de los distintos
grupos de investigación públicos o privados, de manera que en los debates
posteriores a las sesiones o en las mesas redondas se puso de manifiesto la
utilidad de intercambiar experiencias y establecer vínculos. Desde aquí
señalamos este interés y reiteramos la conveniencia de que este curso se siga
celebrando en los próximos años.
Toni
Badia
Profesor
de lingüística computacional en la Universitat Pompeu Fabra (Barcelona). Sus
intereses de investigación se centran en la descripción formal del lenguaje y
en su tratamiento automático, especialmente en las dimensiones sintáctica y
semántica. Ha trabajado en el desarrollo de diferentes proyectos de
investigación, básica y aplicada, de traducción automática y lingüística
computacional.