Alfonso Ureña, Hizkuntzaren ekonomia berriko jardunaldian (2022-06-01)

Alfonso Ureña, SEPLN elkarteko presidentea.

Hizkuntzaren ekonomia berriko trantsizio digital eleaniztunari buruzko jardunaldia antolatu dugu Donostiako Miramar jauregian. Galdera hauei erantzuteko asmoz:

  • Nola egin arrakastaz trantsizio digital eleaniztuna; nola bermatu gure hizkuntzen eta kulturen iraupen digitala?
  • Nola bihurtu sozioekonomikoki errentagarri eleaniztasuna: berrikuntza, zerbitzuak, produktuak eta negozio-eredu berriak?

SEPLN Hizkuntza Naturala Prozesatzeko Espainiako Elkarteak, Eusko Jaurlaritzako Kultura Sailaren eta UPV/EHUko HiTZ zentroaren lartean antolatu dugu.

SEPLN Hizkuntza Naturala Prozesatzeko Espainiako Elkarteko Presidente Alfonso Ureñaren hasierako hitzak hauek izan dira:

Eva Ferreira, Bingen Zupiria, eta Allfonso Ureña. (arg.: Langune)

Eskerrak eman nahi dizkiet Eusko Jaurlaritzari, Kultura Sailari eta Euskal Herriko Unibertsitateko HiTZ zentroari. Bereziki, Eneko Agirre HiTZ zentroko zuzendariari, Eva Ferreira errektoreari eta Bingen Zupiria sailburuari. Eta eskerrak eman nahi dizkiegu hizkuntzaren ekonomia berriko trantsizio digital eleaniztunari buruzko jardunaldi honetan parte hartzen duten guztiei.

Hizkuntzaren teknologiaren potentzialtasunari erantzuna eman eta ezagutarazteko helburua du jardunaldi honek. Adimen artifizialaren iraultza gertatzen ari da, oro har, eta, bereziki, hizkuntza naturalaren prozesamenduarena. Gizarteko esparru eta sektore gehienetan sartzen ari da.

Utz iezadazu aipamen labur bat egiten  Hizkuntza Naturalaren Prozesamendurako Espainiako Elkartea (SEPLN) aurkezteko. Espainian ikerketa egituratzen duen elkartea. Ibilbide luzea du, 1983tik. Oso komunitate aktiboa da, irabazi asmorik gabekoa eta bazkide numerarioek, erakundeek eta enpresek osatua. Horren helburua da hizkuntza naturalaren prozesamenduaren esparruan ikerketari, irakaskuntzari edo prestakuntzari eta garapenari buruzko era guztietako jarduerak sustatu eta zabaltzea, bai nazio mailan, bai nazioartean. Azpimarratu behar da SEPLN kongresua Espainiako zaharrena dela informatikaren arloan, eta urtero egiten dela, etenik gabe, 1983an sortu zenetik, Donostian hain zuzen ere. Gizarteak giza kapital handia du, masa kritiko garrantzitsua, izen handiko ikertzaileak eta ikerketa-talde garrantzitsu eta nazioartekotuak biltzen baititu. Talde horiek Hizkuntzaren Teknologiako komunitate ia osoa osatzen dute, ez bakarrik Espainian, baita Iberoamerikako erreferentea ere bada.

Jardunaldiaren xedeari dagokionez, hizkuntza naturala harrigarria dela aipatu nahiko nuke. Ahalegin handiik gabe, ezezagun bati galde diezaiokegu nola aurkitu kafetegi bat edo hurbilago bazkaltzeko toki bat. Gure esperientziak, ezagutzak eta abar partekatu ditzakegu. Hizkuntza da informazioa transmititu eta atzitzeko modurik arruntena eta praktikoena. Hizkuntza erabiltzen dugu, gure komunikazio-ingurune naturala den aldetik, informazioa kodetzeko, gordetzeko, transmititzeko, partekatzeko eta manipulatzeko. Hain zuzen, eskura dagoen informazio digital gehiena egituratu gabeko informazioa da, dokumentu gisa hainbat hizkuntzatan (idatziak edo hitz egindakoak), eta hori erronka bat da informazio hori ustiatu eta prozesatu nahi duen edozein erakunderentzat. Izan ere, ez da erraza egituratu gabeko informazio digitala (testua eta ahotsa) prozesatzea, hainbat interpretazio baititu (anbiguotasuna), testuinguruari eta munduari buruzko ezagutzarik eza eta bere berezko konplexutasuna. Hizkuntzaren Teknologiak (TL), giza hizkuntza prozesatzeko gai diren sistemak aztertu eta garatzeaz arduratzen denak, hainbat metodo garatu ditu urteen bidez testuetako informazioa esplizitu egiteko eta deskribatzen duen errealitatearekin lotzeko.

Beraz, hizkuntza adimen artifiziala garatzeko gure ahaleginen erdigunean egon behar da, eta alderantziz. Izan ere, gaur egun, Hizkuntzaren Teknologia da, seguruenik, adimen artifizialaren eremurik berritzaileena, hazkunde azkarreko eragin ekonomikoa duena. Gaur egun, duela urte batzuk aurrerapen ikaragarriak eta imajinaezinak gertatzen ari dira. Hain zuzen, NLP aplikazio funtzionaleko eremu garrantzitsuenetako bat da. Adimen artifizialaren %50 baino gehiago Hizkuntzaren Prozesamendua dela kalkulatzen da.

Egiten diren lan askoren berezko zailtasuna gorabehera, Hizkuntza-teknologiaren egungo garapen-mailak duela urte gutxi pentsaezinak ziren aplikazio aurreratu asko ahalbidetzen ditu. Hizkuntza-Teknologia gure eguneroko bizitzan dago, nahiz eta ez garen horretaz jabetzen. Adibidez, informazio-bilatzaileen, gomendio-sistemen, laguntzaile birtualen, txat-en, testu-zuzentzaileen, testu-aurresaleen, itzulpen automatikoko sistemen, azpititulazio automatikoen, laburpen automatikoen, teknologia inklusiboaren eta abarren bidez. baita administrazioan ere, aplikazio-eremu bertikalen bidez, hala nola hezkuntza, osasuna, justizia, turismoa… Azken urteetan izan duen garapen azkarrak emaitza are harrigarriagoak ekarri ditu etorkizun hurbilean.

 

 

“Buenos días a todos y bienvenidos a la jornada sobre la transición digital multilingüe en l nueva economía de la lengua.

Quisiera agradecer el apoyo del Gobierno Vasco, concretamente a la Consejería de Cultura y al centro HiTZ de la Universidad del País Vasco. Especialmente, al  director del centro HiTZ Eneko Agirre, a la rectora Eva Ferreira y al consejero Bingen Zupiria.

Y agradecer a todos los que participan y asisten en esta jornada sobre la transición digital multilingüe en la nueva economía de la lengua.

Esta jornada se enmarca con el objetivo de dar respuesta y dar a conocer la potencialidad de la tecnología del lenguaje. Estamos asistiendo a una revolución de la inteligencia artificial en general y en particular del procesamiento del lenguaje natural, también conocido como tecnología del lenguaje que está penetrando en todos los ámbitos y en la mayor parte de los sectores de la sociedad. 

Permítanme que haga una breve reseña y presentación a la Sociedad Española para el Procesamiento para el Lenguaje Natural (SEPLN). La sociedad que viene vertebrando la investigación en España. Cuenta con una larga trayectoria, desde 1983. Es una comunidad  muy activa, sin ánimo de lucro y formada por socios numerarios, instituciones y empresas. Cuyo objetivo es promover y difundir todo tipo de actividades referentes a la investigación, a la enseñanza o formación y desarrollo en el ámbito del procesamiento del lenguaje natural, tanto a nivel nacional como internacional. Resaltar que el congreso SEPLN es el más antiguo de España en el ámbito de la informática, viene realizándose año tras año, de manera ininterrumpida, desde la fecha de creación en 1983, precisamente en esta ciudad de San Sebastián. La sociedad cuenta con un gran capital humano, una masa crítica importante, ya que agrupa a investigadores de alto prestigio y grupos de investigación muy relevantes e internacionalizados que constituyen prácticamente toda la comunidad en Tecnología del Lenguaje, no sólo en España, también es un referente en Iberoamérica.

Centrándonos en el objeto de la jornada, quisiera mencionar que el lenguaje  natural es asombroso. Sin esfuerzo podemos preguntar a un desconocido cómo encontrar una cafetería o un lugar para comer más cercano. Podemos compartir nuestras experiencias, conocimientos, etc. El lenguaje es la forma más común y versátil para transmitir y acceder a la información. Usamos el lenguaje, como nuestro medio natural de comunicación, para codificar, almacenar, transmitir, compartir y manipular información. De hecho, la mayor parte de la información digital disponible es información no estructurada en forma de documentos (escritos o hablados) en múltiples idiomas, lo que representa un desafío para cualquier organización que quiera explotar y procesar esta información. Ya que no es trivial procesar la información digital no estructurada (texto y voz), ya que está sujeta a múltiples interpretaciones (ambigüedad), falta de conocimiento sobre el contexto y el mundo, y su complejidad intrínseca. La Tecnología del Lenguaje (TL) que se ocupa de estudiar y desarrollar sistemas capaces de procesar lenguaje humano, ha desarrollado a través de los años diferentes métodos para hacer explícita la información contenida en los textos y relacionarla con la realidad que describen.

Por lo tanto, el lenguaje es y debe estar en el centro de nuestros esfuerzos para desarrollar la Inteligencia Artificial, y viceversa. De hecho, actualmente, la Tecnología del Lenguaje es posiblemente el campo más innovador de la Inteligencia Artificial con un impacto económico de crecimiento acelerado. Actualmente estamos asistiendo a unos avances impresionantes e inimaginables hace unos años. De hecho, el PLN es una de las áreas de aplicación funcional más importantes. Se calcula que más del 50% de la inteligencia artificial es PLN. 

A pesar de la dificultad inherente de muchas de las tareas que se realizan, el grado de desarrollo actual de la TL permite ya muchas aplicaciones avanzadas impensables hace pocos años. La TL está presente en nuestra vida diaria, aunque no seamos conscientes de ello. Por ejemplo, a través de buscadores de información, sistemas de recomendación, asistentes virtuales, chatbots, correctores de texto, predictores de texto, sistemas de traducción automática, subtitulación automática, resúmenes automáticos, tecnología inclusiva, etc. así como, en la administración, a través de verticales como educación, sanidad, justicia, turismo… Su rápido desarrollo en los últimos años augura resultados aún más sorprendentes en un futuro muy cercano.

Desafortunadamente, tal y como demuestran los resultados del proyecto European Language Equality, este notable progreso tecnológico no se desarrolla por igual en todas las lenguas. Existe una distancia abismal entre ellas. Es una oportunidad la que tenemos con el multilingüismo, ya que se estima que la mitad de la población es bilingüe. Como ejemplo, el PLN atendió al 50% de la población que usa más de un idioma a la vez. En este contexto, el objetivo de esta jornada es dar respuesta a los siguientes retos:

  • Cómo hacer con éxito la transición digital multilingüe; cómo garantizar la pervivencia digital de nuestras lenguas y culturas.

  • Cómo rentabilizar socioeconómicamente el multilingüismo: innovación, servicios, productos y nuevos modelos de negocio.

Quisiera hacer mención muy brevemente al PERTE sobre la nueva economía de la lengua, aprobado en marzo por el gobierno y que nos acompañan en esta jornada la comisionada y su director, y a los que agradezco que hayan aceptado nuestra invitación. Consideramos el PERTE un acierto, es necesario aunque no suficiente, para llevar a las lenguas cooficiales a un estado de madurez tecnológica que las sitúe a la vanguardia de la sociedad y economía digitales, y que esto permita a su vez el desarrollo de una industria que pueda liderar incluso a escala mundial los servicios, productos y aplicaciones basados en TL, en particular en español. La TL está contribuyendo al desarrollo de sociedades digitales inclusivas, y son útiles para la transformación digital y responder a los desafíos sociales (multilingüismo, accesibilidad, transparencia y equidad).

Tenemos una ventana de oportunidad que tendrá, en todo caso, una duración temporal limitada. En el horizonte del 2025 deberían ser evidentes los resultados del PERTE como plan de choque para la maduración tecnológica del español y las lenguas cooficiales del estado. De otro modo se perderá, quizás definitivamente, la oportunidad de que España lidere la economía alrededor de la TL en sus lenguas.

Como se pondrá de manifiesto en la jornada, las iniciativas de diferentes gobiernos autonómicos en este sentido, como son las iniciativas públicas con lengua propia, las del País Vasco, Galicia y Cataluña, concretamente con el Gaitu, Nós y Aina respectivamente. Así como al Perte al que ya he hecho referencia a nivel estatal.

Se deben de adoptar decididas políticas científicas para su correcto y eficiente despliegue, y contribuir con ello al progreso de la ciencia, la sociedad y el conocimiento. Es por tanto necesario que desde la SEPLN se influya en la equidad de las lenguas cooficiales y se involucre a los investigadores y a la academia (universidades), ya que contamos con centros de investigación de diferentes universidades relevantes y competitivos en PLN, como los que colaboran en esta jornada (Hitz, Citius, CEATIC, CENID y BSC),  así como grupos de investigación por todo el territorio estatal.

Esperemos sacar el máximo provecho a esta jornada, corta pero intensa, a través de mesas redondas se dará respuesta a la situación del multilingüismo en los ámbitos de industria, investigación y formación en PLN (TLH).”

Utzi erantzuna

Zure e-posta helbidea ez da argitaratuko. Beharrezko eremuak * markatuta daude