Tesiaren titulua: Medidas de distância entre línguas baseadas em corpus. Aplicação à linguística histórica do galego, português, espanhol e inglês
Hizkuntzen arteko distantziak neurtzeko corpus-metrikak. Galegoa, portugesa, espainiera eta ingelesaren linguistika historikorako aplikazioa.

Non: Telekonferentzia:
……….https://eu.bbcollab.com/guest/5b757d040d024f7b91deaaaffe3bec03
……….Informatika Fakultateko Ada Lovelace Aretoan
Eguna: Urriaren 29, osteguna
Ordua: 18:30etan
Egilea: José Ramom Pichel
Zuzendariak: Iñaki Alegria eta Pablo Gamallo
Hizkuntza: nagusiki portugesa (ingelesa, euskara, espainiera, edota galegoa noizbait)
Ikerketaren motibazioa, galderak:
As dúvidas sobre a classificação filogenética histórica e actual do galego e as hesitações na identificação au-
tomática da língua e na construção e concepção de tradutores automáticos, sugerem que o cálculo automático da distância entre o galego, o português e o espanhol, a partir de textos escritos reais, e um desafio interessante.
1. Pode a distância entre línguas ser medida automaticamente com base em corpus?
2. Que papel desempenha a ortografia na distância entre as línguas?
3. É possível traduzir esta distância numa única métrica robusta?
4. A distância calculada com essa métrica verifica as hipóteses dos linguistas?
Adiciona novos dados sobre hipóteses minoritárias ou controversas?
5. Será que a distância entre períodos históricos da mesma língua muda? Como?
6. A distância entre línguas muda historicamente ou é sempre a mesma?
E se mudar, esta distância entre línguas é linear?
7. Será que a distância histórica entre variantes reconhecidas da mesma língua muda?
- Hizkuntzen arteko distantzia automatikoki neur daiteke corpusean oinarrituta?
- Zer rol betetzen du ortografiak hizkuntzen arteko distantzian?
- Posible al da distantzia hori metrika sendo bakar batekin neurtzea?
- Metrika horrekin kalkulatutako distantziak egiaztatzen al ditu hizkuntzalarien hipotesiak?
Hipotesi minoritarioei edo eztabaidagarriei buruzko datu berriak gehitzen al ditu? - Balio du metrika horrek hizkuntza bera garai historiko desberdinetako aldaketa neurtzeko? Nola?
- Historikoki aldatzen da hizkuntzen arteko distantzia edo beti berdina al da?
Eta aldatuz gero, lineala al da hizkuntzen arteko distantzia-aldaketa hori? - Aldatzen al da hizkuntza bereko aldaera aitortuen arteko distantzia historikoki?
Tesiaren egindako bide progresiboa eta ekarpenak oso ondo jarraitu daiteke artikulu hauetan:
-
Jose R. Pichel, Pablo Gamallo, Iñaki Alegria, Marco Neves (2020) A Methodology to Measure the Diachronic Language Distance between Three Languages Based on PerplexityJournal of Quantitative Linguistics.
-
José Ramom Pichel, Pablo Gamallo, Marco Neves & Iñaki Alegria (2020) Distância diacrónica automática entre variantes diatópicas do português e do espanhol Linguamática, Vol. 12 N. 1, 117–126 ISSN: 1647–0818
-
José Ramom Pichel, Pablo Gamallo, Iñaki Alegria (2019) Measuring diachronic language distance using perplexity. Application to English, Portuguese and Spanish. Natural Language Engeenering.
-
Pablo Gamallo José Ramom Pichel and Iñaki Alegria (2020) Measuring Language Distance of Isolated European Languages MDPI Information 2020, 11(4), 181 doi:10.3390/info11040181
-
José Ramom Pichel, Pablo Gamallo, Iñaki Alegria (2019) Cross-lingual Diachronic Distance: Application to Portuguese and Spanish Procesamiento del Lenguaje Natural, Revista no 63, septiembre de 2019, pp. 77-84
-
P. Gamallo, J.R. Pichel, I. Alegria. 2017. From language identification to language distance. Physica A: Statistical Mechanics and Its Applications 484, 152-162.