Tesia: Hizkuntzen arteko distantziak neurtzeko corpus-metrikak (José Ramom Pichel, 2020-10-29)

Tesiaren titulua: Medidas de distância entre línguas baseadas em corpus. Aplicação à linguística histórica do galego, português, espanhol e inglês
Hizkuntzen arteko distantziak neurtzeko corpus-metrikak. Galegoa, portugesa, espainiera eta ingelesaren linguistika historikorako aplikazioa.

Jose Ramom Pichel

Non: Telekonferentzia:
……….https://eu.bbcollab.com/guest/5b757d040d024f7b91deaaaffe3bec03
……….Informatika Fakultateko Ada Lovelace Aretoan
Eguna: Urriaren 29, osteguna
Ordua: 18:30etan
Egilea: José Ramom Pichel
Zuzendariak: Iñaki Alegria eta Pablo Gamallo
Hizkuntza: nagusiki portugesa  (ingelesa, euskara, espainiera, edota galegoa noizbait)

Ikerketaren motibazioa, galderak:

As dúvidas sobre a classificação filogenética histórica e actual do galego e as hesitações na identificação au-
tomática da língua e na construção e concepção de tradutores automáticos, sugerem que o cálculo automático da distância entre o galego, o português e o espanhol, a partir de textos escritos reais, e um desafio interessante.

1. Pode a distância entre línguas ser medida automaticamente com base em corpus?
2. Que papel desempenha a ortografia na distância entre as línguas?
3. É possível traduzir esta distância numa única métrica robusta?
4. A distância calculada com essa métrica verifica as hipóteses dos linguistas?
Adiciona novos dados sobre hipóteses minoritárias ou controversas?

5. Será que a distância entre períodos históricos da mesma língua muda? Como?
6. A distância entre línguas muda historicamente ou é sempre a mesma?
    E se mudar, esta distância entre línguas é linear?
7. Será que a distância histórica entre variantes reconhecidas da mesma língua muda?

Oraindik zalantzak daude galizieraren sailkapen filogenetikoari buruz, historian zeharreko galizieraz eta gaur egungoaz ere bai. Hizkuntza ezagutzeko sistema automatikoen eta itzultzaile automatikoak eraikitzerakoen diseinuek iradokitzen dute galizieraren, portugesaren eta gaztelaniaren arteko distantziaren kalkulu automatikoa erronka interesgarria dela, benetako testu idatzietan oinarrituta egiten bada batez ere. Galderak:
  1. Hizkuntzen arteko distantzia automatikoki neur daiteke corpusean oinarrituta?
  2. Zer rol betetzen du ortografiak hizkuntzen arteko distantzian?
  3. Posible al da distantzia hori metrika sendo bakar batekin neurtzea?
  4. Metrika horrekin kalkulatutako distantziak egiaztatzen al ditu hizkuntzalarien hipotesiak?
    Hipotesi minoritarioei edo eztabaidagarriei buruzko datu berriak gehitzen al ditu?
  5. Balio du metrika horrek hizkuntza bera garai historiko desberdinetako aldaketa neurtzeko? Nola?
  6. Historikoki aldatzen da hizkuntzen arteko distantzia edo beti berdina al da?
    Eta aldatuz gero, lineala al da hizkuntzen arteko distantzia-aldaketa hori?
  7. Aldatzen al da hizkuntza bereko aldaera aitortuen arteko distantzia historikoki?

Tesiaren egindako bide progresiboa eta  ekarpenak oso ondo jarraitu daiteke artikulu hauetan:

Utzi erantzuna

Zure e-posta helbidea ez da argitaratuko. Beharrezko eremuak * markatuta daude