Linguistas mostram como computação e internet podem ser usadas para entender migrações humanas e preservar línguas em extinção (Paul Heggarty, do Instituto Max Planck da Ciência da História Humana / foto: Felipe Maeda / Agência FAPESP)
Linguistas mostram como computação e internet podem ser usadas para entender migrações humanas e preservar línguas em extinção
Linguistas mostram como computação e internet podem ser usadas para entender migrações humanas e preservar línguas em extinção
Linguistas mostram como computação e internet podem ser usadas para entender migrações humanas e preservar línguas em extinção (Paul Heggarty, do Instituto Max Planck da Ciência da História Humana / foto: Felipe Maeda / Agência FAPESP)
André Julião | Agência FAPESP – Unir dados genéticos e de linguística para atingir uma estimativa mais precisa da expansão dos idiomas indo-europeus pela Europa. O grupo do pesquisador Paul Heggarty, do Instituto Max Planck da Ciência da História Humana, conseguiu esse feito cruzando por meio de computação amostras de DNA de populações antigas a dados dos idiomas atuais.
O resultado foi uma nova estimativa para o começo da expansão das línguas indo-europeias, estimado agora em 8,2 mil anos atrás.
“Há duas principais hipóteses, que propõem linhas do tempo diferentes [para a expansão dos primeiros falantes da língua que deu origem aos idiomas indo-europeus]. Uma de que teria ocorrido cerca de 6 mil anos atrás, outra de 8,5 mil ou mais. Nossa análise mostrou que em torno de 8,2 mil anos é a melhor estimativa possível agora, e que 6 mil anos atrás seria um pouco recente demais”, disse Heggarty em palestra no dia 28 de novembro no Frontiers of Science Symposium FAPESP Max Planck, organizado pelo Instituto Max Planck e pela FAPESP.
Apesar do uso da computação para cruzar extensos bancos de dados, o pesquisador enfatizou a importância do trabalho que precisa ser feito para obter os melhores dados linguísticos, para só então poder cruzá-los com dados genéticos que comparam o perfil genético das populações atuais com o das pré-históricas.
“A análise computacional se baseia primeiramente em linguística, treinar pessoas trabalhando nessas línguas para entendê-las junto com os dados sobre elas. E então é preciso converter esses dados em um formato que a análise computacional possa usar. Você não pode apenas começar com os computadores, tem que começar com a linguística”, disse Heggarty à Agência FAPESP.
A base no trabalho de campo é o que conduz as pesquisas de outra linguista. Filomena Sandalo, professora do Instituto de Estudos da Linguagem da Universidade Estadual de Campinas (IEL-Unicamp), é responsável pelo Projeto Temático “Fronteiras e Assimetrias em Fonologia e Morfologia” e está elaborando uma base de dados on-line que armazena narrativas e arquivos sonoros com anotações morfológicas e sintáticas das línguas indígenas do Brasil, disponível no endereço: http://www.tycho.iel.unicamp.br.
Sandalo apresentou o trabalho feito com o povo Pirahã do Amazonas, em que usou metodologias da psicologia experimental para verificar a teoria do linguista Daniel Everett segundo a qual a língua desse povo não teria recursividade indireta.
“Everett diz que a língua dos Pirahã não tem recursos para fazer frases subordinadas, relativas, qualquer tipo de subordinação. Então, não seria, segundo esta hipótese, possível dizer, por exemplo: a xícara está em cima do pires que está em cima da mesa. Nosso experimento mostra que isso é tão possível quanto no português”, disse Sandalo.
“Eles têm uma partícula que marca coordenação, enquanto nós marcamos a subordinação por uma partícula. Na coordenação eles empregam ‘piai’, equivalente ao ‘também’ do português. Esta partícula não ocorreu ao pedirmos frases subordinadas. Em pirahã, a construção coordenada seria ‘xícara em cima pires também em cima mesa’. Na subordinada não ocorre partícula alguma. Há, portanto, um contraste. É só uma outra forma de falar, mas a capacidade cognitiva é a mesma que a nossa, o que não é surpreendente”, disse a pesquisadora (leia mais em: http://revistapesquisa.fapesp.br/2018/11/19/pela-sobrevivencia-das-linguas-indigenas/).
Genes, línguas e carbono 14
Heggarty explicou que para estudar a expansão de uma cultura por meio das línguas faladas atualmente é preciso reconstruir uma árvore de descendência dessas e trabalhar com as estruturas que mostram quais são mais próximas uma da outra.
“As diferenças entre as línguas aumentam ao longo do tempo, então pode-se usar os níveis de diferença [entre elas] para pensar no tempo pelos quais elas divergem e então inferir a pré-história”, disse.
Essas informações então podem ser agregadas a outras relativas a amostras de DNA de restos humanos antigos e de artefatos encontrados em sítios arqueológicos.
“Pode-se ver, nesse cruzamento, que as pessoas de um lugar migraram para outro, porque elas falam línguas aparentadas mesmo vivendo a 2 mil quilômetros de distância. E pelo DNA antigo, vê-se um perfil genético particular que se move de uma parte do mundo para outra”, disse o pesquisador.
No entanto, o DNA não explica tudo. Basta pensar que as línguas são espalhadas por meio da dominação cultural, não necessariamente genética. “Falantes de línguas indo-europeias têm perfis genéticos bem diferentes. No mundo moderno há vários casos em que línguas se espalham e são aprendidas. Uma das línguas mais faladas hoje na Índia, por exemplo, é o inglês. E geneticamente esse povo não é europeu, mas eles falam a língua”, disse Heggarty.
“Na América do Sul é o mesmo. O Brasil tem todo um conjunto diferente de origens étnicas, mas a língua oficial é o português. Então, línguas podem se espalhar culturalmente”, disse.
Britânico vivendo na Alemanha, Heggarty se coloca como um exemplo vivo desse processo. “Meu sobrenome é celta, mas eu falo uma língua germânica. Isso porque, três gerações atrás, meus bisavós pararam de falar irlandês e começaram a falar inglês. Eu sou um caso de desencontro entre minha linhagem germânica de linguagem, que é o inglês, e minha linhagem linguística celta.”
Mais informações: https://soundcomparisons.com
A Agência FAPESP licencia notícias via Creative Commons (CC-BY-NC-ND) para que possam ser republicadas gratuitamente e de forma simples por outros veículos digitais ou impressos. A Agência FAPESP deve ser creditada como a fonte do conteúdo que está sendo republicado e o nome do repórter (quando houver) deve ser atribuído. O uso do botão HMTL abaixo permite o atendimento a essas normas, detalhadas na Política de Republicação Digital FAPESP.