Projeto PorSimples, desenvolvido no âmbito do Instituto Virtual de Pesquisas FAPESP-Microsoft Research, cria ferramentas computacionais para facilitar a compreensão de textos disponíveis na internet

Especiais

Leitura facilitada

31/08/2009

Por Jussara Mangini

Agência FAPESP – Dois protótipos de ferramentas computacionais foram criados pela equipe do projeto PorSimples. O primeiro, chamado Facilita, visa a simplificar a linguagem de textos em português disponíveis na internet e, com isso, facilitar a compreensão das informações para crianças e adultos em processo de alfabetização ou pessoas com algum tipo de deficiência de leitura.

O segundo, o editor Simplifica, é destinado a produtores de conteúdo (escritores, professores, webmasters, jornalistas, por exemplo) que desejam criar textos simplificados adequados ao mesmo público.

Coordenado por Sandra Maria Aluísio, professora do Instituto de Ciências Matemáticas e de Computação (ICMC) da Universidade de São Paulo (USP), campus São Carlos, o trabalho consiste em reduzir a complexidade linguística dos textos, substituindo palavras raras (menos frequentes) por palavras mais usuais ou dividindo e reorganizando orações longas e complexas, entre outras adaptações.

“Ainda há muito conteúdo textual inacessível a um grande público no Brasil. Dados do IBGE de 2007 apontam 10% de analfabetos e 21,7% de analfabetos funcionais. Há, ainda, pessoas com problemas de leitura devido a derrame cerebral, dislexia, Alzheimer, dentre outros. Mesmo deficientes auditivos, que leem em Libras, quando querem aprender o português precisam de um texto adaptado”, explicou a coordenadora do PorSimples à Agência FAPESP.

A equipe do projeto é composta principalmente por pesquisadores do Núcleo Interinstitucional de Linguística Computacional (NILC) da USP, que desenvolve aplicações, ferramentas e recursos de processamento de linguagem natural (PLN) há 16 anos, e por pesquisadores do grupo Intermídia, também da USP, além de profissionais da área de Interação Humano Computador (IHC) e acessibilidade na web. O grupo conta ainda com a colaboração de uma psicolinguista, de linguistas em geral e de estatísticos para a avaliação em larga escala da tarefa de simplificação textual.

Segundo a coordenadora do estudo, o desafio foi selecionar ferramentas e métodos da área de PLN que pudessem melhorar características de textos como inteligibilidade e compreensibilidade para cada público alvo do projeto.

Propuseram, então, o conceito de “simplificação forte”, em que um conjunto de regras torna uma oração a mais simples possível. Esse tipo de simplificação é destinado a analfabetos funcionais do nível rudimentar, que são capazes de encontrar somente informações explícitas em textos curtos.

Criaram também o conceito de “simplificação natural”, cujas operações de simplificação são mais adequadas para analfabetos funcionais do nível básico, aqueles que leem textos um pouco mais longos e fazem simples inferências para obter informações.

O PorSimples foi um dos cinco projetos selecionados na primeira chamada do Instituto Virtual de Pesquisas FAPESP-Microsoft Research, em 2007. O programa receberá novas propostas de pesquisa em tecnologias da informação e da comunicação até o dia 4 de setembro.

Os recursos disponíveis para essa terceira chamada são de R$ 1 milhão e a expectativa é selecionar em torno de cinco propostas, com valor individual entre R$ 100 mil e R$ 300 mil.

Simplificação e elaboração

O objetivo da simplificação linguística é melhorar a capacidade de um texto ser lido para poder ser compreendido. Segundo Sandra, especialistas em psicolinguística e linguística dizem que sentenças longas, com vários níveis de subordinação, cláusulas embutidas (relativas), sentenças na voz passiva, uso da ordem não canônica para os componentes de uma sentença, além do uso de palavras de baixa frequência, aumentam a complexidade de um texto. 

Além da simplificação linguística, existem outros mecanismos de adaptação textual: a simplificação via sumarização e a elaboração. “Textos de revistas e artigos científicos podem ser simplificados pela diminuição de seu tamanho, em uma tarefa bem conhecida de PLN – a sumarização textual. Textos literários também são simplificados pelo uso de resumos, como os resumos de obras clássicas para o vestibular”, exemplificou.

Já a elaboração adiciona informação a um texto, visando a esclarecer, elaborar e explicar uma informação implícita e tornar explícitas as conexões entre as idéias. O objetivo é tornar um texto mais coerente e limitar a ambiguidade dentro dele.

“Na prática, muitas adaptações envolvem a combinação de simplificação e elaboração. Por exemplo, um professor pode simplificar sentenças difíceis em um texto, enquanto, ao mesmo tempo, adiciona informação contextual para tornar um conceito mais claro. Pode ainda usar redundância para compensar o uso de termos não familiares aos alunos de uma série”, disse Sandra.

Outra fonte de inspiração para a equipe do PorSimples foi uma seção do jornal gaúcho Zero Hora, chamada “Para seu filho ler”, dedicada a crianças de 8 a 11 anos. “Embora não nos propomos a fazer reescritas, como as usadas no Zero Hora, as tecnologias da área de PLN (sumarização, simplificação e elaboração textual) podem ajudar o público alvo do projeto”, afirmou.

Outras aplicações

As ferramentas também poderão ser usadas por professores que trabalham com textos da web para ensino da leitura e por editoras para a verificação de adequação de um texto a determinada faixa etária ou nível de escolaridade.

Além de fornecer um parâmetro mais sofisticado para avaliação da inteligibilidade de textos, o PorSimples fornece retroalimentação para os autores, apontando trechos que devem ser simplificados, e como fazê-lo.

“No momento, essas simplificações estão ligadas apenas a estruturas sintáticas, mas já há trabalhos de doutorados em andamento para fazer simplificações no nível léxico, considerando-se a semântica, e no nível textual para melhorar a coesão do texto”, contou Sandra.

A professora do ICMC-USP também alerta para a necessidade de adequação de textos em páginas de órgãos públicos, com a crescente ênfase em governança digital, verificando-se a faixa de escolaridade requerida para a compreensão do material disponível.

Da mesma forma, aponta ser fundamental que provedores de conteúdo para educação a distância evitem ambiguidades e problemas de leitura, uma vez que a acessibilidade à linguagem empregada não é percebida diretamente. O mesmo deve ser considerado por aqueles que produzem manuais de instruções, bulas de remédios, contratos jurídicos, entre outros.

“Os prejuízos causados pelo uso indevido de equipamentos ou pela ingestão de medicamentos podem ser imensos se as instruções não forem interpretadas corretamente. Assim como um usuário comum (não especialista em leis) deveria ter o direito de ter acesso a documentos escritos em linguagem acessível”, disse.

Segundo Sandra, hoje não há ferramentas para avaliar a adequação das instruções para o público e isso pode ser fornecido pela tecnologia desenvolvida pelo PorSimples. Como são ferramentas web, para serem usadas é necessário apenas um browser (programa navegador de páginas) e um computador conectado à internet. No desenvolvimento foram utilizados os browsers mais populares: Internet Explorer, Firefox, Opera, Chrome e Safari.

Mais informações sobre a terceira chamada do Instituto Virtual de Pesquisas FAPESP-Microsoft Research: www.fapesp.br/convenios/microsoft
 

 

AGENDA DE EVENTOS DE CIÊNCIA, TECNOLOGIA E INOVAÇÃO

REPORTAGENS E NOTÍCIAS MAIS LIDAS DO MÊS

BOLETINS DA AGÊNCIA FAPESP

« AnteriorPróximo »

Escolha o dia para ler o boletim da Agência FAPESP desde 2003

Revista Pesquisa FAPESP
Leia a nova edição da revista
Pesquisa FAPESP
Banner FAPESP - Alpha Crucis