Quem trabalha com língua, seja ela materna ou estrangeira, seja na forma de ensino, de aprendizagem, de análise linguística em redes sociais, sabe que surpresas são recorrentes e que, por vezes, nos deixam literalmente perdidos. Verificamos que, muitas das coisas que aprendemos na escola ou em cursos de idiomas, simplesmente não fazem sentido ao nos confrontarmos com a língua em uso, utilizada pelos falantes para fazer coisas do cotidiano, para viver em sociedade. Já parou para pensar o porquê de ser tão legal aprender inglês assistindo séries de TV? Simplesmente porque elas mostram pessoas vivendo e interagindo no mundo.
Se observarmos bem, parece que nem todo o aparato didático é capaz de domar essa criatura tão selvagem e surpreendente chamada língua, que deu início à primeira revolução do conhecimento milhões de anos antes do advento da revolução cibernética. Entretanto, apesar da natureza peculiar da língua – de qualquer uma delas – podemos contar com uma visão que faz mais sentido, por vezes, que listas, tabelas, compêndios gramaticais, etc.: a língua segue uma ordem probabilística, não é tão desordenada quanto parece. Dessa forma, muita coisa é possível na língua, mas não é provável. A forma ‘vosmecê’ é possível na língua portuguesa, mas não é provável. Quantas vezes você vê essa forma em textos impressos e eletrônicos do dia a dia? Quantos tweets, comentários no Facebook ou no Instagram mencionam essa palavra? Deixando o lado histórico de lado, ninguém mais usa essa forma- e daí a razão de ela ser pouco provável. Ela não reflete a sociedade atual, as pessoas não utilizam mais essa forma linguística para marcarem o seu lugar no mundo e nas práticas sociais.
Já que falamos em uma visão probabilística da língua, é necessário pensar em como acessá-la e trabalhar com a língua em uso. Para esse fim, temos a Linguística de Corpus[1] e seus corpora[2] eletrônicos que nos ajudam nessa tarefa, oferecendo possibilidades de pesquisa de itens linguísticos diversos, a probabilidade de ocorrência, os contextos de ocorrência desses itens, suas combinações mais recorrentes (colocações) e muito mais. Além disso, também contamos com as ferramentas de corpora, como o Voyant Tools[3] que nos dá condições de analisarmos os nossos próprios corpora, coletados para fins de estudo, como, por exemplo, um corpus de tweets sobre os comentários realizados acerca dos candidatos à próxima eleição presidencial.
O trabalho com a Linguística de Corpus, seja no ensino, na aprendizagem, no trabalho de comunicadores e analistas de redes sociais, além de otimizar as pesquisas, auxilia o pesquisador a sair do perigoso campo do ‘achismo’ e contar com dados reais e válidos.
Um outro ponto a considerar, e que se liga ao trabalho com a Linguística de Corpus, é a mudança de paradigma da sociedade contemporânea, pois passamos da sociedade de produção em massa para a sociedade do conhecimento. Matéria-prima, capital e trabalho estão em segundo plano hoje, deixando o papel principal para os processos de aquisição do conhecimento e o próprio conhecimento. No entanto, o volume de informações a ser transformado em conhecimento é descomunal, daí ser necessário desenvolvermos uma habilidade de ‘Sherlock Holmes’, de pesquisa, de análise de dados que encontramos na rede.
Na escola, não fomos – e ainda não somos – preparados para agirmos como pesquisadores, para desconfiarmos, compararmos, analisarmos dados. Entretanto, a sociedade do trabalho atual nos cobrará cada vez mais a capacidade de buscarmos e selecionarmos informações relevantes e as ferramentas de corpora podem nos auxiliar nessa tarefa. Que tal enfrentar o desafio de se tornar um detetive, um pesquisador da língua?
[1] Área da Linguística que trabalha com a coleta e análise de corpus/corpora. Ela lida com dados linguísticos produzidos por falantes reais.
[1] Plural de corpus– um conjunto de dados linguísticos pertencentes ao uso oral ou escrito da língua e que podem ser processados por computador.
[1] Acessível em: https://voyant-tools.org/
Dê uma olhada em nosso curso Linguística de Corpus para comunicadores e pesquisadores de mercado e aprenda muita coisa interessante para o seu trabalho de pesquisa linguística!