A Sobek Mining é uma ferramenta de mineração de texto criada em 2007 pelo Grupo de Pesquisa em Tecnologia Aplicada à Educação do Programa de Pós-Graduação em Informática na Educação da Universidade Federal do Rio Grande do Sul (UFRGS). Seu objetivo é ser um apoio em tarefas educacionais, sobretudo nas que tratam de compreensão de leitura e criação de resumos.
De maneira muito simples, ela cria um diagrama do texto a partir dos conceitos mais relevantes e suas relações utilizando como princípio a análise de frequência de cada termo, vale ressaltar que artigos, preposições e advérbios são descartadas dessa análise.
É possível usar online ou baixar o software para o seu desktop e para obter o grafo basta copiar (ou digitar) e colar o texto na janela do editor e clicar em “extrair conceitos”. Na sequência a Sobek Mining abrirá uma nova janela com os nós de conceitos e suas conexões, dos quais os maiores são os mais citados. Ao clicar na palavra do nó a plataforma mostrará onde o termo está localizado no texto. Ainda é possível salvar os grafos em imagem ou salvar no modo original para continuar analisando posteriormente.
Possibilidades de aplicação
Para contextualizar algumas das aplicações, podemos citar a análise textual de perguntas e respostas do teleatendimento do Ministério da Saúde do Brasil, da qual os gráficos gerados auxiliaram na remodelagem da metodologia de respostas dos médicos para os cidadãos solicitantes. Ou ainda, apoio pedagógico em mediação de discussões em fóruns para identificar o momento em que os assuntos propostos fogem da premissa inicial e a análise de conteúdo e de relevância de mensagens trocadas em fóruns online.
Suponho que a ferramenta possa cooperar expressivamente com estudos de conversações em mídias sociais, analisar tópicos ou grupos de debates focados em determinados temas, léxico, dialetos e assim grande parte das especificações da análise de conteúdo (BARDIN, 2011).
Referências
BARDIN, Laurence. Análise de conteúdo. 1ª ed. 1ª reimp. São Paulo: Edições 70, 2011.
REATEGUI, E., EPSTEIN, D., LORENZATTI, A., KLEMANN, M. Sobek: a Text Mining Tool for Educational Applications. In: International Conference on Data Mining, 2011, Las Vegas, USA, 2011, 59-64.
SCHENKER, A. Graph-Theoretic Techniques for Web Content Mining. PhD thesis, University of South Florida, 2003.