Unitex/GramLab
Suíte Multiplataforma para o Processamento de Corpora Textuais
Suíte Multiplataforma para o Processamento de Corpora Textuais
A tecnologia baseada em autômatos que faz parte do motor de Processamento de Linguagem Natural do Unitex/GramLab permite o uso de dicionários eletrônicos e gramáticas locais para processar e analisar rapidamente dados textuais
Os recursos linguísticos são dicionários e gramáticas eletrônicos que permitem fazer uma análise de dados textuais utilizando o Unitex/GramLab. Atualmente, recursos para mais de 22 línguas acompanham o Unitex/GramLab
O IDE Visual do Unitex/GramLab permite que os usuários desenvolvam e apliquem facilmente recursos linguísticos a um texto. A perspectiva orientada a projetos permite que projetos sejam executados com apenas um clique
O Unitex/GramLab é distribuído livremente de acordo com os termos da Licença Pública Geral Reduzida (LGPL), o que significa que qualquer um pode redistribuir o Unitex/GramLab livremente dentro dos termos da LGPL. Isso também quer dizer que você tem acesso ao código fonte de todos os programas que fazem parte do Unitex, o que inclui o arquivo zip baixado. A licença LGPL é mais permissiva do que a licença GPL, já que permite que o código do Unitex/GramLab seja reutilizado em outros softwares proprietários
O motor de PLN do Unitex/GramLab está escrito em C++, e seu IDE Visual está escrito em Java. Essas características permitem desenvolver aplicações baseadas em Unitex em qualquer sistema que suporte Java 1.7 ou superior, compilar essas aplicações usando um compilador compatível com o padrão C++ e executá-las em sua plataforma de preferência: Windows, Linux, OS X, entre outras
O Unitex/GramLab está em conformidade com o padrão Unicode 3.0, o que permite que usuários trabalhem com praticamente todos os caracteres de todos os idiomas, incluindo os idiomas asiáticos. Os módulos do Unitex foram planejados de modo que funcionem com todas as regras de escrita. Não há dificuldade em trabalhar com línguas asiáticas, mesmo com suas particularidades de espaçamento.
O Unitex/GramLab funciona com dicionários eletrônicos construídos por membros da RELEX, uma rede internacional de laboratórios especializados em Linguística Computacional iniciada por Maurice Gross e sua equipe do LADL. Os membros da RELEX construíram e seguem construindo dicionários exaustivos usando muitos dos recursos distribuídos com o Unitex/GramLab licenciados pela LGPLLR
As gramáticas locais são formalismos poderosos utilizados para descrever regras sintáticas ou semânticas. Essas gramáticas são autômatos de estado finito acoplados a dicionários eletrônicos com a finalidade de realizar análises automáticas de dados textuais. O Unitex/GramLab conta com um IDE visual completo que permite que seus usuários possam elaborar, testar, manter e aplicar gramáticas locais facilmente a um texto.