Skip to content

Latest commit

 

History

History
179 lines (145 loc) · 8.76 KB

termos-chave.md

File metadata and controls

179 lines (145 loc) · 8.76 KB

Termos-chave

Tanto para entender o que são conjunto de dados linguísticos como para usá-los, é útil saber certos termos-chave relacionados. Esta página além de listar alguns, também possui hiperlinks para buscar termos relacionados em português e em inglês no GitHub (que é uma espécie de rede social muito popular para desenvolvedores de código aberto).

Dica: clique nas recomendações de termos de busca. Elas podem levar a outros repositórios contendo ferramentas ou conjunto de dados.

Termos

Dicionário

Um dicionário é uma compilação de palavras ou dos termos próprios, ou ainda de vocábulos de uma língua, quase sempre dispostos por ordem alfabética e com a respectiva significação ou a sua versão em outra língua.

Discurso de Ódio

Discurso de ódio ou incitamento ao ódio é, de forma genérica, qualquer ato de comunicação que inferiorize ou incite contra uma pessoa ou grupo, tendo por base características como raça, gênero, etnia, nacionalidade, religião, orientação sexual ou outro aspecto passível de discriminação.

Língua Natural

Língua natural, língua humana, língua idiomática ou somente língua ou idioma: qualquer linguagem desenvolvida naturalmente pelo ser humano, de forma não premeditada, como resultado da facilidade inata para a linguagem possuída pelo intelecto humano. Vários exemplos podem ser dados como as línguas faladas e as línguas de sinais.

Língua Portuguesa

A língua portuguesa, também designada português, é uma língua românica flexiva ocidental originada no galego-português falado no Reino da Galiza e no norte de Portugal. Falada em 10 países, listados e ordem de população: Brasil, Moçambique, Angola, Portugal, Guiné-Bissau, Timor-Leste, Guiné Equatorial, Macau, Cabo Verde e São Tomé e Príncipe.

Linguagem Ofensiva

Uma palavra de baixo calão, popularmente conhecida como palavrão, é um vocábulo que pertence à categoria de gíria e, dentro desta, apresenta cunho chulo, impróprio, ofensivo, rude, obsceno, agressivo ou imoral sob o ponto de vista de algumas religiões ou estilos de vida.

Ontologia

Em Ciência da Computação, Sistemas de Informação e Ciência da Informação, uma ontologia é um modelo de dados que representa um conjunto de conceitos dentro de um domínio e os relacionamentos entre estes. Uma ontologia é utilizada para realizar inferência sobre os objetos do domínio.

Ontologias são utilizadas em inteligência artificial, web semântica, engenharia de software e arquitetura da informação, como uma forma de representação de conhecimento sobre o mundo ou alguma parte deste.

Termos extras:

Palavra vazia

Na computação, uma palavra vazia (ou stop word, em inglês) é uma palavra que é removida antes ou após o processamento de um texto em linguagem natural. Não existe uma lista universal de palavras vazias usadas por todas as ferramentas de processamento de linguagem natural e nem todas ferramentas fazem uso de uma lista dessas palavras. Algumas ferramentas, inclusive, evitam remover as chamadas "palavras vazias" para dar suporte à busca de sentenças.

Processamento de Linguagem Natural

Processamento de linguagem natural (PLN) é uma subárea da ciência da computação, inteligência artificial e da linguística que estuda os problemas da geração e compreensão automática de línguas humanas naturais.

Tesauro

Tesauro, também conhecido como dicionário de ideias afins, é uma lista de palavras com significados semelhantes, dentro de um domínio específico de conhecimento. Por definição, um tesauro é restrito. Não deve ser encarado simplesmente como uma lista de sinônimos, pois o objetivo do tesauro é justamente mostrar as diferenças mínimas entre as palavras e ajudar o escritor a escolher a palavra exata. Tesauros não incluem definições, pelo menos muito detalhadas, acerca de vocábulos, uma vez que essa tarefa é da competência de dicionários.

Tradução Automática

Tradução automática (TA) é o processo automático de tradução de um idioma original para outro através do computador.

Tradução Auxiliada por Computador

Nota: wikipedia em português não possui definição desse termo. Usada descrição e link em inglês.

Computer-assisted translation ,computer-aided translation or CAT is a form of language translation in which a human translator uses computer hardware to support and facilitate the translation process

Weasel Word

Weasel word ("palavra-doninha" em inglês) é um termo de gíria inglesa que pode traduzir-se como palavras "evasivas" ou "vazias".