2 067 svenska ord med sentiment (CSV). Fördelningen är 735 negativa ord och 1 333 positiva ord.
Kolumn | Beskrivning | Datatyp |
---|---|---|
word |
Ord | Text |
polarity |
Manuellt granskat om ordet är positivt (pos ) eller negativt (neg ) |
Text |
strength |
Manuell granskad styrka på sentiment från -4 till 4 (initialt -2/2) |
Tal |
sense |
Semantisk mening (se SALDO) | Text |
written_form |
['List'] | |
part_of_speech |
Adjektiv, adverb, verb etc. (av , avh , avm , ava , vb , vbn , vba , ab ) |
Text |
confidence |
Styrka från 0 till 1 på granskarnas säkerhet att polarity är korrekt |
Decimaltal |
lemgram |
Grundform av ordet | Text |
lemgram_frequency |
Frekvens av lemgram i Gigaword korpus som stämmer överens med sense |
Tal |
lemma_frequency |
Innehåller missing values kallat None |
Tal |
example |
Ett eller flera exempel på ordet i sammanhang | Text |
- Sentimentlexikon från Språkbanken är licensierad med CC-BY (attribution). Använd följande artikel som referens för lexikonet: Nusko, Bianka and Tahmasebi, Nina and Mogren, Olof. 2016. Building a Sentiment Lexicon for Swedish.
# Import.
import pandas as pd
def get_sentiments():
url = "https://github.com/peterdalle/svensktext/raw/master/sentiment/sentimentlex.csv"
return pd.read_csv(url, na_values="None", encoding="utf-8", header=0, sep=",")
# Count number of negative and positive words.
df = get_sentiments()
df["polarity"].value_counts()
# Import.
get_sentiments <- function() {
url <- "https://github.com/peterdalle/svensktext/raw/master/sentiment/sentimentlex.csv"
return(read.csv(url, na.strings="None", encoding="UTF-8", header=TRUE, sep=",", stringsAsFactors=FALSE))
}
# Count number of negative and positive words.
df <- get_sentiments()
table(df$polarity)