Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Discussão e dúvidas corpus DANTE #11

Open
gabrielceregatto opened this issue Apr 10, 2021 · 61 comments
Open

Discussão e dúvidas corpus DANTE #11

gabrielceregatto opened this issue Apr 10, 2021 · 61 comments

Comments

@gabrielceregatto
Copy link

Conforme combinado na reunião do grupo de anotação do corpus de tweets DANTE, criei o issue para o registro de discussões e dúvidas em relação ao corpus DANTE

@llauragazana
Copy link

Pessoal, boa noite!

Fiquei em dúvida sobre como anotar a expressão "de acordo com"

e o tweet " que linda era esa mina chabonnn" está em espanhol, né? Eu ia marcar "esa" como erro de digitação mas acho que esta em espanhol.

@gabrielceregatto
Copy link
Author

gabrielceregatto commented Apr 28, 2021

Pessoal, terminei a minha anotação do pacote 101-150 e encontrei alguns erros de pré-processamento e algumas dúvidas, seguem:

Possíveis erros de pré-processamento:

Sentença 13 - @ppaulovagner 11h22 = Ações USIMINAS ... Usim 3 + 1,76 % e Usim 5 + 3,61 % ... (Nome da ação tokenizado indevidamente)

Sentença 18 - @andresmoraes isso sem contar os 30 % de a #PETR4 ... o . O (Tokenização indevida do emoji ao final da sentença)

Sentença 23 - PETR4 com vol . financeiro cerca de 9 vezes a VALE5 . Explode ? (O ponto faz ou não parte da abreviação? Se fizer, a tokenização é indevida)

Sentença 41 - & lt , Alexander Cruz 3 * - * ( Tokenização indevida do emoji ao final da sentença, também não faço a menor ideia do que seja "& It", não encontrei nada na internet)

Sentença 47 - Futuros de NY caindo ( 0,55 ) pts , Japão caindo 0,41 % , China caindo 0,48 % . #PETR4 _ VAI _ A _ 17 REAL ! ! (Tokenização indevida da hashtag ao final da sentença)

@NortonTR
Copy link

NortonTR commented Apr 28, 2021 via email

@arianidf
Copy link

Pessoal, terminei a minha anotação do pacote 101-150 e encontrei alguns erros de pré-processamento e algumas dúvidas, seguem:

Possíveis erros de pré-processamento:

Sentença 13 - @ppaulovagner 11h22 = Ações USIMINAS ... Usim 3 + 1,76 % e Usim 5 + 3,61 % ... (Nome da ação tokenizado indevidamente)

Sentença 18 - @andresmoraes isso sem contar os 30 % de a #PETR4 ... o . O (Tokenização indevida do emoji ao final da sentença)

Sentença 23 - PETR4 com vol . financeiro cerca de 9 vezes a VALE5 . Explode ? (O ponto faz ou não parte da abreviação? Se fizer, a tokenização é indevida)

Sentença 41 - & lt , Alexander Cruz 3 * - * ( Tokenização indevida do emoji ao final da sentença, também não faço a menor ideia do que seja "& It", não encontrei nada na internet)

Sentença 47 - Futuros de NY caindo ( 0,55 ) pts , Japão caindo 0,41 % , China caindo 0,48 % . #PETR4 _ VAI _ A _ 17 REAL ! ! (Tokenização indevida da hashtag ao final da sentença)

Valeu, Gabriel! Já passei esses casos para o Emanuel!

@arianidf
Copy link

Pessoal, boa noite!

Fiquei em dúvida sobre como anotar a expressão "de acordo com"


Em ocorrência como "De acordo com o professor, eu entendi o conceito", a expressão "de acorco com" equivale a "segundo" (ADP) e a anotação seria ADP, NOUN, ADP.
Era essa a dúvida?


e o tweet " que linda era esa mina chabonnn" está em espanhol, né? Eu ia marcar "esa" como erro de digitação mas acho que esta em espanhol.


Sim, está em espanhol! É um regionalismo da Argentina.
Se escrito segundo as regras formais, seria: "que linda era esa mina, chavón!"
E significa: "que linda era essa garota, meu (ou mano)"
Estou consultando as bases para a melhor anotação.

@llauragazana
Copy link

Essa #KROT3 é um mistério . Tenho a olhada de perto desde os R$ 35 . Papel bem alugado mas não cede nunca ! @ferrisss

esse "tenho a olhada", o "a" é um PRON, certo? Então esse olhada marca como erro de digitação?

@arianidf
Copy link

arianidf commented May 4, 2021

Laura, o "a" é mesmo PRON e o eu acho que "olhada" é, na verdade, "olhado" (ficando "tenho a olhado"). Nesse caso, anote "olhada" como erro de digitação, sim.

@llauragazana
Copy link

Pessoal, não sei se é só o meu pacote que está assim, mas quase todos os tweets que tem o hífen ou o sinal de menos, ele vira um "underline". Mas o curioso é que eu vejo no tweet como hífen/sinal de menos, mas quando eu clico para abrir e ver as anotações, ele muda pra underline. Quando a arvore está fechada, é certinho o sinal mas quando eu abro, ele desce. Não sei se a Carol e o Gabriel observaram isso também. Nesse caso, é um erro de pré processamento? Segue alguns exemplos:

"25/ 04 O Ibovespa fechou em queda de _ 0,81 % , a os 51.399 pontos . Destaques : AEDU3 _ 3,72 % , MFRG3 _ 2,88 % e HGTX _ 2,74 % ." ( - 3,72 fica-> _3,72 ; - 2,88 fica -> _ 2,88...etc)

Conheça a queridinha de o Ibovespa , papel é recomendado 15 vezes . Chama _ se VALE5 . Uma empresa com fundamentos , produtiva e rentável . (Chama-se fica -> Chama_se)

@gabrielceregatto
Copy link
Author

Eu não havia percebido, mas no meu também está mudando para underline depois que abro a árvore da sentença! Me parece ser um problema da plataforma, mas não tenho certeza.

@gabrielceregatto
Copy link
Author

gabrielceregatto commented May 6, 2021

Boa noite! Me deparei com sentenças como a seguinte:

BM & amp , FBovespa ( #BVMF3 ) negocia volume 6,7 % menor em fevereiro . http://t.co/0EEfEadv9Y ( Estadão )

Esse nome BM & amp , FBovespa aparece em mais de uma sentença, mas não encontrei em textos escritos na rede. Descobri que se refere à bolsa de valores brasileira. A forma que encontrei na rede é BM&FBovespa ou BM&F Bovespa

Registro aqui minha dúvida quanto à anotação das tokens & e amp. Anoto como PROPN? Ou é algum tipo de erro de processamento?

@arianidf
Copy link

arianidf commented May 6, 2021

Gabriel, ao que parece (puro achismo!!), o E comercial (&) ocorre por vezes na web seguido da abreviação "amp" (que deve ser uma abreviação de "ampersand", outro nome de &). Aliás, no DANTE, o símbolo & sempre aparece seguido de "amp,". Como a forma mais frequente na web é BM&FBovespa, creio que, mesmo com a ocorrência do "amp,", a sequência "BM & amp , FBovespa" seja um único token (BM&amp,FBovespa), anotado com PROPN. Por enquanto, sugiro anotar como erro de pré-processamento para passarmos ao Emanuel.

@NortonTR
Copy link

NortonTR commented May 6, 2021

O caractere "&" é um caractere de escape em HTML (usado para formatar páginas web). Para que o browser mostre o "&", alguns editores inserem seu código HTML: "&". Então "&" é a codificação html do "&"

@gabrielceregatto
Copy link
Author

gabrielceregatto commented May 11, 2021

Boa tarde!

No segundo pacote, encontrei o seguinte tweet:

@sidimarcoelho de segunda ate hoje , elet3 subiu 11,4 % e a elet6 6,6 % ta acompanhando ? ? ? Fiquei contente pa kct , adivinha pq ? ? ?

Fiquei em dúvida em relação ao "por que" abreviado no final do tweet. Entendo que, em sentenças interrogativas, o "pq" não abreviado representa a forma separada "por que". Nesse caso, seriam dois tokens distintos contraídos em um único token. Como deveríamos anotar?

@arianidf
Copy link

Gabriel, o "pq" no final do tweet é, segundo Sanguinett et al (2020), um "fenômeno transversal" (transverse phenomena), o qual afeta o número de tokens em relação à "língua padrão". No caso, trata-se do "por quê", como em "Sabem por quê (motivo)?". Acho que esse é um caso de se dividir (split up) o token em dois tokens (pq --> por quê) para a correta anotação morfossintática em ADP, PRON. Por enquanto, anote com X para discutirmos na próxima reunião.

@llauragazana
Copy link

Pessoal, boa noite!

Nessa sentença: Inglêiz eu não sei , maiz heim portuguêiz eu çôu fera :P hu3 - podemos ver vários "erros", mas a pessoa muito provavelmente digitou com sarcasmo.. vocês vão considerar erro ou acham melhor marcar normal? fiquei pensando se não prejudica o aprendizado marcar normal essas palavras "erradas" mas também eu sei que não foi um "erro".. o que vocês acham? haha

@NortonTR
Copy link

NortonTR commented May 14, 2021 via email

@arianidf
Copy link

Concordo!

@carolpstl
Copy link

Bom dia, pessoal! Tudo bem?
Desculpa compartilhar minhas dúvidas já em um horário perto da entrega, mas que geralmente as separo assim que acabo minha revisão.

As minhas dúvidas são as seguintes:

  1. #VALE5 será q hj vc irá repicar Valedita ? ? 
  • "Valendita"  está com um diminutivo mais ligado ao espanhol. Mesmo assim a anotação continua PROPN e não como erro de digitação?
  1. A gente estamos em a contra _ mão de o @ ferrisss ! ! Amanhã , nossa gestora vai vender JBSS3 ! ! Call de venda , vai cair muito ! ! 
  • Em "contra - mão" fiquei em dúvida entre a anotação "erro de digitação", já que a grafia adequada da palavra é contramão, e "erro de pré-processamento", já que era pra ser um único token. Nesses casos, vamos priorizar alguma anotação?
  1. Aparentemente #LLXL3 se despede de o ibov em a proxima carteira . Aproveitem para dar tchau ! @ferrisss @dfittarelli 
  • "tchau", nesse contexto, ainda seria anotado como INTJ? Fiquei em dúvida se nesse caso poderia ser anotado com NOUN por ser um argumento verbal.
  1. #petr4 12,57 falta beeeem pouco ... 
    • RT @rachelasdfglee : GOLOOOOOOOOOOOoOOOOO 
  • Essa talvez seja uma diretriz que eu não lembro, pois, no pacote 2, há a setença "@ana_cruz3 miraaaaadas" com "mirada" marcada como NOUN. Dessa forma, mesmo que a grafia da palavra mude com o aumento das vogais de uma sílaba, a anotação ainda será a que leva em conta a função sintática e não "erro de digitação"?
  1. @instmillenium de aí fica bem marcado que os governos levam 53 % + o imposto sobre o frete , e a Petr4 vai afundando em dívidas !
  • ITUB4 ja negociou + de 300M ? Ta certo meu sistema aqui ? @ferrisss @dfittarelli @JPedro_Sullivan

Em relação ao símbolo +, fiquei em dúvida se marcava como SYM ou com sua função sintática. Por exemplo, na primeira sentença. vejo esse + como adição, então acredito que possa ser anotado como SYM, mas, na segunda, vejo como ADV. Faz sentido? hahah. Ou a anotação será sempre em SYM nesses casos?

  1. #goll4 vou tirar de a frente para a não enfartar 
  • #VALE5 Opções compre bastante , joga seu dinheiro em opções para a virar pó kkkkk 
  • RT @cafecomtorradas : Mais que incompetência : é preciso vocação revolucionária para a fazer o que fizeram com a Petrobras . #PETR4
  • com impressionantes ... 500 #PETR4 ... ( é para a despistar tio ? =P )
  • @clubedopairico Ibovespa em as médias . Se bobear de a para a brincar de urso se o mov . de a PETR4 for só uma correção . De olho ! o.O
  • @DepBolsonaro procurem analistas de mercado para a fazerem perguntas incisivas a Foster . Ajudem quem tem FGTS investido em a PETR4 .

Percebi que nesse pacote há uma recorrência de"para a" antes de verbos no infinitivo. No entanto, essa construção parece estanha para mim, o a para estar sobrando. Será que é algum erro de pré-processamento ou seria uma característica de escrita de um usuário e, logo, algum erro de digitação?

  1. pô , de novo leilão de a #PETR4 começando em os R$ 33,00 ? ! ! ? ! ? 
  • Aqui fiquei em dúvida na anotação da expressão fixa "de novo", seria anotado como ADP, ADJ mesmo

@NortonTR
Copy link

NortonTR commented May 24, 2021 via email

@llauragazana
Copy link

Pessoal, já começando o pack4..
RT @ojappadonodo6 : @garimpodeacoes $RSID3 4Q13 ( N ) Geração Op de Caixa forte , com desalavancagem financeira . Margens se recuperam YoY . http …

o que é esse "4Q13 (N)" veio como PROPN PUNCT E_PROC PUNCT.. eu joguei no google mas não entendi muito bem.

@NortonTR
Copy link

NortonTR commented May 24, 2021 via email

@arianidf
Copy link

arianidf commented May 24, 2021 via email

@carolpstl
Copy link

Oi Carol. Vou tentar responder (com ênfase no tentar :-) ). Basicamente, melhor discutirmos na quarta, mas deixo aqui algumas opiniões...

  1. #VALE5 será q hj vc irá repicar Valedita ? ? - "Valendita" está com um diminutivo mais ligado ao espanhol. Mesmo assim a anotação continua PROPN e não como erro de digitação? Porque não é um erro. A UD diz que, se conseguirmos identificar qual é a
    função/classificação da palavra em outra língua, devemos usar essa classificação, como se tivesse sido escrita em português.
  2. A gente estamos em a contra _ mão de o @ ferrisss ! ! Amanhã , nossa gestora vai vender JBSS3 ! ! Call de venda , vai cair muito ! ! - Em "contra - mão" fiquei em dúvida entre a anotação "erro de digitação", já que a grafia adequada da palavra é contramão, e "erro de pré-processamento", já que era pra ser um único token. Nesses casos, vamos priorizar alguma anotação? Boa pergunta (leia-se, não sei a resposta). Vamos discutir isso quarta. 1. Aparentemente #LLXL3 se despede de o ibov em a proxima carteira . Aproveitem para dar tchau ! @ferrisss https://github.com/ferrisss @dfittarelli - "tchau", nesse contexto, ainda seria anotado como INTJ? Fiquei em dúvida se nesse caso poderia ser anotado com NOUN por ser um argumento verbal. Usando o artigo como desambiguador, que é o que temos feito, eu acredito
    que seria NUN sim... não parece ser interjeição. Maaaaasss, esse sou eu. Vamos ver quarta.
  3. #petr4 12,57 falta beeeem pouco ... - RT @rachelasdfglee : GOLOOOOOOOOOOOoOOOOO - Essa talvez seja uma diretriz que eu não lembro, pois, no pacote 2, há a setença @.***_cruz3 miraaaaadas" com "mirada" marcada como NOUN. Dessa forma, mesmo que a grafia da palavra mude com o aumento das vogais de uma sílaba, a anotação ainda será a que leva em conta a função sintática e não "erro de digitação"? Não lembro também... Alguma ideia Ariani? 1. @instmillenium de aí fica bem marcado que os governos levam 53 % + o imposto sobre o frete , e a Petr4 vai afundando em dívidas ! - ITUB4 ja negociou + de 300M ? Ta certo meu sistema aqui ? @ferrisss https://github.com/ferrisss @dfittarelli @JPedro_Sullivan Em relação ao símbolo +, fiquei em dúvida se marcava como SYM ou com sua função sintática. Por exemplo, na primeira sentença. vejo esse + como adição, então acredito que possa ser anotado como SYM, mas, na segunda, vejo como ADV. Faz sentido? hahah. Ou a anotação será sempre em SYM nesses casos?
    Olha Carol, você tem que parar de fazer pergunta difícil... faz sentido sim. Ele é usado como uma abreviação, por assim dizer, de "mais". Tem algo no nosso manual sobre isso?
  4. #goll4 vou tirar de a frente para a não enfartar - #VALE5 Opções compre bastante , joga seu dinheiro em opções para a virar pó kkkkk - RT @cafecomtorradas : Mais que incompetência : é preciso vocação revolucionária para a fazer o que fizeram com a Petrobras . #PETR4 - com impressionantes ... 500 #PETR4 ... ( é para a despistar tio ? =P ) - @clubedopairico Ibovespa em as médias . Se bobear de a para a brincar de urso se o mov . de a PETR4 for só uma correção . De olho ! o.O - @DepBolsonaro procurem analistas de mercado para a fazerem perguntas incisivas a Foster . Ajudem quem tem FGTS investido em a PETR4 . Percebi que nesse pacote há uma recorrência de"para a" antes de verbos no infinitivo. No entanto, essa construção parece estanha para mim, o a para estar sobrando. Será que é algum erro de pré-processamento ou seria uma característica de escrita de um usuário e, logo, algum erro de digitação?
    Olhando o corpus original, é erro de tokenização. Nos exemplos que você deu, em todos os casos, "para a" está originalmente como "pra"
  5. pô , de novo leilão de a #PETR4 começando em os R$ 33,00 ? ! ! ? ! ? - Aqui fiquei em dúvida na anotação da expressão fixa "de novo", seria anotado como ADP, ADJ mesmo Não é locução adverbial? O manual diz o que nisso?
    N

    — You are receiving this because you commented. Reply to this email directly, view it on GitHub <#11 (comment)>, or unsubscribe https://github.com/notifications/unsubscribe-auth/AQQ2JOLVBJY3GKISSUCXQQTTO7BGHANCNFSM42WVHLSQ .

Muito obrigada, professor!

@carolpstl
Copy link

Bom dia, pessoal! Tudo bem?

Reparei que nesse pacote a separação entre preposição e artigo (por exemplo, em a e de a) apareceram com letra maiúscula na preposição em todas as sentenças. Nesse caso, é necessário colocar anotação de erro de pré-processamento?

  • Os 3 motivos para a derrocada De a Vale hoje , ações caem mais de 3 % : Além De a China , papel é pr ... http://t.co/R0uWXA99UG #infomoney #vale5
  • Bolsa : cerveja mais cara não atrapalha preços De as ações De a AMBEV http://t.co/gXHVYGms0Q #impostos #ABEV3 #bolsa 
  • RT @chrinvestor : Com o provável racionamento de água em SP , atualmente investir Em a Sabesp representa um risco elevado . #SBSP3 _ 23 % em 2014 . 
  • Já está disponibilizada Em o website de RI a apresentação de resultados De o 4T13 . Confira : http://t.co/psKWHcab95 $LIGT3 
  • Veja as melhores ações para comprar Em esta semana , de acordo com 8 corretoras : Os papéis De a G ... http://t.co/L6OsbF6Os6 #infomoney #vale5
  • Entramos Em a compra Para a posição de CSNA3 hoje a 9.60 . Estamos Em o game .
  • A LIGHT S.A. fechou o dia de hoje A o preço de R$ 20,10 ( + 0,00 % ) com volume de R$ 14,24 mm . $LIGT3

@NortonTR
Copy link

NortonTR commented May 29, 2021 via email

@arianidf
Copy link

arianidf commented May 29, 2021 via email

@carolpstl
Copy link

carolpstl commented May 29, 2021

Também acho que se deve colocar E_PPROC nesses casos! A. Em sáb., 29 de mai. de 2021 às 08:27, carolpstl @.***> escreveu:

Bom dia, pessoal! Tudo bem? Reparei que nesse pacote a separação entre preposição e artigo (por exemplo, em a e de a) apareceram com letra maiúscula na preposição em todas as sentenças. Nesse caso, é necessário colocar anotação de erro de pré-processamento? - Os 3 motivos para a derrocada De a Vale hoje , ações caem mais de 3 % : Além De a China , papel é pr ... http://t.co/R0uWXA99UG #infomoney #vale5 - Bolsa : cerveja mais cara não atrapalha preços De as ações De a AMBEV http://t.co/gXHVYGms0Q #impostos #ABEV3 #bolsa - RT @chrinvestor : Com o provável racionamento de água em SP , atualmente investir Em a Sabesp representa um risco elevado . #SBSP3 _ 23 % em 2014 . - Já está disponibilizada Em o website de RI a apresentação de resultados De o 4T13 . Confira : http://t.co/psKWHcab95 $LIGT3 - Veja as melhores ações para comprar Em esta semana , de acordo com 8 corretoras : Os papéis De a G ... http://t.co/L6OsbF6Os6 #infomoney #vale5 - Entramos Em a compra Para a posição de CSNA3 hoje a 9.60 . Estamos Em o game . - A LIGHT S.A. fechou o dia de hoje A o preço de R$ 20,10 ( + 0,00 % ) com volume de R$ 14,24 mm . $LIGT3 — You are receiving this because you commented. Reply to this email directly, view it on GitHub <#11 (comment)>, or unsubscribe https://github.com/notifications/unsubscribe-auth/ATO63PEQRQL4KHG7LSSLGU3TQDFSRANCNFSM42WVHLSQ .
-- Professora Associada Departamento de Letras - Federal de São Carlos Núcleo Interinstitucional de Linguística Computacional

muito obrigada, @NortonTR e @arianidf!

@llauragazana
Copy link

Pessoal, estou revisando as sentenças eu vi que aparece algumas vezes "Ago / e" e eu não tinha percebido que era "Ago/Age", ou seja, Assembleia Geral Ordinária e Assembleia Geral Extraordinária. Mas como anota isso? NOUN PUNC NOUN? NOUN PUNCT E_PROC? ou tudo como E_PROC?

@arianidf
Copy link

arianidf commented May 29, 2021 via email

@llauragazana
Copy link

Laura, Como ficou a tokenização disso no Pack 4? A. Em sáb., 29 de mai. de 2021 às 12:48, llauragazana @.***> escreveu:
Pessoal, estou revisando as sentenças eu vi que aparece algumas vezes "Ago / e" e eu não tinha percebido que era "Ago/Age", ou seja, Assembleia Geral Ordinária e Assembleia Geral Extraordinária. Mas como anota isso? NOUN PUNC NOUN? NOUN PUNCT E_PROC? ou tudo como E_PROC? — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub <#11 (comment)>, or unsubscribe https://github.com/notifications/unsubscribe-auth/ATO63PHT6TXG45Y5LFCU4RLTQEEDVANCNFSM42WVHLSQ .
-- Professora Associada Departamento de Letras - Federal de São Carlos Núcleo Interinstitucional de Linguística Computacional

Veio "Ago" "/" "e"
eu deixei tudo E_PROC pq pensei que deveria vir "Ago/e", mas pensando agora não sei se é o ideal.. são 2 coisas

@llauragazana
Copy link

Boa noite!

Apareceu em uma sentença o "2x", como podemos anotar ? seria o "duas vezes", por exemplo: "Eu fui 2x na faculdade"

@arianidf
Copy link

arianidf commented Jun 2, 2021 via email

@llauragazana
Copy link

Laura, Qual é o tweet? A. Em ter., 1 de jun. de 2021 às 23:09, llauragazana @.***> escreveu:
Boa noite! Apareceu em uma sentença o "2x", como podemos anotar ? seria o "duas vezes", por exemplo: "Eu fui 2x na faculdade" — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub <#11 (comment)>, or unsubscribe https://github.com/notifications/unsubscribe-auth/ATO63PAQILVFWOTL4XCWZH3TQWHGRANCNFSM42WVHLSQ .
-- Professora Associada Departamento de Letras - Federal de São Carlos Núcleo Interinstitucional de Linguística Computacional

@BlackWizardX estimulos em a China e futuros ja em alta . Por isso acredito q a VALE pode ir em busca de o seu valor de valer sempre 2x a PETR4 .

vamos ver como a #PETR4 se comporta em o teste de os R$ 14,70 agora ... ( que arrancada doida ... 2x por causa de o IBOPE , que legal ... )

De os bancões , só #BBAS3 cai . Ontem tomaram aluguel de 2x volume negociado em o dia . Será que tem coisa aí ? @ferrisss @dfittarelli

@NortonTR
Copy link

NortonTR commented Jun 2, 2021 via email

@gabrielceregatto
Copy link
Author

gabrielceregatto commented Jun 11, 2021

Bom dia!

Encontrei o seguinte tweet no pacote 6:

Felicio Filho , Marrinha , Segue a tabela de a P16 . + Petr4 . [ ] s PC

Não consegui recuperar o que seria esse "[ ] s PC" no final da sentença, alguém tem uma luz?

@arianidf
Copy link

arianidf commented Jun 11, 2021 via email

@NortonTR
Copy link

NortonTR commented Jun 11, 2021 via email

@gabrielceregatto
Copy link
Author

Ah, entendi! Muito obrigado Ariani e Norton!

Olha o tweet original (no csv): "Felicio Filho, Marrinha, Segue a tabela da P16. + Petr4. []s PC" É "abraços, Pedro Cabeção" (Nome fictício :-P ) N Em sex., 11 de jun. de 2021 às 06:55, arianidf @.> escreveu:

Gabriel, bom dia! Pode ser “abraços”, que normalmente se representa como “[ ]’s”. Estaria só faltando o apóstrofe. Ariani Em sex., 11 de jun. de 2021 às 04:58, gabrielceregatto < @.
> escreveu: > Bom dia! > > Encontrei o seguinte tweet no pacote 6: > > Felicio Filho , Marrinha , Segue a tabela de a P16 . + Petr4 . [ ] s PC > > Não consegui recuperar o que seriam esse "[ ] s PC" ao final da sentença, > alguém tem uma luz? > > — > You are receiving this because you were mentioned. > Reply to this email directly, view it on GitHub > < #11 (comment)>, > or unsubscribe > < https://github.com/notifications/unsubscribe-auth/ATO63PHDY7GPYQ36S7N4LTLTSG6YPANCNFSM42WVHLSQ > > . > -- Professora Associada Departamento de Letras - Federal de São Carlos Núcleo Interinstitucional de Linguística Computacional — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub <#11 (comment)>, or unsubscribe https://github.com/notifications/unsubscribe-auth/AQQ2JONIMMSAC5M6CUGHVKLTSHMPPANCNFSM42WVHLSQ .

@llauragazana
Copy link

Pessoal, esse "segunda" do tweet é de segunda-feira ou de 2ª? Se for de segunda-feira, é noun mesmo ou erro (por estar faltando o -feira) ?

@ferrisss Alta de a Petr4 segunda !

@NortonTR
Copy link

NortonTR commented Jun 15, 2021 via email

@llauragazana
Copy link

Boa tarde, pessoal! Mesmo caso daquele "pq", agora apareceu o "pf" de "por favor"... estou marcando com X, alguma sugestão diferente? O ideal era separar.. mas acredito que isso será cuidado depois rs

Tenho lote grande de PETR4 , me add em o skype pf @brunogmusa @Smarttrade10 @plima79 @ferrisss @dfittarelli @hud

@arianidf
Copy link

arianidf commented Jun 18, 2021 via email

@gabrielceregatto
Copy link
Author

Pessoal, boa tarde!

Encontrei o seguinte tweet: "@clubedopairico Pé frio ! ? Não , isso é sinal de guerra a o mercado ou em o minimo burrice pq foi só o abrir a boca sobre petr4 q a bolsa caiu !"

Fiquei confuso em relação ao "o" logo após o "só". Parece ser um determinante sozinho, sem estar determinando um nome. Mantenho a anotação de DET, marco como erro de digitação ou é algum tipo de erro de pré-processamento que não fui capaz de enxergar?

@arianidf
Copy link

arianidf commented Jun 22, 2021 via email

@NortonTR
Copy link

NortonTR commented Jun 22, 2021 via email

@llauragazana
Copy link

Gente, vocês sabem o que é esse W ?

dante_01_455747937323462656l possivel W em a GGBR4 em o diario

@NortonTR
Copy link

NortonTR commented Jun 22, 2021 via email

@llauragazana
Copy link

Pessoal, esse "fogo" do tweet é daquela expressão "é fogo", no sentido de difícil, complicado, etc. ? Se sim, anota como NOUN mesmo ou ADJ, ou INTJ ?

RT @joanarauhl : hoje nem conseguimos tirar selfie com os lutadores e tivemos de improvisar , fogo

@llauragazana
Copy link

Outra coisa, efeito dessas últimas reuniões com a Magali hahasd eu estou em dúvida em como fica esse "que se"

Aposto uma mariola que se a #PETR4 bater os 9 reais vão falar que o rali de os 12 a os 16 foi pra pegar sardinha deslumbrada .

@arianidf
Copy link

arianidf commented Jun 28, 2021 via email

@arianidf
Copy link

arianidf commented Jun 28, 2021 via email

@gabrielceregatto
Copy link
Author

gabrielceregatto commented Jul 1, 2021

Boa tarde!

Encontrei duas dúvidas no pacote 9, seguem:

#goll4 FDP saí de o sw e ela me sacaneou hj ... faz parte

Alguém conseguiu recuperar o que seria o SW? Encontrei na rede o termo "swing trade", mas não sei nem se a sigla nem o contexto fazem tanto sentido para este termo.

A segunda:

RT @chrinvestor : Nova composição de o índice #Ibovespa passa a valer a partir de 2a . feira . Itaú ( #ITAU4 ) e Bradesco ( #BBDC4 ) com as maiores …

Entendo que o ponto separado de 2a é um erro de pré-processamento, a minha dúvida fica na anotação de feira. Estamos anotando segunda feira como erro de digitação, visto que a grafia normal é segunda-feira. Como faremos para a anotação de essas formas (2a feira, 3a feira, etc)?

@NortonTR
Copy link

NortonTR commented Jul 1, 2021 via email

@llauragazana
Copy link

Boa noite, pessoal!

RT @ale_chumer : PETR4 caindo 3 % , foi bem a ( dês ) Graça Foster hoje ?

Estou em dúvida sobre como anotar esse "dês" kk uma piada com "desgraça"

@arianidf
Copy link

arianidf commented Jul 2, 2021

Boa tarde!

Encontrei duas dúvidas no pacote 9, seguem:

#goll4 FDP saí de o sw e ela me sacaneou hj ... faz parte

Alguém conseguiu recuperar o que seria o SW? Encontrei na rede o termo "swing trade", mas não sei nem se a sigla nem o contexto fazem tanto sentido para este termo.

A segunda:

RT @chrinvestor : Nova composição de o índice #Ibovespa passa a valer a partir de 2a . feira . Itaú ( #ITAU4 ) e Bradesco ( #BBDC4 ) com as maiores …

Entendo que o ponto separado de 2a é um erro de pré-processamento, a minha dúvida fica na anotação de feira. Estamos anotando segunda feira como erro de digitação, visto que a grafia normal é segunda-feira. Como faremos para a anotação de essas formas (2a feira, 3a feira, etc)?

Gabriel,
No manual, os numerais ordinais recebem ADJ, tanto em formato de número quanto por extenso.
Como nas expressões citadas, temos numerais ordinais em formato de número ("2a" e "3a"), acredito que eles devam receber ADJ.
No nível sintático, poderemos assinalar que "2a" e "feira", por exemplo, fazem parte de um todo.
Ariani

@llauragazana
Copy link

Boa tarde!
Encontrei duas dúvidas no pacote 9, seguem:
#goll4 FDP saí de o sw e ela me sacaneou hj ... faz parte
Alguém conseguiu recuperar o que seria o SW? Encontrei na rede o termo "swing trade", mas não sei nem se a sigla nem o contexto fazem tanto sentido para este termo.
A segunda:
RT @chrinvestor : Nova composição de o índice #Ibovespa passa a valer a partir de 2a . feira . Itaú ( #ITAU4 ) e Bradesco ( #BBDC4 ) com as maiores …
Entendo que o ponto separado de 2a é um erro de pré-processamento, a minha dúvida fica na anotação de feira. Estamos anotando segunda feira como erro de digitação, visto que a grafia normal é segunda-feira. Como faremos para a anotação de essas formas (2a feira, 3a feira, etc)?

Gabriel,
No manual, os numerais ordinais recebem ADJ, tanto em formato de número quanto por extenso.
Como nas expressões citadas, temos numerais ordinais em formato de número ("2a" e "3a"), acredito que eles devam receber ADJ.
No nível sintático, poderemos assinalar que "2a" e "feira", por exemplo, fazem parte de um todo.
Ariani

Então ficaria:
"2a feira": ADJ NOUN;
"segunda": NOUN ou ADJ?;
"segunda feira": E_PROC E_PROC;
"segunda-feira": NOUN

Não sei se entendi certo hahaha

@arianidf
Copy link

arianidf commented Jul 5, 2021 via email

@carolpstl
Copy link

carolpstl commented Jul 16, 2021

Boa noite!

Me surgiu uma dúvida na seguinte sentença:
"Nestor Cerveró vai falar agora , 11 horas sobre escândalos de a PETR4 . Que comece a volatilidade !"

Acredito que o "que" na sentença indica o presente do subjuntivo e, por não introduzir nenhuma oração subordinada, eu anotaria como CCONJ. No entanto, no documento de palavras ambíguias do material de referência, não há nenhum exemplo de "que" como CCONJ, então fiquei em dúvida se poderia ser essa anotação mesmo ou SCONJ.

@arianidf
Copy link

arianidf commented Jul 16, 2021 via email

@carolpstl
Copy link

Carol, Eu já havia discutido esse caso com a Magali e esse "que" parece ser SCONJ, pois acompanha uma oração com verbo no subjuntivo. Ariani Em qui., 15 de jul. de 2021 às 22:11, carolpstl @.***> escreveu:

Boa noite! Me surgiu uma dúvida na seguinte sentença: "Nestor Cerveró vai falar agora , 11 horas sobre escândalos de a PETR4 . Que comece a volatilidade !" Acredito que o "que" na sentença indica o presente do subjuntivo e, por não introduzir nenhuma oração subordinada, eu anotaria como CCONJ. No entanto, no documento de palavras ambíguias do material de referência, não há nenhum exemplo de "que" como CCONJ, então fiquei em dúvida se poderia ser essa anotação mesmo. — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub <#11 (comment)>, or unsubscribe https://github.com/notifications/unsubscribe-auth/ATO63PCOXPUUAPHBDOF4KWTTX6BMJANCNFSM42WVHLSQ .
-- Professora Associada Departamento de Letras - Federal de São Carlos Núcleo Interinstitucional de Linguística Computacional

Muito obrigada, professora!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants