#FIQUEEMCASA: análise de sentimento dos usuários do Twitter em relação a pandemia de Covid-19

Quinta-feira, 06 de agosto de 2020

                   
Por Gabriel Pessanha (doutor em Administração pela Ufla e professor do ICSA) e Taylor Oliveira Fidelis (bacharel interdisciplinar em Ciências Econômicas pela UNIFAL-MG, e graduando em Ciências Atuariais na UNIFAL-MG)

     As mídias sociais apresentaram uma nova forma dinâmica de comunicação que cria enormes quantidades de dados diariamente. Além disso, possibilitam um maior acesso a informações que, por via de consequência, podem gerar incrementos na educação e conhecimento da população. Neste cenário, o cidadão deixa de ser um mero receptor de conteúdo da internet e das mídias sociais e passa a ser também produtor, uma vez que, a partir da sua interação em mídias sociais, ele cria e compartilha conteúdo com grande alcance (SOUSA JÚNIOR, PETROLL, ROCHA, 2019).

     O Twitter é uma das mídias sociais mais populares do mundo com, atualmente, 386 milhões de usuários ativos e o Brasil ocupa a 6° posição na lista de países que lideram o ranking em número de usuários (STATICA, 2020). A referida mídia social tem sido utilizada para a identificação de tendências e formulação proativa de estratégias por meio da interlocução entre os usuários e suas reações em relação a instituições públicas, privadas e seus respectivos representantes. Segundo Odlum & Yoon (2015) o Twitter é visto como um meio de transmissão emergente de informações e notícias sobre eventos de saúde pública, evidenciada por sua utilidade durante as atividades de planejamento da pandemia de H1N1. Assim, o amplo alcance do Twitter tem o potencial de capturar tendências epidêmicas, coletar informações e disseminar conhecimento (ODLUM & YOON, 2015).

     Apesar de ser uma importante ferramenta de disseminação de informações para a conscientização da população, a facilidade de acesso, criação, divulgação e compartilhamento de conteúdo fez com que as mídias sociais se tornassem ambiente propício para a veiculação de noticiais imprecisas e falsas, as chamadas Fake News (SOUSA JÚNIOR; PETROLL; ROCHA, 2019). Além do cenário de incerteza e preocupação instaurado, as Fake News contribuem para a disseminação de informações falsas ou imprecisas e ineficientes na conscientização capazes de desinformar e gerar medo e caos. Esta combinação de fatores incrementa os desafios enfrentados pelos governos, especialmente, os órgãos de saúde e os órgãos envolvidos na contenção do novo vírus e representa um sério risco à saúde pública. Sendo assim, monitorar o conteúdo gerado e compartilhado nas mídias sociais se torna importante não somente para identificar falsas informações veiculadas (LANA et al., 2020), mas também para compreender a visão, perspectiva e expectativas da população em relação ao momento crítico atual. Este entendimento possibilita a formulação de políticas públicas de saúde e educação que atendam demandas atuais e combatam a desinformação e o descrédito de informações repassadas pelos meios de comunicação oficiais e/ou tradicionais.

     Neste contexto, este trabalho propõe uma análise de sentimento em relação ao conteúdo das postagens dos usuários no Twitter no Brasil no período de janeiro a julho de 2020. A Análise de Sentimentos foi utilizada por meio do processamento de linguagem natural. As hashtags Covid-19, FiqueEmCasa e suas variações foram utilizadas como recurso de busca e seleção dos tweets. A base de dados foi composta por 51.245 tweets.

    Os dados apresentados na Figura 1 demonstram um comportamento ascendente similar entre as curvas acumuladas de casos confirmados de COVID-19 e tweets relacionados ao tema. Em outras palavras, percebe-se que a série acumulada de casos confirmados de COVID-19 apresenta uma tendência exponencial de crescimento ao passo que a série acumulada de tweets apresenta uma tendência linear de crescimento, porém ambas demonstraram comportamentos ascendentes. As características de tendência (linear e exponencial) das curvas de número de tweets e casos de confirmados de COVID-19 no Brasil são semelhantes aos padrões encontrados por Medford et al. (2020) em tweets em língua inglesa e os casos confirmados do vírus a nível mundial.

FIGURA 1: Séries acumuladas de casos confirmados de COVID-19 e tweets no Brasil
Fonte: Elaboração própria (2020)

     Por meio da análise da Figura 2 nota-se que a maioria das palavras mais frequentes encontradas nos tweets classificados com sentimentos positivos em relação a pandemia de COVID-19 se relaciona a campanha “Fique em casa” que ganhou adesão nacional por meio das mais diferentes mídias a partir de março de 2020. Além disso, palavras como “saúde”, “amigo”, “recuperar”, dentre outras demonstram sinais de otimismo nas mensagens enviadas pelos usuários. Tais movimentos positivos podem estar relacionados às diversas campanhas publicitárias de conscientização e suporte adotadas pelas mais diversas instituições. Além de promover a conscientização, estes movimentos podem, potencialmente, resgatar o espírito de coletividade e esperança da população.

     Com relação ao tweets classificados como negativos, nota-se que a frequência do movimento “Fique em casa” também é expressiva. Entretanto, pode-se também observar a presença de palavras como: “morte”, “casos”, “vida”, “sus”, “pandemia, “quarentena”, dentre outras. Tais constatações denotam a preocupação dos usuários do Twitter em relação a atual conjuntura instaurada e refletem as consequências que a disseminação do vírus trouxe para a população. Além do movimento #FiqueEmCasa, a hashtag “O Brasil pede socorro” também está presente nas mensagens com sentimentos negativos em relação à pandemia. Além disso, é possível notar uma forte ligação entre o tweets analisados e o cenário político brasileiro, tal relacionamento se evidencia mais fortemente nos comentários classificados como negativos.

Figura 2: Nuvem de palavras dos tweets classificados como positivos e negativos.
Fonte: elaboração própria (2020)

     A partir da Figura 3 é possível observar que a maioria dos usuários emitiram mensagens com sentimentos negativos em relação à pandemia, uma vez que, 63,27% das mensagens foram classificadas como negativas, 27,55% como positivas e 9,18% como neutras. Tais dados aliados ao volume de tweets crescentes no período (Figura 1) demonstram a preocupação dos usuários com o contexto vivenciado. A qualidade de classificação do modelo foi atestada pelas métricas de verdadeiro positivo, falsos positivos, acurácia e F-measure, todas as estatísticas foram superiores a 80%, denotando a qualidade do modelo na classificação de tweets, especialmente, com dicionário léxico em português.

     Estes resultados estão em sintonia com os estudos recentes realizados por Pastor (2020) nas Filipinas, Xue et al. (2020) na China, Medford et al. (2020) em tweets de língua inglesa e Lwin (2020) em 170 países. Os estudos conduzidos pelos autores supracitados foram consensuais em apontar o sentimento negativo como dominante nos contextos estudados. Os autores ainda ressaltam que estes resultados tornam imperativa a adoção de políticas e estratégias públicas no trato e manutenção da saúde mental e psicológica da população.

Figura 3: Classificação dos tweets analisados. Fonte: Elaboração própria (2020)

     Já em comparação aos estudos de Delizo et al. (2020) nas Filipinas e Alhajji et al. (2020) na Arábia Saudita, os resultados desta análise se encontram divergentes. Os autores constataram uma predominância de sentimento positivo na população. É importante ressaltar que as especificidades dos países estudados são importantes de serem considerados em análises comparativas. Neste sentido, Alhajji et al. (2020) afirmam que a cultura religiosa do país pode interferir na visão otimista da realidade. Além disso, os autores argumentam que, especificamente, na Arábia Saudita a confiança da população nos representantes públicos e o alinhamento de estratégias de enfrentamento nas mais diferentes esferas podem ter afetado o modo como a população reagiu positivamente a crise vivida. Talvez estas diferenças culturais e políticas expliquem as divergências de sentimentos encontrados entre os estudos. É nítida a influência do cenário político brasileiro da formulação dos comentários compartilhados no Twitter, especialmente, nos comentários negativos.

     Em linhas gerais, as descobertas deste estudo revelam que as emoções negativas estão presentes de maneira predominante em todo o período em que o país vivenciou a pandemia de COVID-19, tal evidência apoia a necessidade de ações que mantenham o bem-estar mental da população neste momento de crise (HOLMES et al, 2020; BAVEL et al., 2020). Bavel et al. (2020) e Duan & Zhu (2020) argumentam que se emoções negativas dominantes não forem abordadas, há um grande potencial de surgimento de resultados indesejados, como desconfiança em relação ao manejo da doença e, consequentemente, perda de credibilidade dos órgãos públicos, especialmente, os de trato e contenção do vírus.

     Este estudo contribui para melhorar a compreensão do conteúdo das mídias sociais durante uma emergência de saúde pública de interesse internacional, como é o caso da COVID-19. Os resultados são importantes para monitorar tendências e identificar os movimentos das postagens em torno de tópicos específicos. Este monitoramento contínuo pode auxiliar as organizações de saúde a gerir proativamente momentos de crise tanto em relação a adoção de medidas para tranquilizar, conscientizar e zelar pelo bem-estar da população em geral quanto agir tempestivamente para contornar e gerar os sentimentos em torno de notícias falsas (Fake News) e imprecisas, evitando com que estas sejam amplamente divulgadas e suas consequências geram desinformação, medo e falta de credibilidade nas mídias oficiais.

     Além disso, o Twitter pode ser uma potencial ferramenta a ser utilizada pela vigilância de surtos e epidemias, pois o conteúdo das mídias sociais pode ser usado para apoiar e aprimorar os sistemas de alerta. A ferramenta pode ser usada para a disseminação de informações em massa, esta estratégia amenizaria o déficit de medo e de conhecimento que se configuram como agravantes e podem potencializar a evolução de epidemias. Em trabalhos futuros pretende-se desenvolver estudos de sentimentos nos estados brasileiros a fim de se conhecer potenciais influências das diferentes estratégias adotadas pelos governadores no sentimento da população. Além disso, estuda-se a expansão do estudo para outras mídias sociais, Facebook e Instagram, por exemplo e adotar para fins de comparação outras bibliotecas e dicionários na classificação dos sentimentos dos tweets.

 

Referências

  1. Alhajji, M.; Al Khalifah, A.; Aljubran, M.; Alkhalifah, M. (2020) Sentiment Analysis of Tweets in Saudi Arabia Regarding Governmental Preventive Measures to Contain COVID-19. Preprints, 2020040031 (doi: 10.20944/preprints202004.0031.v1).
  2. Bavel JJV, Baicker K, Boggio PS, Capraro V, Cichocka A, Cikara M, et al. (2020) Using social and behavioural science to support COVID-19 pandemic response. Nat Hum Behav Apr 30.
  3. Delizo, J D. et al. (2020) International Journal of Advanced Trends in Computer Science and Engineering, 9(1.3), 408 – 412
  4. Duan L, Zhu G.(2020) Psychological interventions for people affected by the COVID-19 epidemic. Lancet Psychiatry ;7(4):300-302
  5. Holmes E.A., O’Connor R.C., Perry V.H., Tracey I, Wessely S, Arseneault L, et al. (2020) Multidisciplinary research priorities for the COVID-19 pandemic: a call for action for mental health science. Lancet Psychiatry ,Apr 15
  6. Lana, R. M. et al. (2020) Emergência do novo coronavírus (SARS-CoV-2) e o papel de uma vigilância nacional em saúde oportuna e efetiva. Cadernos de Saúde Pública, [S.l.], v. 36, n. 3
  7. Lwin MO, Lu J, Sheldenkar A, Schulz PJ, Shin W, Gupta R, Yang Y. (2020) Global Sentiments Surrounding the COVID-19 Pandemic on Twitter: Analysis of Twitter Trends JMIR Public Health Surveill 2020;6(2):e19447DOI: 10.2196/19447
  8. Medford, R. J. et al. (2020) An “Infodemic”: Leveraging High-Volume Twitter Data to Understand Early Public Sentiment for the COVID-19 Outbreak, Open Forum Infectious Diseases, , ofaa 258. Recuperado em 20 de junho 2020 dehttps://doi.org/10.1093/ofid/ofaa258
  9. Odlum, M., & Yoon, S. (2015). What can we learn about the Ebola outbreak from tweets?. American journal of infection control, 43(6), 563–571. Recuperado em 20 de junho 2020 de https://doi.org/10.1016/j.ajic.2015.02.023
  10. Sousa Júnior, J. H.; Petroll, M. D. L. M.; Rocha, R. (2019) A. Fake News e o Comportamento Online dos Eleitores nas Redes Sociais durante a Campanha Presidencial Brasileira de 2018. In: XXII SEMEAD – SEMINÁRIOS EM ADMINISTRAÇÃO, USP, São Paulo, 2019.
  11. Statista (2020) Statista. Recuperado em 20 de junho 2020 de https://www.statista.com/statistics/1043366
  12. Xue, J. et al. (2020) Public discourse and sentiment during the COVID-19 pandemic: using Latent Dirichlet Allocation for topic modeling on Twitter. 2005.08817. arXiv. cs.SI.