Extraindo insights de bios no Twitter: 3-gram analysis

Em outro post, chamado “Extraindo insights de bios no Twitter: 2-gram analysis” falamos de como é possível extrair insights a partir de bios no Twitter analisando pares de palavra. É uma análise chamada de n-gram, na qual a frequência de termos são utilizados como indicadores de padrões discursivos ou expressivos.

Hoje apresentamos, também com o processamento de 100 mil perfis aleatórios de nossa base de perfis brasileiros, a medição 3-gram analysis. Desta vez, então, são identificados os trios mais frequentes de palavras. Confira abaixo:

3-gram analysis - twitter brasileiro

Comparativamente ao estudo de 2-gram analysis, é possível identificar também a presença de muitos termos em inglês. O trio de palavras também permite encontrar marcadores profissionais/educacionais. Estudantes de direito e jornalismo adoram o Twitter!

Veja o documento completo abaixo:

[slideshare id=46459659&doc=3-gramanalysis-biostwitterbrasileiro-150330125518-conversion-gate01&type=d]

Deixe uma resposta