Los modelos de la investigación
BASE DE INVESTIGACIÓN. La construcción de la base de datos, llamada SetembroBR, constituyó un primer paso y aparece descrita en un artículo publicado en la revista científica Language Resources and Evaluation. Su nombre es en honor al movimiento Setembro Amarelo
Para realizar el estudio, el grupo de la USP sometió el corpus textual a procedimientos de procesamiento previo y limpieza de datos para remover etiquetas, URL, emoticones y caracteres fuera de estándar, pero manteniendo la escritura original. Se utilizaron métodos de aprendizaje profundo (del inglés deep learning) para crear cuatro clasificadores de texto y embeddings de palabras individualizadas o dependientes de contextos empleando modelos basados en transformers tipo BERT (un algoritmo de aprendizaje profundo). Estos modelos corresponden a una red neural que aprende el contexto y el significado.