Diario de León

Los modelos de la investigación

BASE DE INVESTIGACIÓN. La construcción de la base de datos, llamada SetembroBR, constituyó un primer paso y aparece descrita en un artículo publicado en la revista científica Language Resources and Evaluation. Su nombre es en honor al movimiento Setembro Amarelo

DI18P4F2-10-09-04-4.jpg

DI18P4F2-10-09-04-4.jpg

Publicado por
León

Creado:

Actualizado:

Para realizar el estudio, el grupo de la USP sometió el corpus textual a procedimientos de procesamiento previo y limpieza de datos para remover etiquetas, URL, emoticones y caracteres fuera de estándar, pero manteniendo la escritura original. Se utilizaron métodos de aprendizaje profundo (del inglés deep learning) para crear cuatro clasificadores de texto y embeddings de palabras individualizadas o dependientes de contextos empleando modelos basados en transformers tipo BERT (un algoritmo de aprendizaje profundo). Estos modelos corresponden a una red neural que aprende el contexto y el significado.

tracking