Ciencia de los Datos Aplicada

Grado y Doble Grado. Curso 2026/2027.

MINERÍA DE TEXTO - 806326

Curso Académico 2026-27

Datos Generales

SINOPSIS

COMPETENCIAS

Generales
CG1, CG5, CG6, CG10
Específicas
CE2, CE4, CE7, CE8, CE9, CE11, CE12, CE14.

ACTIVIDADES DOCENTES

Clases teóricas
50%
Clases prácticas
50%

Presenciales

2,4

No presenciales

3,6

Semestre

7

Breve descriptor:

La Minería de Texto o 'Text Mining' (TM) hace referencia al proceso y metodología que se encarga de extraer información y patrones de interés subyacentes a un conjunto de datos de naturaleza lingüística. El TM forma parte de uno de los pilares fundamentales del Procesamiento del Lenguaje Natural o 'Natural Language Processing' (NLP), metodología que ha cobrado gran protagonismo en los últimos años en el contexto de la Ciencia de Datos e Inteligencia Artificial. A lo largo del curso, se abordarán técnicas fundamentales como el procesamiento de información, la representación vectorial de textos, la minería de opiniones y sentimientos, el modelado de temas (topic modeling), y el uso de algoritmos de aprendizaje automático aplicados al lenguaje natural. Asimismo, se prestará especial atención al tratamiento previo del lenguaje (preprocessing), a las herramientas de programación más utilizadas (como R y Python) y a la evaluación de modelos.

Objetivos

Conocer y adquirir las habilidades para poder:

(1) Procesar y minar información subyacente a datos con formato textual en contextos Big Data.

(2) Representar visualmente información textual que resuma los descriptivos de los datos tipo texto.

(3) Aplicar técnicas de 'clustering' y diccionarios para detectar temáticas y sentimientos subyacentes a los datos.

(4) Aplicar técnicas de aprendizaje automático a datos tipo texto.

Contenido

1. Introducción: Obtención y procesamiento básico de texto.

2. Análisis exploratorio y descriptivo de texto y su representación visual.

3. Técnicas de Análisis de Sentimiento basadas en diccionarios.

4. Matrices basadas en frecuencias y Word2vec.

5. Topic Modelling.

6. Teoría de grafos aplicada a textos.

7. Machine Learning aplicado a datos de texto.

8. Transformers: few-shot y zero-shot classification.

Evaluación

Esta asignatura se evaluará de forma continua a través de la realización de actividades y pruebas de evaluación sobre los contenidos de la asignatura. La nota media de la evaluación continua será el 40% de la nota final. El examen final sumará el 60% restante de la nota. La calificación final de la asignatura se obtendrá como el máximo entre:

a) La calificación del examen final.
b) La media ponderada de la evaluación continua (40%) y el examen final (60%).

Cualquier alumno/a tendrá derecho a una prueba final, pudiendo resultar su calificación la nota final del curso.

Bibliografía

Qamar, U., y M. S. Raza. 2024. Applied Text Mining. Springer Nature Switzerland.
Silge, J., y D. Robinson. 2017. Text Mining with R: A Tidy Approach. O’Reilly Media.

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Actividades Prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo Único07/09/2026 - 18/12/2026MIÉRCOLES 18:00 - 20:00-GUILLERMO VILLARINO MARTINEZ
JUAN ANTONIO GUEVARA GIL


Clases Teóricas y/o Prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo Único07/09/2026 - 18/12/2026VIERNES 18:00 - 20:00-GUILLERMO VILLARINO MARTINEZ
JUAN ANTONIO GUEVARA GIL