Aprende desde cero técnicas de procesamiento de lenguaje natural (PLN) para analítica de textos
Categorías: Ciencia de Datos
¿Qué aprenderás?
- Aprende a resolver problemas de analítica de textos utilizando técnicas de procesamiento de lenguaje natural con Python. Extrae información estructurada de textos y convierte esta información en bonitos datos tabulados.
- Aprenderás a trabajar con las estructuras básicas de datos en Python, en especial con las cadenas (strings). Y te introducirás en el uso de una librería todo terreno como NLTK y en en la plataforma más actual para el uso de transformers: Hugging Face.
- Al completar este curso tendrás en tus manos herramientas que te permitirán resolver la gran mayoría de los problemas básicos de Analítica de Textos.
- Concepto y usos de la analítica de textos.
- Las principales tareas de las que se encarga el PLN.
- Traducción automática.
- Sistemas de diálogo.
- Sistema de respuestas a preguntas.
- Implicación textual.
- Resumen automático.
- Clasificación de textos.
- Reconocimiento de entidades nombradas.
- Manejo de cadenas (strings) en Python.
- Introducción a las expresiones regulares en Python.
- Tokenización de textos.
- Reducción del vocabulario con técnicas de stemming.
- Identificación del vocabulario (lematización).
- Cálculo de frecuencias de palabras.
- Extracción información utilizando Transformers y todo lo que las modernas redes neuronales artificiales nos pueden ofrecer.
- Aplicaciones de la librería NLTK.
- Algunos usos de la plataforma Hugging Face.
- Para que aprendas rápido, y no olvides pronto, te hemos preparado materiales como vídeos, PDFs con instrucciones básicas, un documento con un itinerario del curso (dependiendo del nivel de experiencia previa), cuadernos de Google Colab con prácticas y ejercicios.
Contenido del curso
Introducción: ¿Cómo sacarle partido a este curso?
En pocas palabras, una descripción del curso y qué necesitas para completarlo. También de dejo una serie de itinerarios que puedes seguir dependiendo de tu nivel de conocimiento previo de Python.
-
¿De qué se trata este curso?
00:00 -
¿Cómo sacarle partido a este curso?
00:00 -
¿Cómo utilizar Google Colab?
00:00
Definición y principales tareas del procesamiento de lenguaje natural y de la analítica de textos
Te presento la definición de PLN y de analítica de textos. Y te explico todo lo que engloban estas disciplinas.
-
¿Qué es el procesamiento de lenguaje natural?
08:37 -
Problemas clave del PLN (1): Traducción automática
14:25 -
Problemas clave del PLN (2): Sistemas de diálogo (1)
08:26 -
Problemas clave del PLN (2): Sistemas de diálogo (2)
10:05 -
Problemas clave del PLN (3): Sistemas de respuestas a preguntas
06:52 -
Problemas clave del PLN (4): Reconocimiento de implicación textual
10:28 -
Problemas clave del PLN (5): Resumen automático de textos
07:37 -
Problemas clave del PLN (6): Clasificación de documentos
10:30 -
Comprensión y generación de lenguaje natural
11:00 -
Lingüística: composición de unidades del lenguaje
14:29 -
Analítica de textos
10:29 -
Usos de la analítica de textos
06:36 -
Cuestionario: analítica de textos y procesamiento de lenguaje natural
Procesamiento de textos con Python y NLTK
Vamos desde lo más simple (cadenas de texto en Python) hasta lo más complejo (uso de la librería NLTK) con el propósito de que aprendas las técnicas básicas del PLN.
-
Un tour por Python
14:30 -
Python y la programación orientada a objetos.
08:02 -
Python y la programación funcional
07:34 -
Cadenas (strings) en Python
04:31 -
¿Qué métodos tienen las cadenas en Python?
02:02 -
Cadenas multilíneas
02:54 -
Clases (tipos) de cadenas en Python
00:00 -
Operaciones con cadenas
08:22 -
Corte de cadenas (1)
04:46 -
Corte de cadenas (2)
07:50 -
Corte de cadenas (3)
08:39 -
Métodos de cadenas (1)
06:40 -
Métodos de cadenas (2)
07:54 -
Métodos de cadenas (3)
05:12 -
Formato de cadenas (1)
03:27 -
Formato de cadenas (2)
10:13 -
Formato de cadenas (3)
02:19 -
Cuestionario: cadenas en Python
-
NLTK: Te presento su documentación
06:09 -
NLTK: Preprocesamiento – Carga de textos
07:41 -
Extracción de texto de un HTML con Beautiful Soup (1)
03:19 -
Extracción de texto de un HTML con Beautiful Soup (2)
07:20 -
Almacenar un texto en un archivo utilizando Python
04:04 -
Recuperar un texto almacenado en un archivo utilizando Python
02:56 -
NLTK: Normalización (limpieza) de textos
07:46 -
NLTK: Tokenización
06:08 -
NLTK: Tokenizar oraciones
02:40 -
NLTK: Separación y limpieza de oraciones
06:12 -
NLTK: Obtener tokens de una lista de oraciones
05:23 -
NLTK: Stemming (obtención de las raíces de las palabras)
09:27 -
NLTK: Lematización de palabras (1)
04:08 -
NLTK: Lematización de palabras (2)
07:39 -
NLTK: Encontrar palabras funcionales
03:54 -
NLTK: Reconocimiento de nombres propios
01:36 -
NLTK: Lista de palabras válidas para una lengua
02:13 -
NLTK: Descubrir palabras frecuentes (1)
02:30 -
NLTK: Descubrir palabras frecuentes (2)
04:25 -
NLTK: ¡Pongamos junto lo aprendido dentro de una función!
07:54 -
NLTK: Vectorizar las palabras que componen un texto (un ejemplo)
05:36 -
Cuestionario: NLTK
-
Ejercicio guiado de NLTK: Planteamiento
04:09 -
Ejercicio guiado de NLTK: Solución
08:57 -
Cuaderno del ejercicio de extracción de características con NLTK
00:00
PLN con Transformers (Hugging Face)
Clasifica textos y extrae información utilizando lo último de la tecnología del PLN.
-
Aprendizaje automático y algoritmos
15:22 -
Red neuronal artificial (RNA)
15:40 -
Introducción a los Transformers
13:16 -
Documentación y descripción del Hub de Hugging Face
08:24 -
Instalación de la librería «transformers»
03:02 -
Texto que vamos a utilizar para probar cosas
02:43 -
Clasificación (análisis de sentimientos)
09:35 -
NER: Reconocimiento de entidades nombradas
06:50 -
Sistema de respuestas a preguntas
04:56 -
Resumen automático
06:33 -
Traducción automática
08:13 -
¡Preparemos todo para empezar a trabajar con el español!
02:58 -
Analizador de sentimientos para el español
09:56 -
Reconocedor de entidades nombradas para el español (1)
06:41 -
Reconocedor de entidades nombradas para el español (2)
05:53 -
Encontrar respuestas a preguntas en español
06:48 -
Resumidor automático en español
09:52 -
¡Crea un clasificador zero-shot para textos en español!
12:43 -
Genera texto en español (GPT-2)
04:44 -
Cuaderno de Google Colab para el ejercicio guiado
00:00 -
Ejercicio guiado de Hugging Face: Extrae datos de reseñas de Amazon y crea una tabla con ellos (1)
06:40 -
Ejercicio guiado de Hugging Face: Extrae datos de reseñas de Amazon y crea una tabla con ellos (2)
03:52 -
Ejercicio guiado de Hugging Face: Extrae datos de reseñas de Amazon y crea una tabla con ellos (3)
04:37 -
Ejercicio guiado de Hugging Face: Extrae datos de reseñas de Amazon y crea una tabla con ellos (4)
02:05 -
Ejercicio guiado de Hugging Face: Extrae datos de reseñas de Amazon y crea una tabla con ellos (5)
03:06 -
Ejercicio guiado de Hugging Face: Extrae datos de reseñas de Amazon y crea una tabla con ellos (6)
01:52 -
Ejercicio guiado de Hugging Face: Extrae datos de reseñas de Amazon y crea una tabla con ellos (7)
08:48 -
Ejercicio guiado de Hugging Face: Extrae datos de reseñas de Amazon y crea una tabla con ellos (8)
08:37 -
Ejercicio guiado de Hugging Face: Extrae datos de reseñas de Amazon y crea una tabla con ellos (9)
09:52
Valoraciones y reseñas de estudiantes
Aún no hay reseñas.