
Información general sobre el laboratorio
Su empresa, Consultora Una Empresa, quiere integrar el procesamiento de lenguaje natural (NLP) con el fin de extraer frases clave, entidades y sentimientos de los documentos. Eligió Amazon Comprehend como servicio de NLP para poder integrar el NLP en las aplicaciones actuales. Con el objetivo de iniciar el proceso de creación de modelos y puntos de conexión para los documentos, quieren que cree un modelo de reconocimiento de entidades personalizadas a fin de identificar términos específicos en una colección de documentos.
En este laboratorio, creará y probará un modelo de reconocimiento de entidades personalizadas con Amazon Comprehend.
Objetivos
Al final de este laboratorio, podrá hacer lo siguiente:
- Crear un modelo de reconocimiento de entidades personalizadas con Amazon Comprehend
- Realizar un análisis en tiempo real con un punto de conexión de reconocimiento de entidades personalizadas
Conocimientos técnicos previos necesarios (opcional)
Para completar este laboratorio correctamente, debe estar familiarizado con la navegación básica de la consola de administración de AWS y tener conocimientos sobre Amazon S3.
Duración
El tiempo estimado para completar este laboratorio es de 60 minutos.
Significado de los íconos
A lo largo de este laboratorio, se utilizan varios íconos para llamar la atención sobre diferentes tipos de instrucciones y notas. En la siguiente lista, se explica el propósito de cada ícono:
- Nota: Una pista, consejo u orientación importante.
- Más información: dónde encontrar más información.
- Precaución: información de especial interés o importancia (no es tan importante como para causar problemas con el equipo o los datos si la omite, pero podría generar la necesidad de repetir ciertos pasos).
- Recomendación: Tómese un momento para hacer una pausa y considerar cómo aplicaría un concepto en su propio entorno o para iniciar una conversación sobre el tema en cuestión.
- Contenido del archivo: un bloque de código donde se muestra el contenido de un script o archivo que debe ejecutar y se ha creado previamente para usted.
Entorno del laboratorio
En el siguiente diagrama, se muestra la arquitectura básica del entorno del laboratorio:
En el diagrama anterior, los datos de entrenamiento se cargan a un bucket de Amazon S3. Amazon Comprehend utiliza los datos de entrenamiento del bucket para entrenar un modelo de reconocimiento de entidades personalizadas. Cuando los documentos se analizan en tiempo real con un punto de conexión, el modelo entrenado encuentra cualquier entidad presente en el documento.