Resumen del curso Preparación de modelos en sistemas de Inteligencia Artificial (IA)
Objetivos |
---|
Extraer, procesar y aplicar analíticas de datos para el entrenamiento en sistemas de Inteligencia Artificial, basándose en técnicas de aprendizaje automático para la predicción, clasificación o cualquier otro tratamiento inteligente de datos, imágenes, vídeos o lenguaje natural, preprocesando, depurando y particionando los datos en subconjuntos, identificando las variables significativas, verificando la ausencia de sesgos y cumpliendo la normativa aplicable en materia de protección de datos y propiedad intelectual e industrial. |
Contenido |
CONTENIDO TEÓRICO: 1. Modelos de datos. Descripción. Características generales. Tipos de modelos de datos. Compatibilidades entre modelo de datos. 2. Sistemas gestores de datos Características. Componentes de un sistema gestor de datos. Funcionamiento de un sistema gestor de datos. Relación entre los sistemas gestores de datos y los modelos de datos. 3. Características de los sistemas gestores de datos operacionales (OLAT). Características de los sistemas gestores de datos orientados a las tomas de decisiones o análisis de datos (OLAP). Sistemas gestores de datos avanzados. Procedimientos de extracción y consulta de información en los sistemas gestores de datos Búsquedas en sistemas gestores. 4. Optimización de la recuperación. Utilización de lenguajes de consultas. Ventajas e inconvenientes. Entornos de trabajo. Utilización de herramientas. Ventajas e inconvenientes. Funcionalidades. Presentación de la información. 5. Normativa aplicable en materia de protección de datos. Lenguajes de consulta y extracción de datos Características. Funcionalidades. Lenguajes utilizados en sistemas gestores de datos relacionales (SQL). Lenguajes utilizados en sistemas gestores orientados a objetos (OQL). Lenguajes de consulta utilizados en sistemas gestores de datos relacionales orientados a objetos. Lenguajes de consulta utilizados en sistemas gestores de datos relacionales con extensiones de formatos de documento de marcas extendidas (XML‐QL). Otros lenguajes de consulta y extracción de datos. 6. Procedimientos de pruebas. Herramientas de consulta y extracción de información de los sistemas gestores de datos Características. Funcionalidades de las herramientas. Herramientas utilizadas en los sistemas gestores de datos operacionales. 7. Herramientas utilizadas en los sistemas gestores de datos orientados a los análisis de datos. Otras herramientas utilizadas en los sistemas gestores de datos. 6. Pasarelas y medios de conexión Características. Parámetros de configuración. 8. Procedimientos de verificación. Guía de uso y utilización de pasarelas y medios de conexión. 1 Técnicas Estadísticas en el ámbito del aprendizaje automático Técnicas estadísticas para el análisis exploratorio de datos, transformaciones simples y/o de reducción de la dimensión de las muestras. Características Distribuciones de probabilidad. 9. Técnicas de representación gráfica aplicables a la representación de variables en muestras: histogramas, mapas de dispersión y otras técnicas de transformación de datos de entrada. Técnicas aplicadas a cada variable de manera singular (Escalado a valores dentro de un rango, normalización a media cero y desviación típica uno). 10. Funciones matemáticas de una o más variables (logaritmo, exponencial, raíz cuadrada, x2, xn, seno, coseno, tangente hiperbólica u otros). Técnicas aplicadas a todas las variables de entrada (expansión polinómica para aumento de la dimensión de las muestras en problemas de regresión, técnicas de reducción de la dimensión de las muestras: PCA, t‐SNE, 'autoencoders' basados en redes neuronales. Finalidad y aplicación). 11. Herramientas software que implementen técnicas estadísticas en el ámbito del análisis de datOs. Visualización de datos y resultados en el aprendizaje automático Técnicas de visualización de datos y resultados (Gráficas de dispersión, Histogramas, Mapas de color/densidad, Curva ROC u otros). Herramientas software aplicables a técnicas de representación de datos y de resultados. 12. Técnicas de entrenamiento en el aprendizaje automático. Tipos de aprendizaje automático: supervisado, no supervisado, semi‐supervisado, por refuerzo. Tipos de problemas: clasificación, regresión, segmentación, detección de objetos. 13. Técnicas paramétricas: Basadas en distribuciones de probabilidad conocidas: 'Gaussian Mixture Models' u otras. Técnicas no paramétricas: (árboles de decisión: clásicos, 'random forest', 'gradient boosting', 'extremely randomized trees'; Vecinos más próximos (k‐NN); 'Kernel density estimation'; 'Support Vector Machines' (SVM); K‐Means. Técnicas Holísticas: redes neuronales: 'fully connected', 'convolutional', 'recurrent', 'transformers', 'autoencoders', 'encoder‐decoder', seq2seq u otras. Técnicas de regularización para evitar el sobreaprendizaje. Métricas para evaluar la calidad de los modelos diseñados y entrenados: MSE, MAE, 'accuracy', precisión, 'recall' o 'sensitivity', 'specificity', 'F1‐score', ratio de falsos positivos y de falsos negativos, área bajo la curva ROC, 'DICE coeffient', 'Intersection over Union' (IoU), y otros específicos del problema a abordar. Herramientas software con la implementación de las técnicas de aprendizaje automático. |