Año 2022/2023

Universidad de Granada | Escuela de Posgrado | Administración electrónica

Buscar

Año 2022/2023

Descargar versión en PDF

Cursos de la EDCS sobre Competencias Transversales


Cursos de Técnicas Específicas

Análisis de GWAS para la identificación de marcadores asociados con enfermedades comunes y análisis de datos NGS para el reconocimiento de cepas de SARS-CoV-2

Profesores que la imparten:

- Dr. Manuel Martínez Bueno, GENYO (10 horas).
- Dr. Juan Sainz Pérez, Departamento de Bioquímica y Biología Molecular I, UGR (10 horas).

Número de horas: 20

Fechas previstas para la actividad: Abril - Mayo 2023

Horario: por confirmar.

Número de alumnos/as: 20

Plazo de solicitud: por confirmar

Formulario de inscripción: mediante el siguiente FORMULARIO (estará activo cuando comience el plazo de solicitud)

Programa de la actividad:


PARTE 1: Análisis de GWAS

1. Filtrado de Control de Calidad del conjunto genotipado crudo (Quality Control Filtering, QCF).

1.1. Marcadores:
- Eliminar los marcadores cuyos genotipados fallan en más del 2-3% de las muestras
- Eliminar los marcadores con frecuencia de alelo menor inferior al 1% (variación rara)
- Eliminar marcadores que violan el equilibrio Hardy-Weinberg
- Eliminar marcadores con test significativos de fallo de genotipado entre casos y controles
1.2. Muestras:
- Eliminar las muestras cuyos genotipados fallen en más del 5% de los marcadores (indicador de DNA de pobre calidad)
- Eliminar las muestras cuya heterozigosidad se desvia plus/minus 3 SD de la media (posible DNA contaminado).
- Eliminar muestras con discrepancia entre el sexo informado y el sexo estimado del genotipo.
- Eliminar muestras consideradas 'outliers'
- Eliminar las muestras con grado de parentesco elevado.

Durante esta fase de QCF se ejecutará el Análisis de Componentes principales (PCA) que proporciona el conjuntop de covariables para el tratamiento de la subestrucutra genetica presente en la muestra.

- Selección del conjunto de marcadores independientes en el dataset que funcionen como Marcadores Informativos de Ancestría (AIMs).
- Ejecución del PCA
- Comprobación de la capacidad AIM de los marcadores seleccionados mediante la construccion de plots de pares de Componentes Principales
- Detección de 'outliers' con los componentes principales.
- Preparación de la tabla de covariables (componentes principales).

2. Imputación del 'working' dataset genotipado resultante del proceso anterior de QCF.

3. Ejecución del test de asociación de cada marcador con el fenotipo analizado mediante el ajuste de modelos de regresión logística que permiten la corrección de la estratificación genética de la muestra.

4. Selección de las mejores señales de asociación independientes del conjunto analizado como los candidatos causales más probables.

5. Construcción de Manhattan plot, QQ plot, anotación e interpretación de los resultados.

6. Estimación de la proporción de variabilidad genetica del fenotipo complejo analizado explicado por las mejores señales de asociación independientes definidas en el 4º epígrafe.

7. Construcción de 'Genomic Risk Scores' construidos con el conjunto de por las mejores señales de asociación independientes y estimación de su capacidad predictiva.

8. Meta-Análisis de los resultados con tablas de estadisticas de otros analisis de asociación del mismo o similar fenotipo al estudiado depositados en bases de datos públicas como “Gwas Catalog”

9. Elaboración de una memoria con estructura de Abstract, Introducción, Materiales y Métodos, Resultados y Discusión, que incluya los resultados y figuras obtenidas.


PARTE 2: Análisis de linaje de SARS-CoV-2

1. Estructura de los virus. Generalidades

2. El genoma del SARS-CoV-2

3. Clasificación del SARS-CoV-2. Variantes de interés y linajes. Bases de datos

4. Análisis bioinformático de linajes de SARS-CoV-2

a. Lecturas de secuenciación
b. Análisis de calidad (FastQC)
c. Limpieza de lecturas (FastP)
d. Filtrado de lecturas humano (Kraken 2)
e. Lecturas filtradas
f. Mapeo de genoma de referencia (BWA), enmarcarar cebadores (Ivar), llamada de variantes y secuencia consenso (Ivar)
g. Ensamblaje de novo (SPAdes)
h. Anotación del genoma (Prokka)

5. Determinación del linaje de SARS-CoV-2 (Pangolin)

Durante la ejecución de está practica el alumno aprenderá a utilizar las siguientes herramientas de software:

- Bash scripts
- Awk scripts
- plink
- haploview
- R scripts
- Annovar
- Metal
- Structure
- Admixture
- Frappe
- FastQC
- FastP
- Kraken 2
- BWA
- iVar
- SPAdes
- Prokka
- Pangolin
 

Recomendaciones: Utilizar ordenadores linux (preferentemente). Se podrá adaptar la práctica a ordenadores Windows.


Aprovechamiento de bases de datos abiertas para la comprensión de mecanismos moleculares enzimáticos. Visualización y manipulación de modelos tridimensionales de proteínas - (CANCELADO)

Profesores que la imparten: Dpto. de Bioquímica, Biología Molecular III e Inmunología, Facultad de Medicina-UGR

• Sergio Martínez Rodríguez (10 h)
• Jesús M. Torres de Pinedo (5 h)
• Carolina Torres Perales (5 h)

Fechas previstas para la actividad: del 15 al 19 de mayo de 2023

Número de alumnos/as: 20

Número de horas: 20

Plazo de solicitud: del 24 al 30 de abril de 2023

Forma de inscripción: mediante el siguiente FORMULARIO (estará activo cuando comience el plazo de solicitud)

Programa de la actividad:

Metodologías para la determinación tridimensional de estructuras de proteínas (Cristalografía de Rayos X, RMN, crio-EM,…). Estructura tridimensional y familias de proteínas; visualización de estructuras tridimensionales de proteínas. Herramientas computacionales específicas para la manipulación y visionado de los diferentes niveles estructurales de proteínas. Modelado tridimensional de proteínas. Estudios in silico de interacción proteína-ligando y ensamblado (docking) aplicadas al desarrollo de nuevos fármacos. Técnicas ómicas aplicadas al reconocimiento de interacciones proteína-proteína.
TEMARIO TEÓRICO
Uso del espacio natural de secuencia en Bioquímica Estructural (Día 1)
Conceptos básicos de enzimología y biología molecular. Bases de datos, formatos de archivos comúnmente utilizados por las herramientas bioinformáticas basadas en secuencia. Métodos computacionales y de predicción a partir de estructuras primarias de proteínas.
Modelos tridimensionales y modelado de proteínas (Día 2)
Metodologías automatizadas para la determinación tridimensional de proteínas (robótica, cristalografía de Rayos X, RMN, …). Estructura tridimensional y familias de proteínas. Tipos de plegamiento. Tipos de archivos asociados a la estructura tridimensional de proteínas. Visualización de estructuras tridimensionales de proteínas. Identificación/predicción de sitios de unión/centros catalíticos. Herramientas para el modelado de proteínas in silico a partir de su secuencia primaria: modelado mediante homología. Predicción e impacto de variaciones moleculares en la salud.
Introducción al desarrollo de nuevos fármacos mediante ensamblado molecular (Molecular Docking) (Día 3)
Herramientas computacionales para el análisis in silico de interacciones proteína-ligando. Tecnicas “ómicas” aplicadas al reconocimiento de interacciones proteína-proteína. Desarrollo de nuevos fármacos mediante diseño estructural guiado. Cribado virtual de bibliotecas químicas.
TEMARIO PRÁCTICO
• Herramientas computacionales para el manejo de secuencias primarias aminoacídicas.
• Manejo y visualización de modelos tridimensionales de proteínas.
• Modelado in silico de estructuras tridimensionales de proteínas. Obtención de información estructural basada en los modelos teóricos obtenidos.
• Obtención de información de unión proteína-fármaco a través de metodologías de “molecular docking”.
• Herramientas de predicción e impacto de variaciones moleculares en la salud.


Cursos Metodológicos: Programas de Doctorado de la EDCS