![]() |
![]() |
Antropogenética
Práctica O3. Tratamientos de datos II (La población subdividida).
En esta práctica se tendrán en cuenta las frecuencias de 5 genes HLA analizados con alta resolución en varios cantones de Suiza.
El trabajo de referencia es:
Buhler S, Nunes JM, Nicoloso G, Tiercy JM, Sanchez-Mazas A. (2012) The heterogeneous HLA genetic makeup of the Swiss population. PLoS One. 7(7):e41400.
Los genes son HLA-A, -B, -C, -DRB1 y -DQB1.
La base de datos con las frecuencias alélicas se encuentran en la sección Suppoting Information del propio trabajo.
El programa que se utilizará es:
GeDis - Manual del programa (pdf)
Trae incluída como ejemplo precisamente esta base de datos, de modo que no es preciso copiarla del original.
Descargue el programa en su carpeta de prácticas.
La situación de las poblaciones representativas de los cantones analizados se muestra en el mapa, así como la distribución de los idiomas hablados en todos ellos, incuyendo alemán, francés, italiano y romanche. Suponen el 63,7%, 20,4%, 6,5% y 0,5% de la población, respectivamente.

En la carpeta GeDis se encuentran las frecuencias alélicas en la primera hoja del fichero Data.xls.
El formato de la primera hoja del fichero Data.xls es el siguiente:
Casilla A1: Número de poblaciones.
Casilla B1: Número de marcadores genéticos utilizados.
Fila 2, desde la casilla A2 en adelante: Número de alelos de cada marcador, hasta el total de marcadores especificados en la casilla B1.
Fila 3, desde la casilla B3 en adelante: Etiquetas de las poblaciones. No se utiliza la casilla A3.
Fila 4, en la casilla A4, etiqueta del primer alelo y desde la casilla B4 en adelante, frecuencias del alelo en todas las poblaciones.
Fila 5 y sucesivas, hasta el número total de alelos indicados en la fila 2, igual formato que la fila 4.
Arranque el programa GeDis pulsando dos veces sobre el icono. Lea el fichero de datos (Data.xls) mediante la opción "Input" y "Read data.xls". Compruebe que ha leído bien los datos, de modo que no falta ninguna población o ningún alelo y que no ha leído todos los valores como 0, por incompatibilidad entre puntos y comas.
Obtenga la matriz de distancias Fst de Reynolds mediante la opción "Distances" y "MDS-Reynolds'Fst". Compruebe que es una matriz de distancias, simétrica y con valores 0 en la diagonal. No la cierre.
Realice un Análisis de Escalamiento Multidimesional mediante la opción "MDS"
y "MDS-Reynolds'Fst"
El gráfico MDS aparecerá guardado en la carpeta outputs como MDSFst.eps, que puede insertar en su fichero Word de resultados.
Interprete el gráfico de Escalamiento Multidimensional a partir de los datos que conoce.
Abra de nuevo la hoja de cálculo Data.xls y observe la hoja 2, que tiene las coordenadas geográficas de las poblacionesque con el siguiente formato:
Casilla A1: Número de poblaciones, como en la primera hoja.
Fila 2, desde la casilla A2 en adelante: Etiquetas de las poblaciones. Deberán ser las mismas etiquetas de la hoja 1 y en el mismo orden.
Fila 3, desde la casilla A3 en adelante: Grados de latitud para cada población.
Fila 4, desde la casilla A4 en adelante: Minutos de latitud para cada población.
Fila 5, desde la casilla A5 en adelante: 1 para latitud Norte y -1 para latitud Sur.
Fila 6, desde la casilla A6 en adelante: Grados de longitud para cada población.
Fila 7, desde la casilla A7 en adelante: Minutos de longitud para cada población.
Fila 8, desde la casilla A8 en adelante: 1 para longitud Este y -1 para longitud Oeste.
Busque las coordenadas geográficas de las ciudades representativas de algunos cantones. Puede utilizar las páginas:
http://www.mygeoposition.com/
http://geonames.nga.mil/ggmaviewer/MainFrameSet.asp
También puede utilizar Google Maps con la opción "¿Qué hay aquí?"
Mediante el programa GeDis obtenga, pulsando en las diferentes opciones del menú "GeoGraphics":
- Un listado de clinas con su orientación y su significación. El fichero con la imagen de las clinas se llama Clines.eps.
- Un análisis de Autocorrelación Espacial. El fichero con el gráfico de la autocorrelación se llama Autocorrelation.eps.
- Un análisis del flujo génico mediante el método del centroide. El fichero con el gráfico correspondiente se llama Centroid.eps.
- Un análisis de Aislamiento por la distancia. El fichero con el gráfico correspondiente se llama IsolationByDistance.eps.
- Un gráfico con la regresión de la clina correspondiente al alelo A*02.
- Un mapa sintético para este mismo alelo.
- La clina y el mapa sintético del alelo DQB1*3:1/9/19/21.
- Un mapa sintético para Ri.
- Un mapa sintético para los 3 primeros vectores propios del MDS-Fst.
Salve los resultados con la opción "Outputs" y "Save Results". Aparecerán en el fichero Results.txt.
Interprete los resultados obtenidos.