Reidentificar rostros a partir de datos genómicos es más difícil de lo que se pensaba anteriormente
Crédito: CC0 Public Domain
Las pruebas genéticas directas al consumidor han permitido a millones de personas determinar su ascendencia y obtener información sobre su predisposición genética a enfermedades hereditarias. Si bien la información de genotipado individual se almacena de forma segura, algunas personas aceptan compartir sus datos genómicos para su posterior estudio.
Este intercambio de datos ha planteado algunas preocupaciones válidas sobre la privacidad genómica. Por ejemplo, ¿podrían los piratas informáticos volver a identificar a una persona, tal vez construir una imagen de su rostro en función de los datos del genotipo descargados legalmente de plataformas web de código abierto?
En 2017, la compañía de inteligencia de salud basada en genómica Human Longevity y otros grupos de investigación informaron que era factible predecir la apariencia facial de una persona a partir de su ADN.
Intrigado por las implicaciones del riesgo de privacidad de este trabajo, el miembro de la facultad de la Universidad de Washington en St. Louis, Yevgeniy «Eugene» Vorobeychik, experto en aplicar la teoría de juegos para determinar los riesgos de privacidad en entornos de intercambio de datos, realizó su propio estudio.
«Queríamos ver hasta qué punto estos resultados pueden generalizarse al mundo real», dijo Vorobeychik, profesor asociado de informática e ingeniería en la Escuela de Ingeniería McKelvey. «Exploramos si era posible demostrar en una situación más práctica que estas preocupaciones eran reales».
Vorobeychik y sus coautores, el estudiante graduado de WashU, Rajagopal Venkatesaramani, y el profesor de informática biomédica de la Universidad de Vanderbilt, Bradley Malin, encontraron la tarea de vincular caras y genomas es mucho más difícil en promedio de lo que se informó anteriormente. Publicaron sus hallazgos en Science Advances el 17 de noviembre de 2021.
En el estudio, desarrollaron un método para calcular el riesgo de volver a identificar a las personas a partir de un conjunto de datos cuidadosamente seleccionados de 126 genomas obtenidos del programa de intercambio de genomas OpenSNP. plataforma vinculándolas a imágenes faciales publicadas públicamente. Específicamente, usaron modelos de redes neuronales para predecir rasgos físicos visibles, como el color del cabello, los ojos y la piel, así como el sexo, y luego usaron esta información junto con correlaciones genotipo-rasgo conocidas para calificar posibles coincidencias de caras y genomas.
Estudios anteriores de asociación de fenotipos utilizaron fotografías de alta calidad tomadas en un entorno de laboratorio con iluminación de calidad profesional. El equipo de Vorobeychik, por otro lado, llevó a cabo su investigación utilizando fotografías del mundo real encontradas en sitios de redes sociales.
«Lo que hicimos fue construir modelos probabilísticos para estos diferentes tipos de características visuales y esencialmente conectamos los puntos mediante puntuando la calidad de coincidencia entre genomas particulares y rostros particulares», explicó Vorobeychik. «Luego usamos ese sistema de puntuación para predecir qué coincidencias son más probables».
En general, sus resultados sugieren que a veces es posible vincular imágenes de rostros públicos con datos genómicos públicos, pero las tasas de éxito están muy por debajo de lo trabajos de investigación anteriores sugieren en entornos idealizados.
«Sin embargo, nuestras observaciones se refieren al riesgo de privacidad promedio para una colección de individuos; es posible que para algunas personas el riesgo de privacidad sea realmente alto», dijo Vorobeychik.
Para proteger la privacidad de esas personas, el equipo de Vorobeychik creó un método que altera una foto de las redes sociales lo suficiente como para evitar que la red neuronal identifique de manera confiable los rasgos visibles y, por lo tanto, reduce el riesgo de aquellos que han publicado su genómica. datos y cuya imagen aparece en otros lugares en línea.
«Nuestro método agrega suficiente ruido imperceptible a la imagen, por lo que es difícil para una red neuronal profunda vincular el fenotipo de la cara con un genoma en particular», dijo. «Este ruido cuidadosamente elaborado no cambia la percepción que uno tiene de [la cara] a simple vista».
Esta herramienta podría desarrollarse aún más en filtros de imagen que las personas podrían usar para proteger sus fotos de redes sociales de los piratas informáticos. que podrían intentar vincular sus imágenes con datos genéticos que han compartido públicamente en OpenSNP u otros sitios en línea.
Explore más
Se descubrió que el riesgo de que los datos del genoma se vinculen con fotos en las redes sociales es muy pequeño Más información: Rajagopal Venkatesaramani et al, Reidentificación de individuos en conjuntos de datos genómicos utilizando imágenes de rostros, Science Advances (2021). DOI: 10.1126/sciadv.abg3296 Información de la revista: Science Advances
Proporcionado por la Universidad de Washington en St. Louis Cita: Volver a identificar rostros a partir de datos genómicos es más difícil de lo que se pensaba (2021, 18 de noviembre) recuperado el 29 de agosto de 2022 de https://medicalxpress.com/news/2021-11-re-identifying-genomic-difficult-previously-thought.html Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.