mayo 19, 2023

Data Observatory realizó charla científica sobre privacidad de datos

Uncategorized 
  • Cristóbal Guzmán, profesor asistente en el Instituto de Ingeniería Matemática y Computacional de la UC, especializado en Optimización, Aprendizaje Automático y Privacidad Diferencial, fue el relator de esta charla magistral sobre privacidad de datos.

El pasado 11 de mayo y como parte del Ciclo de Workshops Científicos del DO, Data Observatory realizó una charla sobre privacidad de datos, para explicar técnicas y metodologías para el trabajo investigativo con uso de datos que cumplan con las normas de protección de la privacidad. La actividad contó con la exposición de Cristóbal Guzmán, profesor asistente en el Instituto de Ingeniería Matemática y Computacional de la UC, especializado en Optimización, Aprendizaje Automático y Privacidad Diferencial.

El académico e investigador presentó algunos riesgos asociados al análisis de datos personales. Para esto, usó como estudio de caso, el informe de la oficina del Censo de los Estados Unidos del año 2019, el cual concluyó que es potencialmente factible re-identificar aproximadamente a 52 millones de los censados del año 2010, que representan cerca del 17% de la población.

Ante esta problemática, la pregunta es cómo poder entregar información estadística que permita controlar y cuantificar los riesgos de privacidad asociados. La respuesta existente a este desafío en la comunidad científica viene dada por la llamada “privacidad diferencial” que a grandes rasgos mide cuanto se modifican los resultados de un estadístico por la modificación de una muestra por un individuo. Cabe señalar que el informe del Censo anteriormente mencionado motivó la incorporación de técnicas de privacidad diferencial en la publicación de los datos del Censo de los Estados Unidos a partir del año 2020.

Posterior a la charla, los investigadores del DO sostuvieron una animada conversación con el académico, identificando posibles avenidas de colaboración. Ante esto, el investigador señaló que: “una de las potencialidades del Data Observatory es la capacidad de obtener, almacenar y analizar grandes volúmenes de información de problemas relevantes para la sociedad. Sin embargo, ante las legítimas preocupaciones que conllevan el tratamiento de datos personales, es importante utilizar y avanzar las herramientas recientemente desarrolladas que nos permitan hacer un uso de estos datos valiosos, mientras que se proteja el derecho a la privacidad de las personas. En este sentido, el DO tiene una oportunidad única de liderar estos esfuerzos a nivel nacional.”

Si bien Chile cuenta con una legislación relacionada con la privacidad de datos, para el expositor ésta sigue siendo altamente deficiente. Y añadió: «es aún más preocupante que incluso los esfuerzos recientes y proyectados en modernizar la legislación chilena (por ejemplo, la Política Nacional de Inteligencia Artificial del 2021 y la Propuesta de Política Nacional de Ciberseguridad 2023-2028) proponen poco en lo que respecta a privacidad de datos personales. En el caso particular de la Propuesta de Ciberseguridad, existe sólo una mención directa a la palabra “privacidad». Para el docente, la propuesta de nueva política apunta de forma prioritaria a la prevención de ciberataques a instituciones públicas y/o privadas, pero no se preocupa significativamente de la recolección, comercialización y uso responsable de los datos de las personas, así como tampoco se hace cargo del problema de la propiedad de estos datos.

Al ser consultado sobre los desafíos para los científicos en materia de privacidad de datos, el relator señala: «Pienso que el principal desafío está en crear un puente entre la teoría y la práctica. Tenemos una teoría sólida y madura que nos permite aseverar qué tipo de mecanismo privado es necesario utilizar en cada situación, cómo la publicación de múltiples resultados compromete los riesgos de privacidad, etc. Sin embargo, al enfrentar un problema con datos reales, muchas veces los supuestos clásicos no se cumplen, o el ruido necesario de agregar dificulta obtener una buena precisión en los resultados. Esto lleva a muchas preguntas sobre cómo podríamos relajar los supuestos básicos utilizados en la teoría de privacidad para poder hacer métodos más escalables y robustos».

Data Observatory realizará cada mes un workshop científico para seguir contribuyendo a la formación y el fortalecimiento del talento humano en ciencias de datos aplicada.

Relacionados