La exactitud de los datos de entrada es fundamental en el entrenamiento de cualquier sistema de inteligencia artificial (IA). Además, la mayoría se basa en el aprendizaje automático y podría reiterar sus sesgos en cada predicción. En Gesprodat, sabemos la importancia que tiene y, por ello, queremos explicártela.
¿Qué es el principio de exactitud según el RGPD?
El artículo 5.1 del Reglamento General de Protección de Datos (RGPD), en su apartado (1)(d), señala que los datos personales deben ser exactos y, si fuera necesario, actualizados; se adoptarán todas las medidas razonables para que se supriman o rectifiquen sin dilación los datos personales que sean inexactos con respecto a los fines para los que se tratan.
Sin embargo, el artículo 4 de la Ley Orgánica 3/2018 de Protección de Datos y Garantía de los Derechos Digitales (LOPDGDD) llega más lejos. Respecto al principio de exactitud, indica los casos en los que no será imputable el responsable del tratamiento, siempre que éste haya adoptado todas las medidas razonables para que se supriman o rectifiquen sin dilación, ante una inexactitud de los datos personales, con respecto a los fines para los que se tratan, cuando los datos inexactos:
- Han sido obtenidos directamente del afectado de manera personal.
- Obtenidos de un mediador, pues así lo permite la norma aplicable en ese sector.
- Han sido recibidos de otro responsable a través del ejercicio del derecho de portabilidad.
- Obtenidos de un registro público.
En consecuencia, cabe entender que, fuera de esas excepciones, incurre en delito penal si se produjesen errores. También se desprende que, una vez conocidos, deben suprimirse o corregirse sin dilación.
¿Cómo puede afectar a los sistemas de IA la falta de exactitud de los datos?
La IA es una disciplina que ha experimentado un rápido crecimiento en los últimos años. Se aplica en numerosos campos, como el diagnóstico médico, la conducción autónoma de vehículos y la optimización de procesos industriales.
Cualquier aplicación de IA efectiva se alimenta de la calidad y precisión de los datos de entrada utilizados para entrenar a los algoritmos. De su adecuación dependen diversos aspectos.
Base del aprendizaje automático
La mayoría de estos sistemas se basa en el aprendizaje automático, el cual depende de la calidad de la información para predecir patrones y tomar decisiones. Si es imprecisa, incompleta o sesgada, su fiabilidad y rendimiento se verán comprometidos.
Impacto en la toma de decisiones
En muchos casos, la IA se emplea para tomar decisiones críticas que afectan a personas o empresas. Si los datos de entrada son inadecuados, los resultados y recomendaciones generan poca confianza y son potencialmente peligrosos.
Por ejemplo, en aplicaciones médicas, la precisión es vital para obtener diagnósticos correctos y tratamientos eficaces.
Generalización y adaptabilidad
Un modelo bien entrenado debe ser capaz de producir patrones a partir de información nueva y desconocida. Sin datos precisos en su entrenamiento, no sería tan fuerte como para afrontar situaciones inesperadas.
Reducción de sesgos y discriminación
Los datos sesgados hacen que los modelos tomen decisiones discriminatorias e, incluso, poco éticas. Por tanto, es crucial que te asegures de que son representativos y están exentos de prejuicios.
Eficiencia y coste
La calidad de la información de entrada hace que los modelos sean más eficientes. Si es muy buena, se requerirá una cantidad menor para lograr resultados comparables. Como consecuencia, se reduce el tiempo y el coste necesarios para entrenarlo.
Confianza y aceptación
La confianza de la sociedad es esencial para la aceptación de un sistema de inteligencia artificial determinado. En caso contrario, los resultados serán cuestionables y no se usará.
La exactitud de los datos de entrada es básica para el desarrollo y aplicación de la IA. Por consiguiente, garantizar su calidad es imprescindible para la obtención de aplicaciones útiles, éticas y eficientes.