El objetivo de crear un ‘data lake’ sanitario en España para homogeneizar de manera anonimizada toda la data sanitaria en España y mejorar la calidad asistencial en nuestro país es un objetivo incluido dentro del Pacto por la Ciencia y la Innovación, que a su vez se incluye en el Plan de Recuperación del Gobierno de España.
Recogiendo ese testigo, la compañía Savana, con el apoyo de numerosas sociedades científicas y asociaciones de pacientes, que representan alrededor de 40.000 médicos y más de 600.000 pacientes, ha puesto en marcha una iniciativa conjunta para la creación de este data ‘lake sanitario’, cuyo trabajo se pueden conocer en el documento Data Lake Sanitario: Situando a España a la vanguardia de la investigación médica avanzada.
Según explican sus autores, la creación de un data lake en España permitiría tener información sobre las diferentes patologías, así como enfermedades raras, que por sus características propias de dispersión, baja prevalencia etc., presentan mayores dificultades para su estudio y tratamiento y además, “supondría un valioso apoyo para el desarrollo de nuevos fármacos, y facilitaría el acceso prioritario de los pacientes a tratamientos y dispositivos innovadores”.
De cara a la investigación médica el desarrollo de esta iniciativa permitiría, disponer de una fuente homogénea de datosclínicos, que con el uso de IA se podría disponer de una gran cantidad de variables para realizar grandes investigaciones clínicas y estudios, en lugar de acotarse a un número limitado de hospitales y pacientes. Además, facilita el desarrollo de ensayos clínicos desde fases precoces. Y España se convertiría en pionera, a nivel mundial. Junto a esto, se favorecerá también la realización de estudios observacionales basados en la evidencia del mundo real.
De cara a los pacientes y la población en general, la creación de un ‘data lake’, permitiría tratar de manera homogénea y anonimizada la información sanitaria de toda la población. La propuesta de Savana propone, por un lado, la creación de una base de datos donde no hay información personal, pero el gestor de la misma puede reconocer la fuente de esos datos para lanzar campañas de prevención o emitir alertas sanitarias entre un grupo de personas afectadas.
Además, el trabajo plantea la creación de una gran base de datos de variables clínicas donde no hay forma de identificar el paciente que ha generado esa información, y que supondría tener un conocimiento en tiempo real de la salud de los ciudadanos de nuestro país, así como realizar grandes estudios con el uso de herramientas de inteligencia artificial y con una fuente de información única (toda la población española), con la posibilidad también de generar modelos predictivos de ámbito nacional.
Junto a todo lo anterior, la creación de un gran data lake sanitario haría posible retener y traer de vuelta talento científico español y que se ampliara la participación en proyectos de investigación.
“Todas las implicaciones que tendría la creación de un gran data lake sanitario son posibles puesto que Savana cuenta con la tecnología necesaria, basada en Inteligencia Artificial, en concreto el Machine Learning (ML) y Procesamiento del Lenguaje Natural (PLN), que es capaz de analizar los diferentes formatos de Historias Clínicas Electrónicas de los diferentes hospitales y centros de atención primaria, y convertir en tiempo real toda su información en conocimiento científico, para ponerlo a disposición de la comunidad médica e investigadora, sin poner en riesgo la seguridad de los datos y con pleno respeto por la privacidad de los pacientes”, explica el Antonio Urda, Vicepresidente de Hospitales en Savana.