La mirada de la multitud millora els mètodes d'aprenentatge automàtic

(Contenido en el idioma por defecto)

Un equip investigadors de la Unitat de Gràfics i Visió per Ordinador i Intel·ligència Artificial i del Laboratori d’Aplicacions d’Intel·ligència Artificial de la Universitat de les Illes Balears proposa un nou mètode basat en el crowdsourcing i la computació basada en humans per disposar de dades per entrenar una eina de diagnòstic automàtic de la malaltia de la cèl·lula falciforme. 

Els mètodes d'aprenentatge automàtic són un conjunt de tècniques i algoritmes que permeten als sistemes informàtics millorar el rendiment en una tasca determinada mitjançant l'experiència. Aquests mètodes es basen en la idea que els sistemes poden aprendre de les dades, identificar patrons i prendre decisions sense ser explícitament programats per fer-ho. Un dels àmbits on s’utilitzen aquests mètodes és en el reconeixement automàtic d’imatges mèdiques, útil per al diagnòstic de patologies com la malaltia de la cèl·lula falciforme.

Aquests sistemes es basen en dades d’entrenament etiquetades. Com més dades d'entrenament etiquetades estiguin disponibles, més precisa serà la capacitat del model per aprendre a reconèixer patrons i generalitzar a dades no vistes.

Participació massiva

Un enfocament cada vegada més popular per obtenir les etiquetes d’entrenament en tasques de classificació d’aprenentatge automàtic es basa en el proveïment participatiu (crowdsourcing: participació d’un gran nombre de persones per dur a terme una tasca) i la computació basada en humans (que preveu la participació humana en la realització de tasques de computació).

Aquest enfocament preveu que una col·lectivitat d’humans participi en l’esforç de determinar les etiquetes que serviran després per entrenar mètodes d’aprenentatge automàtic que necessiten una gran quantitat de dades etiquetades.

Aplicació a la diagnosi clínica

Els investigadors de la Unitat de Gràfics i Visió per Ordinador i Intel·ligència Artificial (UGiVIA) i del Laboratori d’Aplicacions d’Intel·ligència Artificial (LAIA@UIB) de la Universitat de les Illes Balears han aplicat aquest enfocament per ampliar la base de dades i així disposar d’un conjunt de dades etiquetades suficientment gran, i poder entrenar un mètode d’aprenentatge automàtic dedicat al diagnòstic automàtic de la malaltia de la cèl·lula falciforme.

Aquesta patologia és un trastorn sanguini hereditari greu que afecta milions de persones a tot el món. La malaltia és causada per una mutació en el gen HBB que produeix molècules d'hemoglobina anormals que poden fer que els glòbuls vermells tinguin la forma d'una falciforme o mitja lluna en lloc de la forma circular i suau que tenen els glòbuls vermells normals.

Per al diagnòstic d’aquesta malaltia esdevé clau l'anàlisi morfològica del frotis de sang perifèrica: l’estudi de la forma dels glòbuls vermells mitjançant imatges microscòpiques. Els investigadors de la UIB fa anys que treballen per desenvolupar eines automatitzades de suport a la diagnosi clínica d’aquesta patologia que n’incrementin la fiabilitat i que permetin abaratir el cost del diagnòstic.

En un article publicat recentment a la revista científica Scientific Reports, els investigadors de la UIB presenten un enfocament de computació basat en humans per a l'anàlisi d'imatges de frotis de sang perifèrica en pacients amb malaltia de la cèl·lula falciforme. Els investigadors se serviren d’una plataforma de proveïment participatiu o mercat de microtasques per aconseguir la participació d’un gran nombre de persones en l'etiquetatge d'imatges de frotis de sang perifèrica. Després, varen utilitzar un conjunt de dades ja etiquetades per experts amb la finalitat d’avaluar l'exactitud i fiabilitat de la proposta.

La importància del consens

Els resultats varen mostrar que, quan s'aconsegueix un consens robust entre el conjunt d’humans que participaren de manera massiva en l’etiquetatge de les dades, la probabilitat d'error és molt baixa, i aquest fet es basa en la comparació amb l'anàlisi d'experts. Això suggereix que l'enfocament que proposen els investigadors de la Universitat de les Illes Balears es pot utilitzar per etiquetar conjunts de dades d'imatges de frotis de sang perifèrica, les quals posteriorment es poden utilitzar per entrenar mètodes automatitzats per al diagnòstic de la malaltia de la cèl·lula falciforme.

En treballs futurs, els investigadors es plantegen explorar la integració potencial dels resultats assolits amb els resultats obtinguts a través de metodologies automatitzades. Això podria dur al desenvolupament de mètodes més precisos i fiables per al diagnòstic de la malaltia de la cèl·lula falciforme.

Equip investigador

Els investigadors del Departament de Ciències Matemàtiques i Informàtica la Universitat de les Illes Balears que han participat en aquest estudi són el doctor Antoni Jaume i Capó, membre de la Unitat de Gràfics i Visió per Ordinador i IA (UGiVIA) i director del Laboratori d’Aplicacions d’Intel·ligència Artificial de la UIB (LAIA@UIB); el doctor Jose María Buades Rubio, investigador principal de la Unitat de Gràfics i Visió per Ordinador i Intel·ligència Artificial (UGiVIA); el doctor Gabriel Moyà Alcover i Natasa Petrovic, membres de la UGiVIA i LAIA@UIB.

L’estudi s’ha fet en el marc dels projectes d’R+D+I PID2019-104829RA-I00 EXPLainable Artificial INtelligence systems for health and well-beING (EXPLAINING), finançat pel Ministeri de Ciència i Innovació, i l’Agència Estatal d’Investigació (MCIN/AEI/10.13039/501100011033/).

Referència bibliogràfica

Rubio, J. M. B., Moyà-Alcover, G., Jaume-i-Capó, A., & Petrović, N. (2024). Crowdsourced human-based computational approach for tagging peripheral blood smear sample images from Sickle Cell Disease patients using non-expert users. Scientific Reports, 14(1), 1201. 

Fecha de publicación: 17/04/2024

Con la colaboración de:

 Gobierno de España. Ministerio de Ciencia e Innovación. FECYT Innovación