Doktorska disertacija: Erna Alukić

Doktorska disertacija

Naslov:

AVTOMATIZACIJA PROCESA KONTROLE KAKOVOSTI RADIOLOŠKIH INŽENIRJEV V MAMOGRAFIJI

1 UVOD

Rak dojk velja za najpogostejše maligno obolenje pri ženski populaciji po vsem svetu in predstavlja velik javnozdravstveni problem (1-3). Po podatkih Registra raka Republike Slovenije iz leta 2015 predstavlja petino vseh primerov raka pri ženskah (4). Za zgodnje odkrivanje raka dojk je metoda izbora mamografija (4-7). Najbolj ogrožene za nastanek raka dojk so ženske v starosti od 50 do 69 let. V Sloveniji je zanje organiziran državni presejalni program DORA (Državni presejalni program za raka dojk), kjer se izvaja preventivna mamografija na vsaki dve leti. Presejanje ima velik pomen pri izboljševanju preživetja saj lahko zmanjša umrljivost za približno 25 – 30 % (4).

Poleg prednosti, ki jih ponuja presejalna mamografija ima presejanje tudi pomanjkljivosti, kamor sodijo ionizirajoče sevanje ter lažno pozitivni in negativni izvidi. Da bi bilo teh čim manj, je potrebno zagovoriti primerno kakovost postopkov v organiziranem programu (8). Evropska priporočila (9) navajajo različna priporočila za zagotovitev kakovosti presejanja in diagnostike raka dojk. Neustrezna kakovost pozicioniranja na mamografiji lahko vodi do neuspešnega odkrivanja raka dojke ali napačne diagnoze (13).

Pri izdelavi visoko kakovostnih mamografskih posnetkov ima radiološki inženir osrednjo vlogo. Posnetki so ključnega pomena za zgodnjo diagnozo raka dojk (9). Za zagotovitev standardne kakovosti, moramo v timu imeti strokovno izobraženo osebje (14). Radiološki inženir je odgovoren, da je mamogram primerno osvetljen, visoko kontrasten, ne sme vsebovati artefaktov, narejen mora biti z najnižjo dosegljivo dozo ob še primerni kvaliteti ter dobro pozicioniran (16). Pravilno pozicioniranje dojk pomeni, da pridobimo posnetek z največjim možnim pregledom tkiva dojk, s tem pa zmanjšamo število ponovnih slikanj in omogočamo najboljše možnosti za odkrivanje sprememb (9).

V Sloveniji za zagotavljanje visokih standardov slikanja se v programu DORA izvaja 1-2 krat letno ocenjevanje mamogramov vseh radioloških inženirjev, ki delajo v tem programu. Pred začetkom dela na presejalnem programu mora radiološki inženir uspešno opraviti usposabljanje, pridobiti certifikat in takrat lahko samostojno prične z delom v programu DORA (17).

Poznamo različne kriterije za ocenjevanje rentgenograma mamografskih posnetkov in sicer najbolj uporabljene so:
• PGMI, ki temelji na razdelitvi posnetkov v štiri skupine (P (perfect) oz. odlični, G (good) oz. dobri, M (moderate) oz. zmerno dobri, I (inadequate) oz. neustrezni posnetki) (11,17,18),
• EAR, ki temelji na razdelitvi v tri skupine (Excellent (E) oz. odlični, Acceptable (A) oz. sprejemljivi posnetki, Repeat (R) the image oz. posnetki, ki jih je potrebno ponoviti) (11) in
• Dokustufen, ki se uporablja v Nemčiji in je razdeljen v tri stopnje (Stufe 1, 2 in 3) (19).

Ocenjevanje mamogramov poteka z namenom sprotnega odkrivanja in tudi odpravljanja napak pri pozicioniranju. V Avstraliji Nacionalni akreditacijski standard Breast Screen Avstralija (21) zahteva, da morajo radiološki inženirji izvesti najmanj 50 % naključno izbranih posnetkov, ki spadajo v kategorije P ali G. Oktobra 2015 so ta standard dvignili na 75 %. Prav tako Evropske smernice za Evropsko unijo v Nacionalnem standardu za akreditacijo določajo minimalni doseg vsaj 50 % posnetkov, ki spadajo v kategorije P ali G, Irska pa ima nekoliko višji cilj in sicer 75 % (11,17,18).

V Sloveniji imamo sistem sprotnega ocenjevanja mamogramov, vsaj enkrat tedensko (17). Kontrola kakovosti dela za enega diplomiranega radiološkega inženirja vsebuje 30 naključno izbranih sklopov mamografij. Ne ocenjujejo se tisti sklopi, pri katerih so označene opombe kot objektivni razlog za slabši posnetek (npr. poškodba rame, invalidski voziček, bergle, bolečine v hrbtenici). V Sloveniji, prav tako kot na Irskem in Avstraliji, mora biti skupna povprečna ocena pozicioniranja nad 75 % posnetkov prve stopnje. Dodaten pogoj je, da mora vsak inženir imeti nad 75 % tudi vsako projekcijo posamezno – kraniokavdalno (CC) ali mediolateralno polstransko projekcijo (MLO). Velikokrat je bilo namreč ugotovljeno, da so bile MLO projekcije slabše ocenjene, do česar ne bi smelo priti, saj sta obe projekciji enako pomembni (14). Eklund et al. (6) namreč navaja, da naj bi bila MLO projekcija celo pomembnejša, saj se pri pravilnem pozicioniranju na tej projekciji prikažejo vsa tkiva dojk, na CC pa ne.

Rezultati analiz v Minnesoti in Coloradu kažejo, da je zakonodaja z nadzorom in ocenjevanjem pozicioniranja dojk privedla do tehničnih izboljšav kakovosti posnetkov (24,25) kar pomeni, da je ocenjevanje nujno potrebno. V Sloveniji je za ocenjevanje vseh sklopov mamografij odgovoren diplomirani radiološki inženir DORA za nadzor kakovosti. Če vzamemo primer iz leta 2017, so imeli v Sloveniji na programu DORA na Onkološkem inštitutu zaposlenih 24 radioloških inženirjev, poleg glavne enote pa 9 dislociranih enot, na katerih je delalo 47 radioloških inženirjev. Pri vsakem inženirju je bilo potrebno oceniti 30 mamogramov, kar pomeni skupno 8520 mamogramov. V primeru, da se ocenjevanje kakovosti mamogramov izvaja dvakrat letno, ta številka naraste na 17040. V letu 2018 so odprli še dodatne enote in zaposlili več novih radioloških inženirjev, kar pomeni dodatno ocenjevanje. Poleg vseh prednosti, ki jih predstavlja ocenjevanje za samo kakovost dela na presejalnem programu, pa je za ocenjevanje (enkrat na leto) potrebno minimalno 1 mesec (7 minut na en posnetek, če ocenjuje 4 ure na dan). Ocenjevanje mamografskih posnetkov vseh radioloških inženirjev zahteva ogromno časa, poleg tega pa mora biti ocenjevalec zbran in objektiven (14). Ocenjevanje je zahtevno, opravlja pa ga lahko le strokovno izobraženo osebje. Trenutno v Sloveniji vse posnetke ocenjuje vodja radioloških inženirjev DORA programa, torej ena radiološka inženirka. Glede na zgoraj navedene podatke, prav tako pa so tudi Hemdal et al. (26) že 15 let nazaj ugotovili, da obstaja potreba po orodjih, ki bi se lahko na enostaven način uporabila za vrednotenje kakovosti posnetkov povezane s kliničnimi zahtevami pri mamografiji.

2 NAMEN IN CILJ RAZISKAVE

Namen raziskave je razviti postopke za avtomatizacijo vrednotenja kakovosti mamografskih posnetkov v programu DORA. S postopki avtomatizacije bi tako pospešili vrednotenje posnetkov, dosegli bi objektivnost (posnetki bi bili ocenjeni neodvisno od ocenjevalca), hkrati pa bi omogočili, da bi se lahko ocenjevanje izvajalo večkrat letno in pri tem porabili manj časa. Tako bi ohranili višjo raven zagotavljanja kakovosti dela radiološkim inženirjev, s tem dosegli kvalitetnejše obravnave in hkrati celostno obravnavo preiskovanke.

Cilj je ugotoviti ali lahko s pomočjo strojnega učenja in uporabe postopkov medicinskega vrednotenja posnetkov zagotavljamo avtomatsko kontrolo kakovosti dela radioloških inženirjev, zaposlenih na programu DORA in se s tem približamo ocenjevanju eksperta (inženirja ocenjevalca). Najprej bomo morali narediti porazdelitev vseh možnih napak na mamogramu, ki so posledica pozicioniranja. Na podlagi zbranih napak in označenih posnetkov bomo s pomočjo postopkov obdelave posnetkov in strojnega učenja gradili statistične modele, ki bodo sposobni odločati, kaj je dober posnetek in kaj slab. Pri izdelavi raziskave se bomo morali tudi sami ročno naučiti označevati napake ter ocenjevati mamograme kot eksperti. Naš cilj je razviti postopke za avtomatsko ocenjevanje do te mere, da se poskusimo čim bolj približati vrednotenju ocenjevalca in izvesti ocenjevanje v krajšem času.

2.1 HIPOTEZE RAZISKOVANJA

H1: Z uporabo postopkov obdelave posnetkov in postopkov strojnega učenja bomo razvili avtomatičen postopek za vrednotenje mamogramov, ki bo ocenjeval kakovost mamogramov enako zanesljivo kot ekspertni ocenjevalec.

H2: Pregled in končno vrednotenje mamogramov bo z uporabo avtomatičnih postopkov vrednotenja na računalniku potekalo hitreje, kot če bi posnetke ocenjeval ekspert.

3 METODE DELA

V naši nalogi bomo poskusili narediti računalniško aplikacijo za avtomatsko ocenjevanje mamografskih posnetkov. Računalniško aplikacijo bomo naučili ocenjevati posnetke po PGMI klasifikaciji, ki je splošno najbolj znana po svetu. Tako bo aplikacija lahko uporabna tudi izven Slovenije. Kasneje, če bo računalniška aplikacija uspešna, jo bomo dodelali ter še bolj natančno po Slovenski klasifikaciji določili parametre ter z njo ocenjevali posnetke tudi po domačem kriteriju. Uporabili bomo postopke medicinskega vrednotenja posnetkov in strojnega učenja ter poskusili razviti aplikacijo, ki bo znala objektivno po navedenih kriterijih oz. merilih oceniti posnetke v zbirki ter podati končno oceno radiološkega inženirja.

Izvedbe raziskave se bomo lotili v več korakih. Za dosego avtomatizacije postopka ocenjevanja mamografskih posnetkov bomo potrebovali ustrezno zbirko posnetkov iz programa DORA. Ti posnetki bodo morali biti ustrezno označeni z zaznanimi napakami in končno oceno kakovosti dela radioloških inženirjev s strani odgovornega diplomiranega radiološkega inženirja za nadzor kakovosti (ocenjevalca). Dosedanje vrednotenje na programu DORA omogoča vpogled na že ocenjene posnetke, kar nam bo omogočilo lažjo pridobitev zbirke posnetkov in hkrati primerjavo med vrednotenjem posnetkov fizične osebe (ocenjevalca) in računalniške aplikacije. Zbiranje ocenjenih posnetkov bo potekalo 8 mesecev. Vsak ocenjen posnetek v zbirki bo moral biti ovrednoten po ustreznem PGMI kriteriju, ki se v Sloveniji uporabljal med letoma 2011 in 2013, ko so posnetke ocenjevale dve radiološki inženirki, preden so razvili Slovensko klasifikacijo. Zbrali bomo vse posnetke, ki so bile v izbranih letih ocenjene. Ocenjevanje je potekalo že leta prej po omenjenem kriteriju, vendar je za ocenjevanje takrat bila odgovorna zdravnica radiologinja.

Najprej se bomo lotili pregleda literature na področju mamografskih posnetkov, kontrole kvalitete in vrednotenja posnetkov glede na pozicioniranje dojk s strani radioloških inženirjev. Nato bomo izdelali grafe porazdelitve vseh napak. S tem bomo ugotovili, katere napake se največkrat pojavljajo v DORI v Sloveniji in v kolikšni pogostosti. Nato se bomo s pomočjo ocenjevalca na DORI tudi sami naučili prepoznavanja in označevanja napak ter podajanja končne ocene. Za vsako možno napako bomo morali najti ustrezno količino posnetkov. Tako bomo identificirali ključne elemente avtomatizacije. Potem bomo dodali še vse posnetke brez napak in tako učili statistične modele za prepoznavanje posnetkov z napakami in brez napak. Pri obdelavi posnetkov in učenju modelov bomo uporabili postopke obdelave medicinskih posnetkov kot so izboljšave kontrasta, postopke segmentacije, postopke določanja slikovnih značilk ipd. ter postopke strojnega učenja po klasičnih metodah kot tudi po metodah globokega učenja. Sistem bo zgrajen tako, da bo prepoznaval vsako napako ločeno po principu verifikacije, tj. pri vsakem posnetku se bo sistem odločil, ali obstaja možnost napake ali ne. Zato bomo uporabljali različne postopke modeliranja pri različnih tipih napak. Predvidevamo lahko, da se bodo pri globalnih napakah na posnetku izkazali za učinkovite postopki globokega učenja, pri lokalnih napakah pa bomo gradili modele na podlagi (lokalnih) značilk s klasičnimi postopki strojnega učenja.

Zaradi ogromne količine podatkov bomo delali sproti in pri tem uporabljali različne računalniške programe, kot so Excel, Matlab, SPSS Statistics 25, KNIME, IMPAX sistem za shranjevanje posnetkov na Onkološkem inštitutu ter interni PACS sistem na Zdravstveni fakulteti. Nato bomo v računalniško aplikacijo vnesli vse merljive in nemerljive podatke, ki jih najdemo v klasifikaciji. Pod merljive podatke spadajo širina in kot prsne mišice, velikost dojke, velikost gube, odstopanje od simetrije, pod nemerljive pa položaj bradavice, gube ter prikaz razpete inframamarne gube. Izognili se bomo ocenjevanju posnetkov, pri katerih so zapisane opombe in posnetkom, kjer zaradi anatomskih vzrokov ni mogoče narediti optimalnega mamograma (invalidski vozički, bolezni, poškodbe, nepravilna anatomija dojke/prsnega koša). Takim posnetkom se izognejo tudi v ocenjevanju programa DORA. Po zaključku ocenjevanja računalniške aplikacije in dobljeni končni oceni mamografskih posnetkov bomo oceno oz. stopnjo posnetka ocenjenega z aplikacijo primerjali s stopnjo oz. oceno posnetkov, ki so bili ocenjeni s strani radiološkega inženirja.

Pred izvedbo prvega koraka bomo potrebovali dovoljenje oz. soglasje vodje oddelka, Etične komisije Onkološkega inštituta Ljubljana, Komisije za strokovno oceno protokolov kliničnih raziskav in Strokovnega sveta Onkološkega Inštituta Ljubljana za raziskovanje ter seveda omogočen dostop do označenih in ocenjenih medicinskih posnetkov z označenimi napakami. Potrebovali bomo tudi dovoljenje Komisije za medicinsko etiko RS, ki bo ocenila etičnost predloga raziskave in odobrila uporabo medicinskih posnetkov za dodatno obdelavo. Študija bo potekala retrospektivno, na že opravljenih mamogramih, zato pri raziskavi ne predvidevamo nobenega tveganja in drugih neugodnih ukrepov za zdravje pacientov, katerih posnetki bodo vključeni v raziskavo. Vsi podatki uporabljeni v raziskavi bodo anonimizirani. Potrebovali bomo le označene pacientove posnetke in njihove oznake, ki so zapisane na ocenjevalnih listih v tem obdobju, za lažjo primerjavo končne ocene. Temu bo tako, ker so na to številko vezane vse ocene kakovosti mamografskih slik narejene iz strani prej omenjenih radioloških inženirk.

3.1 ČASOVNI PLAN

• Januar 2019 – avgust 2019: pridobitev vseh dovoljenj, pregled literature, učenje prepoznavanja in označevanja napak in učenje programiranja
• September 2019 – December 2019: označevanje vseh slik, razvijanje programske aplikacije in vnos kriterijev v ustrezno programsko aplikacijo, pilotna raziskava
• Januar 2020 – April 2019: izvedba pilotne raziskave in pridobitev končne ocene oz. stopnje mamogramov
• Maj, junij 2020: Primerjava končnih ocen slik, ki so bile ocenjene s strani radiološkega inženirja in ocene slik ocenjene s pomočjo programske opreme
• Julij 2020 – December 2020: Analiza podatkov, zaključek.