• mi

Validacija modela podatkovnega rudarjenja v primerjavi s tradicionalnimi metodami ocenjevanja zobne starosti med korejskimi mladostniki in mladimi odraslimi

Hvala, ker ste obiskali Nature.com.Različica brskalnika, ki jo uporabljate, ima omejeno podporo za CSS.Za najboljše rezultate priporočamo uporabo novejše različice brskalnika (ali izklop načina združljivosti v Internet Explorerju).Medtem, da zagotovimo stalno podporo, spletno mesto prikazujemo brez oblikovanja ali JavaScripta.
Zobje veljajo za najnatančnejši pokazatelj starosti človeškega telesa in se pogosto uporabljajo pri forenzičnem ocenjevanju starosti.Naš cilj je bil potrditi ocene zobne starosti na podlagi podatkovnega rudarjenja s primerjavo natančnosti ocenjevanja in učinkovitosti klasifikacije 18-letnega praga s tradicionalnimi metodami in ocenami starosti na podlagi podatkovnega rudarjenja.Skupaj je bilo zbranih 2657 panoramskih radiografij korejskih in japonskih državljanov, starih od 15 do 23 let.Razdeljeni so bili v sklop za usposabljanje, od katerega je vsak vseboval 900 korejskih radiografij, in interni testni niz, ki je vseboval 857 japonskih radiografij.Primerjali smo klasifikacijsko točnost in učinkovitost tradicionalnih metod s testnimi nizi modelov podatkovnega rudarjenja.Natančnost tradicionalne metode na internem preskusnem nizu je nekoliko višja kot pri modelu podatkovnega rudarjenja, razlika pa je majhna (povprečna absolutna napaka <0,21 leta, koren povprečne kvadratne napake <0,24 leta).Učinkovitost razvrščanja za 18-letno mejo je prav tako podobna med tradicionalnimi metodami in modeli podatkovnega rudarjenja.Tako je mogoče tradicionalne metode nadomestiti z modeli podatkovnega rudarjenja pri izvajanju forenzične ocene starosti z uporabo zrelosti drugega in tretjega molarja pri korejskih mladostnikih in mladih odraslih.
Ocena zobne starosti se pogosto uporablja v sodni medicini in otroškem zobozdravstvu.Predvsem zaradi visoke korelacije med kronološko starostjo in razvojem zob je ocenjevanje starosti po stopnjah razvoja zob pomembno merilo za ocenjevanje starosti otrok in mladostnikov1,2,3.Pri mladih pa ima ocenjevanje zobne starosti na podlagi zobne zrelosti svoje omejitve, ker je zobna rast skoraj končana, z izjemo tretjih kočnikov.Zakonski namen določanja starosti mladostnikov in mladostnikov je zagotoviti točne ocene in znanstvene dokaze o njihovi polnoletnosti.V medicinsko-pravni praksi mladostnikov in mlajših odraslih v Koreji je bila starost ocenjena z uporabo Leejeve metode, pravni prag 18 let pa je bil predviden na podlagi podatkov, ki so jih sporočili Oh et al 5 .
Strojno učenje je vrsta umetne inteligence (AI), ki se vedno znova uči in razvršča velike količine podatkov, sama rešuje probleme in spodbuja programiranje podatkov.Strojno učenje lahko odkrije koristne skrite vzorce v velikih količinah podatkov6.Nasprotno pa imajo lahko klasične metode, ki so delovno intenzivne in dolgotrajne, omejitve pri obravnavi velikih količin kompleksnih podatkov, ki jih je težko obdelati ročno7.Zato je bilo v zadnjem času izvedenih veliko študij z uporabo najnovejših računalniških tehnologij za zmanjšanje človeških napak in učinkovito obdelavo večdimenzionalnih podatkov8,9,10,11,12.Zlasti globoko učenje se pogosto uporablja pri analizi medicinskih slik, poročali pa so, da različne metode za ocenjevanje starosti s samodejno analizo radiografskih slik izboljšajo natančnost in učinkovitost ocenjevanja starosti13,14,15,16,17,18,19,20. .Na primer, Halabi et al 13 so razvili algoritem strojnega učenja, ki temelji na konvolucijskih nevronskih mrežah (CNN) za oceno skeletne starosti z uporabo rentgenskih posnetkov otroških rok.Ta študija predlaga model, ki uporablja strojno učenje za medicinske slike in kaže, da lahko te metode izboljšajo diagnostično natančnost.Li et al14 so ocenili starost na podlagi rentgenskih slik medenice z uporabo globokega učenja CNN in jih primerjali z rezultati regresije z oceno stopnje okostenitve.Ugotovili so, da je model globokega učenja CNN pokazal enako uspešnost ocene starosti kot tradicionalni regresijski model.Študija Guoja in drugih [15] je ovrednotila učinkovitost klasifikacije tolerance glede na starost tehnologije CNN na podlagi zobnih ortofotografij, rezultati modela CNN pa so dokazali, da so ljudje boljši od njene učinkovitosti klasifikacije glede na starost.
Večina študij o ocenjevanju starosti z uporabo strojnega učenja uporablja metode globokega učenja13,14,15,16,17,18,19,20.Poroča se, da je ocena starosti na podlagi globokega učenja natančnejša od tradicionalnih metod.Vendar pa ta pristop ponuja malo možnosti za predstavitev znanstvene podlage za ocene starosti, kot so starostni kazalniki, uporabljeni v ocenah.Sodni spor je tudi, kdo izvaja nadzor.Zato upravni in sodni organi težko sprejmejo oceno starosti na podlagi globokega učenja.Podatkovno rudarjenje (DM) je tehnika, ki lahko odkrije ne samo pričakovane, temveč tudi nepričakovane informacije kot metodo za odkrivanje uporabnih korelacij med velikimi količinami podatkov6,21,22.Strojno učenje se pogosto uporablja pri rudarjenju podatkov in tako rudarjenje podatkov kot strojno učenje uporabljata iste ključne algoritme za odkrivanje vzorcev v podatkih.Ocena starosti z uporabo zobnega razvoja temelji na pregledovalčevi oceni zrelosti ciljnih zob, ta ocena pa je izražena kot stopnja za vsak ciljni zob.DM se lahko uporablja za analizo korelacije med stopnjo ocenjevanja zob in dejansko starostjo in lahko nadomesti tradicionalno statistično analizo.Če torej uporabimo tehnike DM za oceno starosti, lahko uporabimo strojno učenje v forenzični oceni starosti brez skrbi za pravno odgovornost.Objavljenih je bilo več primerjalnih študij o možnih alternativah tradicionalnim ročnim metodam, ki se uporabljajo v forenzični praksi, in metodam, ki temeljijo na EBM, za določanje starosti zob.Shen in drugi23 so pokazali, da je model DM natančnejši od tradicionalne Camererjeve formule.Galibourg et al24 so uporabili različne metode DM za napovedovanje starosti v skladu z Demirdjianovim kriterijem25 in rezultati so pokazali, da je metoda DM prekašala metode Demirdjian in Willems pri ocenjevanju starosti francoskega prebivalstva.
Za oceno zobne starosti korejskih mladostnikov in mladih odraslih se v korejski forenzični praksi pogosto uporablja Leejeva metoda 4.Ta metoda uporablja tradicionalno statistično analizo (kot je multipla regresija) za preučevanje razmerja med korejskimi subjekti in kronološko starostjo.V tej študiji so metode ocenjevanja starosti, pridobljene s tradicionalnimi statističnimi metodami, opredeljene kot "tradicionalne metode".Leejeva metoda je tradicionalna metoda, njeno natančnost pa so potrdili Oh et al.5;vendar pa je uporabnost ocene starosti na podlagi modela DM v korejski forenzični praksi še vedno vprašljiva.Naš cilj je bil znanstveno potrditi potencialno uporabnost ocene starosti na podlagi modela DM.Namen te študije je bil (1) primerjati natančnost dveh modelov DM pri ocenjevanju zobne starosti in (2) primerjati učinkovitost klasifikacije 7 modelov DM pri starosti 18 let s tistimi, pridobljenimi s tradicionalnimi statističnimi metodami. in tretji kočniki v obeh čeljustih.
Povprečja in standardni odkloni kronološke starosti glede na stopnjo in vrsto zob so prikazani na spletu v dodatni tabeli S1 (nabor za usposabljanje), dodatni tabeli S2 (notranji testni niz) in dodatni tabeli S3 (zunanji testni niz).Vrednosti kappa za zanesljivost med opazovalci in med opazovalci, pridobljene iz učnega niza, so bile 0,951 oziroma 0,947.Vrednosti P in 95-odstotni intervali zaupanja za vrednosti kapa so prikazani v spletni dodatni tabeli S4.Vrednost kappa je bila interpretirana kot "skoraj popolna", skladna z merili Landisa in Kocha26.
Pri primerjavi srednje absolutne napake (MAE) tradicionalna metoda nekoliko prekaša model DM za vse spole in v zunanjem moškem testnem nizu, z izjemo večplastnega perceptrona (MLP).Razlika med tradicionalnim modelom in modelom DM na internem testu MAE je bila 0,12–0,19 leta za moške in 0,17–0,21 leta za ženske.Pri zunanji testni bateriji so razlike manjše (0,001–0,05 leta za moške in 0,05–0,09 leta za ženske).Poleg tega je povprečna kvadratna napaka (RMSE) nekoliko nižja od tradicionalne metode z manjšimi razlikami (0,17–0,24, 0,2–0,24 za moški interni testni niz in 0,03–0,07, 0,04–0,08 za zunanji testni niz).).MLP kaže nekoliko boljšo zmogljivost kot Single Layer Perceptron (SLP), razen v primeru ženskega zunanjega preskusnega kompleta.Za MAE in RMSE ima zunanji testni niz višje rezultate kot notranji testni niz za vse spole in modele.Vsi MAE in RMSE so prikazani v tabeli 1 in sliki 1.
MAE in RMSE tradicionalnih in regresijskih modelov podatkovnega rudarjenja.Povprečna absolutna napaka MAE, koren srednje kvadratne napake RMSE, enoslojni perceptron SLP, večplastni perceptron MLP, tradicionalna metoda CM.
Učinkovitost razvrščanja (z mejo 18 let) tradicionalnih modelov in modelov DM je bila dokazana v smislu občutljivosti, specifičnosti, pozitivne napovedne vrednosti (PPV), negativne napovedne vrednosti (NPV) in površine pod krivuljo delovanja sprejemnika (AUROC) 27 (tabela 2, slika 2 in dodatna slika 1 na spletu).Kar zadeva občutljivost notranje testne baterije, so se tradicionalne metode izkazale najbolje pri moških in slabše pri ženskah.Vendar pa je razlika v učinkovitosti razvrščanja med tradicionalnimi metodami in SD 9,7 % za moške (MLP) in samo 2,4 % za ženske (XGBoost).Med modeli DM je logistična regresija (LR) pokazala boljšo občutljivost pri obeh spolih.Kar zadeva specifičnost internega testnega niza, je bilo ugotovljeno, da so se štirje modeli SD dobro izkazali pri moških, medtem ko se je tradicionalni model izkazal bolje pri ženskah.Razlike v učinkovitosti klasifikacije za moške in ženske so 13,3 % (MLP) oziroma 13,1 % (MLP), kar kaže, da razlika v učinkovitosti klasifikacije med modeli presega občutljivost.Med modeli DM so se med moškimi najbolje odrezali modeli podpornega vektorskega stroja (SVM), odločitvenega drevesa (DT) in naključnega gozda (RF), medtem ko se je med ženskami najbolje odrezal model LR.AUROC tradicionalnega modela in vseh modelov SD je bil večji od 0,925 (k-najbližji sosed (KNN) pri moških), kar kaže na odlično učinkovitost razvrščanja pri razlikovanju 18-letnih vzorcev28.Pri zunanjem preskusnem nizu je prišlo do zmanjšanja učinkovitosti razvrščanja v smislu občutljivosti, specifičnosti in AUROC v primerjavi z notranjim testnim nizom.Poleg tega je razlika v občutljivosti in specifičnosti med klasifikacijsko uspešnostjo najboljših in najslabših modelov znašala od 10 % do 25 % in je bila večja od razlike v internem testnem nizu.
Občutljivost in specifičnost klasifikacijskih modelov podatkovnega rudarjenja v primerjavi s tradicionalnimi metodami z mejo 18 let.KNN k najbližji sosed, SVM podporni vektorski stroj, LR logistična regresija, DT odločitveno drevo, RF naključni gozd, XGB XGBoost, MLP večplastni perceptron, tradicionalna metoda CM.
Prvi korak v tej študiji je bila primerjava natančnosti ocen starosti zob, pridobljenih iz sedmih modelov DM, s tistimi, pridobljenimi s tradicionalno regresijo.MAE in RMSE sta bila ocenjena v internih nizih testov za oba spola, razlika med tradicionalno metodo in modelom DM pa je znašala od 44 do 77 dni za MAE in od 62 do 88 dni za RMSE.Čeprav je bila tradicionalna metoda v tej študiji nekoliko natančnejša, je težko sklepati, ali ima tako majhna razlika klinični ali praktični pomen.Ti rezultati kažejo, da je natančnost ocene zobne starosti z uporabo modela DM skoraj enaka kot pri tradicionalni metodi.Neposredna primerjava z rezultati prejšnjih študij je težka, ker nobena študija ni primerjala natančnosti modelov DM s tradicionalnimi statističnimi metodami z uporabo iste tehnike snemanja zob v istem starostnem obdobju kot v tej študiji.Galibourg in drugi24 so primerjali MAE in RMSE med dvema tradicionalnima metodama (metoda Demirjian25 in Willemsova metoda29) in 10 modelov DM v francoski populaciji, stari od 2 do 24 let.Poročali so, da so bili vsi modeli DM natančnejši od tradicionalnih metod, z razlikami 0,20 in 0,38 let v MAE ter 0,25 in 0,47 let v RMSE v primerjavi z Willemsovo in Demirdjianovo metodo.Neskladje med modelom SD in tradicionalnimi metodami, prikazano v haliburški študiji, upošteva številna poročila30,31,32,33, da Demirdjianova metoda ne oceni natančno zobne starosti pri populacijah, razen francoskih Kanadčanov, na katerih je študija temeljila.v tej študiji.Tai et al 34 so uporabili algoritem MLP za napovedovanje starosti zob iz 1636 kitajskih ortodontskih fotografij in primerjali njegovo natančnost z rezultati metode Demirjian in Willems.Poročali so, da ima MLP večjo natančnost kot tradicionalne metode.Razlika med Demirdjianovo in tradicionalno metodo je <0,32 let, Willemsova metoda pa 0,28 let, kar je podobno rezultatom pričujoče študije.Rezultati teh prejšnjih študij24,34 so tudi skladni z rezultati te študije, natančnost ocene starosti modela DM in tradicionalne metode pa sta podobni.Na podlagi predstavljenih rezultatov pa lahko le previdno sklepamo, da lahko uporaba modelov DM za oceno starosti nadomesti obstoječe metode zaradi pomanjkanja primerjalnih in referenčnih predhodnih študij.Za potrditev rezultatov, pridobljenih v tej študiji, so potrebne nadaljnje študije z uporabo večjih vzorcev.
Med študijami, ki so testirale natančnost SD pri ocenjevanju zobne starosti, so nekatere pokazale večjo natančnost kot naša študija.Stepanovsky et al 35 so uporabili 22 modelov SD na panoramskih radiografijah 976 čeških prebivalcev, starih od 2,7 do 20,5 let, in preizkusili natančnost vsakega modela.Ocenili so razvoj skupno 16 zgornjih in spodnjih levih stalnih zob z uporabo kriterijev razvrščanja, ki so jih predlagali Moorrees et al 36 .MAE se giblje od 0,64 do 0,94 leta, RMSE pa od 0,85 do 1,27 leta, kar je natančnejše od dveh modelov DM, uporabljenih v tej študiji.Shen in drugi23 so uporabili metodo Cameriere za oceno zobne starosti sedmih stalnih zob v levi spodnji čeljusti pri prebivalcih vzhodne Kitajske, starih od 5 do 13 let, in jo primerjali s starostjo, ocenjeno z uporabo linearne regresije, SVM in RF.Pokazali so, da imajo vsi trije modeli DM večjo natančnost v primerjavi s tradicionalno formulo Cameriere.MAE in RMSE v Shenovi študiji sta bila nižja od tistih v modelu DM v tej študiji.Povečana natančnost študij Stepanovsky et al.35 in Shen et al.23 je lahko posledica vključitve mlajših subjektov v njihove študijske vzorce.Ker postanejo ocene starosti za udeležence z razvijajočimi se zobmi natančnejše, ko se število zob poveča med razvojem zob, je lahko točnost dobljene metode ocenjevanja starosti ogrožena, ko so udeleženci študije mlajši.Poleg tega je napaka MLP pri oceni starosti nekoliko manjša od napake SLP, kar pomeni, da je MLP natančnejši od SLP.MLP velja za nekoliko boljšega za oceno starosti, verjetno zaradi skritih plasti v MLP38.Vendar pa obstaja izjema za zunanji vzorec žensk (SLP 1,45, MLP 1,49).Ugotovitev, da je MLP natančnejši od SLP pri ocenjevanju starosti, zahteva dodatne retrospektivne študije.
Primerjali smo tudi učinkovitost klasifikacije modela DM in tradicionalne metode na 18-letnem pragu.Vsi testirani modeli SD in tradicionalne metode na internem testnem nizu so pokazali praktično sprejemljive stopnje diskriminacije za 18-letni vzorec.Občutljivost za moške in ženske je bila večja od 87,7 % oziroma 94,9 %, specifičnost pa je bila večja od 89,3 % oziroma 84,7 %.Tudi AUROC vseh testiranih modelov presega 0,925.Kolikor nam je znano, nobena študija ni preizkusila učinkovitosti modela DM za 18-letno razvrstitev na podlagi zrelosti zob.Rezultate te študije lahko primerjamo z učinkovitostjo klasifikacije modelov globokega učenja na panoramskih radiografijah.Guo et al.15 so izračunali učinkovitost klasifikacije modela globokega učenja, ki temelji na CNN, in ročne metode, ki temelji na Demirjianovi metodi, za določen starostni prag.Občutljivost in specifičnost ročne metode sta bili 87,7 % oziroma 95,5 %, občutljivost in specifičnost modela CNN pa sta presegli 89,2 % oziroma 86,6 %.Ugotovili so, da lahko modeli globokega učenja nadomestijo ali prekašajo ročno ocenjevanje pri razvrščanju starostnih pragov.Rezultati te študije so pokazali podobno učinkovitost klasifikacije;Menijo, da lahko klasifikacija z uporabo modelov DM nadomesti tradicionalne statistične metode za ocenjevanje starosti.Med modeli je bil najboljši model DM LR glede na občutljivost za moški vzorec ter občutljivost in specifičnost za ženski vzorec.LR je pri moških na drugem mestu po specifičnosti.Poleg tega LR velja za enega uporabniku prijaznejših modelov DM35 in je manj kompleksen ter težek za obdelavo.Na podlagi teh rezultatov je LR veljal za najboljši mejni model klasifikacije za 18-letnike v korejski populaciji.
Na splošno je bila natančnost ocene starosti ali uspešnosti klasifikacije na zunanjem nizu testov slaba ali nižja v primerjavi z rezultati na internem nizu testov.Nekatera poročila kažejo, da se natančnost ali učinkovitost razvrščanja zmanjša, ko se ocene starosti, ki temeljijo na korejskem prebivalstvu, uporabijo za japonsko prebivalstvo 5, 39, podoben vzorec pa je bil ugotovljen v tej študiji.Ta trend poslabšanja je bil opažen tudi v modelu DM.Zato je treba za natančno oceno starosti, tudi pri uporabi DM v procesu analize, dati prednost metodam, ki izhajajo iz podatkov o domači populaciji, kot so tradicionalne metode 5,39,40,41,42.Ker ni jasno, ali lahko modeli globokega učenja kažejo podobne trende, so potrebne študije, ki primerjajo točnost in učinkovitost klasifikacije z uporabo tradicionalnih metod, modelov DM in modelov globokega učenja na istih vzorcih, da se potrdi, ali lahko umetna inteligenca premaga te rasne razlike v omejeni starosti.ocene.
Dokazujemo, da je mogoče tradicionalne metode nadomestiti z oceno starosti na podlagi modela DM v praksi forenzičnega ocenjevanja starosti v Koreji.Odkrili smo tudi možnost implementacije strojnega učenja za forenzično ocenjevanje starosti.Vendar pa obstajajo jasne omejitve, kot je nezadostno število udeležencev v tej študiji za dokončno določitev rezultatov in pomanjkanje predhodnih študij za primerjavo in potrditev rezultatov te študije.V prihodnosti bi bilo treba študije DM izvajati z večjim številom vzorcev in bolj raznolikimi populacijami, da bi izboljšali njihovo praktično uporabnost v primerjavi s tradicionalnimi metodami.Za potrditev izvedljivosti uporabe umetne inteligence za ocenjevanje starosti v več populacijah so potrebne prihodnje študije za primerjavo natančnosti klasifikacije in učinkovitosti modelov DM in globokega učenja s tradicionalnimi metodami v istih vzorcih.
Študija je uporabila 2.657 ortografskih fotografij, zbranih od odraslih Korejcev in Japoncev, starih od 15 do 23 let.Korejski rentgenski posnetki so bili razdeljeni na 900 vadbenih nizov (19,42 ± 2,65 let) in 900 internih testnih nizov (19,52 ± 2,59 let).Komplet za usposabljanje je bil zbran v eni ustanovi (bolnišnica St. Mary v Seulu), lastni testni niz pa v dveh ustanovah (zobozdravstvena bolnišnica Nacionalne univerze v Seulu in zobozdravstvena bolnišnica Univerze Yonsei).Zbrali smo tudi 857 radiografij iz drugih populacijskih podatkov (Iwate Medical University, Japonska) za zunanje testiranje.Radiografi japonskih preiskovancev (19,31 ± 2,60 let) so bili izbrani kot zunanji testni niz.Podatki so bili zbrani retrospektivno za analizo stopenj razvoja zob na panoramskih rentgenskih slikah, posnetih med zdravljenjem zob.Vsi zbrani podatki so bili anonimni, razen spola, datuma rojstva in datuma radiografije.Merila za vključitev in izključitev so bila enaka kot v predhodno objavljenih študijah 4, 5.Dejansko starost vzorca so izračunali tako, da so odšteli datum rojstva od datuma rentgenskega posnetka.Vzorčna skupina je bila razdeljena na devet starostnih skupin.Porazdelitve po starosti in spolu so prikazane v tabeli 3. Ta študija je bila izvedena v skladu s Helsinško deklaracijo in jo je odobril institucionalni revizijski odbor (IRB) bolnišnice St. Mary v Seulu Katoliške univerze v Koreji (KC22WISI0328).Zaradi retrospektivne zasnove te študije ni bilo mogoče pridobiti informiranega soglasja vseh bolnikov, ki so bili pod radiografskim pregledom v terapevtske namene.Bolnišnica St. Mary's University v Seulu (IRB) je opustila zahtevo po informiranem soglasju.
Razvojne stopnje bimaksilarnega drugega in tretjega kočnika so bile ocenjene po Demircanovih kriterijih25.Izbran je bil le en zob, če je bila na levi in ​​desni strani vsake čeljusti najdena ista vrsta zoba.Če so bili homologni zobje na obeh straneh v različnih razvojnih stopnjah, je bil izbran zob z nižjo razvojno stopnjo, da se upošteva negotovost v ocenjeni starosti.Dva izkušena opazovalca sta ocenila sto naključno izbranih radiografij iz nabora za usposabljanje, da bi preizkusila zanesljivost med opazovalci po predkalibraciji za določitev stopnje zrelosti zob.Zanesljivost znotraj opazovalca je dvakrat v trimesečnih intervalih ocenil primarni opazovalec.
Spol in razvojno stopnjo drugega in tretjega molarja vsake čeljusti v nizu za usposabljanje je ocenil primarni opazovalec, usposobljen z različnimi modeli DM, dejanska starost pa je bila nastavljena kot ciljna vrednost.Modela SLP in MLP, ki se pogosto uporabljata v strojnem učenju, sta bila testirana glede na regresijske algoritme.Model DM združuje linearne funkcije z uporabo razvojnih stopenj štirih zob in združuje te podatke za oceno starosti.SLP je najenostavnejša nevronska mreža in ne vsebuje skritih plasti.SLP deluje na podlagi prenosa praga med vozlišči.Model SLP v regresiji je matematično podoben multipli linearni regresiji.Za razliko od modela SLP ima model MLP več skritih plasti z nelinearnimi aktivacijskimi funkcijami.Naši poskusi so uporabili skrito plast s samo 20 skritimi vozlišči z nelinearnimi aktivacijskimi funkcijami.Za usposabljanje našega modela strojnega učenja uporabite gradientni spust kot metodo optimizacije ter MAE in RMSE kot funkcijo izgube.Najboljši dobljeni regresijski model smo uporabili za notranji in zunanji testni niz in ocenili starost zob.
Razvit je bil algoritem za razvrščanje, ki uporablja zrelost štirih zob na učnem nizu za napovedovanje, ali je vzorec star 18 let ali ne.Za izdelavo modela smo izpeljali sedem predstavitvenih algoritmov strojnega učenja6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost in (7) MLP .LR je eden najpogosteje uporabljenih klasifikacijskih algoritmov44.Gre za algoritem nadzorovanega učenja, ki uporablja regresijo za napovedovanje verjetnosti pripadnosti podatkov določeni kategoriji od 0 do 1 in podatke na podlagi te verjetnosti razvrsti v bolj verjetno kategorijo;uporablja se predvsem za binarno klasifikacijo.KNN je eden najpreprostejših algoritmov strojnega učenja45.Ko dobi nove vhodne podatke, najde k podatkov blizu obstoječega nabora in jih nato razvrsti v razred z največjo frekvenco.Za število upoštevanih sosedov (k) smo postavili 3.SVM je algoritem, ki poveča razdaljo med dvema razredoma z uporabo funkcije jedra za razširitev linearnega prostora v nelinearni prostor, imenovan fields46.Za ta model uporabljamo pristranskost = 1, moč = 1 in gama = 1 kot hiperparametre za polinomsko jedro.DT je ​​bil uporabljen na različnih področjih kot algoritem za razdelitev celotnega niza podatkov v več podskupin s predstavljanjem pravil odločanja v drevesni strukturi47.Model je konfiguriran z minimalnim številom zapisov na vozlišče 2 in uporablja indeks Gini kot merilo kakovosti.RF je ansambelska metoda, ki združuje več DT-jev za izboljšanje zmogljivosti z uporabo metode združevanja zagonskega sistema, ki ustvari šibek klasifikator za vsak vzorec z večkratnim naključnim vlečenjem vzorcev iste velikosti iz izvirnega nabora podatkov48.Kot merila za ločevanje vozlišč smo uporabili 100 dreves, 10 globin dreves, 1 najmanjšo velikost vozlišča in indeks primesi Gini.Klasifikacija novih podatkov se določi z večino glasov.XGBoost je algoritem, ki združuje tehnike povečanja z metodo, ki kot podatke za usposabljanje vzame napako med dejanskimi in predvidenimi vrednostmi prejšnjega modela in poveča napako z uporabo gradientov49.To je široko uporabljen algoritem zaradi njegove dobre zmogljivosti in učinkovitosti virov ter visoke zanesljivosti kot korekcijska funkcija prekomernega opremljanja.Model je opremljen s 400 podpornimi kolesi.MLP je nevronska mreža, v kateri en ali več perceptronov tvori več plasti z eno ali več skritimi plastmi med vhodno in izhodno plastjo38.S tem lahko izvedete nelinearno klasifikacijo, kjer se, ko dodate vhodno plast in dobite vrednost rezultata, predvidena vrednost rezultata primerja z dejansko vrednostjo rezultata in napaka se prenese nazaj.Ustvarili smo skrito plast z 20 skritimi nevroni v vsaki plasti.Vsak model, ki smo ga razvili, smo uporabili za notranje in zunanje nize za testiranje učinkovitosti klasifikacije z izračunom občutljivosti, specifičnosti, PPV, NPV in AUROC.Občutljivost je opredeljena kot razmerje med vzorcem, za katerega se ocenjuje, da je star 18 let ali več, in vzorcem, za katerega se ocenjuje, da je star 18 let ali več.Specifičnost je delež vzorcev, mlajših od 18 let, in tistih, za katere se ocenjuje, da so mlajši od 18 let.
Zobozdravstvene stopnje, ocenjene v učnem nizu, so bile pretvorjene v numerične stopnje za statistično analizo.Izvedena je bila multivariatna linearna in logistična regresija, da bi razvili napovedne modele za vsak spol in izpeljali regresijske formule, ki jih je mogoče uporabiti za oceno starosti.Te formule smo uporabili za oceno starosti zob tako za notranje kot za zunanje teste.Tabela 4 prikazuje regresijske in klasifikacijske modele, uporabljene v tej študiji.
Zanesljivost znotraj in med opazovalci je bila izračunana z uporabo Cohenove kappa statistike.Da bi preizkusili točnost DM in tradicionalnih regresijskih modelov, smo izračunali MAE in RMSE z uporabo ocenjene in dejanske starosti notranjih in zunanjih preskusnih nizov.Te napake se običajno uporabljajo za ocenjevanje točnosti napovedi modela.Manjša kot je napaka, večja je točnost napovedi24.Primerjajte MAE in RMSE notranjih in zunanjih testnih nizov, izračunanih z uporabo DM in tradicionalne regresije.Klasifikacijska uspešnost 18-letne mejne vrednosti v tradicionalni statistiki je bila ocenjena z uporabo tabele nepredvidljivih dogodkov 2 × 2.Izračunano občutljivost, specifičnost, PPV, NPV in AUROC testnega niza smo primerjali z izmerjenimi vrednostmi klasifikacijskega modela DM.Podatki so izraženi kot povprečje ± standardni odklon ali število (%), odvisno od značilnosti podatkov.Dvostranske vrednosti P <0,05 so veljale za statistično pomembne.Vse rutinske statistične analize so bile izvedene z uporabo SAS različice 9.4 (SAS Institute, Cary, NC).Regresijski model DM je bil implementiran v Python z uporabo zaledja Keras50 2.2.4 in Tensorflow51 1.8.0 posebej za matematične operacije.Klasifikacijski model DM je bil implementiran v okolju analize znanja Waikato in analitični platformi Konstanz Information Miner (KNIME) 4.6.152.
Avtorji priznavajo, da je podatke, ki podpirajo zaključke študije, mogoče najti v članku in dodatnem gradivu.Nabori podatkov, ustvarjeni in/ali analizirani med študijo, so na razumno zahtevo na voljo pri ustreznem avtorju.
Ritz-Timme, S. et al.Ocena starosti: najsodobnejše za izpolnjevanje posebnih zahtev forenzične prakse.mednarodnost.J. Pravna medicina.113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. in Olze, A. Trenutno stanje forenzične ocene starosti živih oseb za namene kazenskega pregona.Forenzika.zdravilo.Patologija.1, 239–246 (2005).
Pan, J. et al.Spremenjena metoda za ocenjevanje zobne starosti otrok, starih od 5 do 16 let, na vzhodu Kitajske.klinični.Ustna anketa.25, 3463–3474 (2021).
Lee, SS itd. Kronologija razvoja drugega in tretjega molarja pri Korejcih in njena uporaba za forenzično oceno starosti.mednarodnost.J. Pravna medicina.124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY in Lee, SS Natančnost ocene starosti in ocene 18-letnega praga na podlagi zrelosti drugega in tretjega kočnika pri Korejcih in Japoncih.PLoS ONE 17, e0271247 (2022).
Kim, JY, et al.Analiza podatkov, ki temelji na predoperativnem strojnem učenju, lahko napove izid zdravljenja operacij spanja pri bolnikih z OSA.znanost.Poročilo 11, 14911 (2021).
Han, M. et al.Natančna ocena starosti iz strojnega učenja s človeškim posredovanjem ali brez njega?mednarodnost.J. Pravna medicina.136, 821–831 (2022).
Khan, S. in Shaheen, M. Od podatkovnega rudarjenja do podatkovnega rudarjenja.J. Informacije.znanost.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. in Shaheen, M. WisRule: Prvi kognitivni algoritem za rudarjenje asociacijskih pravil.J. Informacije.znanost.https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. in Abdullah U. Karm: Tradicionalno rudarjenje podatkov, ki temelji na pravilih povezovanja, ki temeljijo na kontekstu.izračunati.Matt.nadaljevati.68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. in Habib M. Zaznavanje semantične podobnosti na podlagi globokega učenja z uporabo besedilnih podatkov.informirati.tehnologije.nadzor.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. in Shahin, M. Sistem za prepoznavanje dejavnosti v športnih videoposnetkih.večpredstavnost.Aplikacije orodij https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS et al.Izziv strojnega učenja RSNA v pediatrični kostni dobi.Radiologija 290, 498–503 (2019).
Li, Y. et al.Forenzična ocena starosti iz medeničnih rentgenskih žarkov z uporabo globokega učenja.EVRO.sevanje.29, 2322–2329 (2019).
Guo, YC, et al.Natančna starostna klasifikacija z uporabo ročnih metod in globokih konvolucijskih nevronskih mrež iz ortografskih projekcijskih slik.mednarodnost.J. Pravna medicina.135, 1589–1597 (2021).
Alabama Dalora et al.Ocena starosti kosti z uporabo različnih metod strojnega učenja: sistematični pregled literature in meta-analiza.PLoS ONE 14, e0220242 (2019).
Du, H., Li, G., Cheng, K. in Yang, J. Populacijsko specifična starostna ocena afroameričanov in Kitajcev na podlagi prostornine pulpne komore prvih molarjev z uporabo računalniške tomografije s stožčastim žarkom.mednarodnost.J. Pravna medicina.136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK in Oh KS Določanje starostnih skupin živih ljudi z uporabo slik prvih kočnikov, ki temeljijo na umetni inteligenci.znanost.Poročilo 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N., in Urschler, M. Samodejna ocena starosti in klasifikacija večinske starosti iz multivariantnih podatkov MRI.IEEE J. Biomed.Zdravstvena opozorila.23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. in Li, G. Ocena starosti na podlagi 3D segmentacije pulpne komore prvih molarjev iz računalniške tomografije s stožčastim žarkom z integracijo globokega učenja in nizov ravni.mednarodnost.J. Pravna medicina.135, 365–373 (2021).
Wu, WT, et al.Podatkovno rudarjenje v kliničnih velikih podatkih: običajne zbirke podatkov, modeli korakov in metod.svet.zdravilo.vir.8, 44 (2021).
Yang, J. et al.Uvod v medicinske baze podatkov in tehnologije podatkovnega rudarjenja v dobi velikih podatkov.J. Avid.Osnovna medicina.13, 57–69 (2020).
Shen, S. et al.Camererjeva metoda za ocenjevanje starosti zob z uporabo strojnega učenja.BMC Oralno zdravje 21, 641 (2021).
Galliburg A. et al.Primerjava različnih metod strojnega učenja za napovedovanje zobne starosti z uporabo Demirdjianove metode stopenj.mednarodnost.J. Pravna medicina.135, 665–675 (2021).
Demirdjian, A., Goldstein, H. in Tanner, JM Nov sistem za ocenjevanje starosti zob.smrčati.biologija.45, 211–227 (1973).
Landis, JR, in Koch, GG Ukrepi soglasja opazovalcev o kategoričnih podatkih.Biometrija 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK in Choi HK.Teksturna, morfološka in statistična analiza dvodimenzionalnega slikanja z magnetno resonanco z uporabo tehnik umetne inteligence za diferenciacijo primarnih možganskih tumorjev.Informacije o zdravju.vir.https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Čas objave: Jan-04-2024