Validation of a data mining model against traditional dental age estimation methods among Korean adolescents and young adults

Hvala za obisk Nature.com. Različica brskalnika, ki ga uporabljate, ima omejeno podporo CSS. Za najboljše rezultate priporočamo uporabo novejše različice vašega brskalnika (ali izklopite način združljivosti v Internet Explorerju). Medtem za zagotovitev stalne podpore prikazujemo spletno mesto brez oblikovanja ali javascripta.
Zobje veljajo za najbolj natančen pokazatelj starosti človeškega telesa in se pogosto uporabljajo pri oceni forenzične starosti. Želeli smo potrditi ocene zobne starosti, ki temeljijo na podatkih, s primerjavo natančnosti ocene in klasifikacije uspešnosti 18-letnega praga s tradicionalnimi metodami in ocenami starosti, ki temeljijo na podatkih. Skupno 2657 panoramskih radiogramov je bilo zbranih od korejskih in japonskih državljanov, starih od 15 do 23 let. Razdeljeni so bili na vadbeni komplet, od katerih je vsak 900 korejskih radiogramov, in notranji testni komplet, ki vsebuje 857 japonskih radiogramov. Primerjali smo natančnost klasifikacije in učinkovitost tradicionalnih metod s testnimi nizi modelov rudarjenja podatkov. Natančnost tradicionalne metode na notranjem preskusnem nizu je nekoliko višja od modela rudarjenja podatkov, razlika pa je majhna (povprečna absolutna napaka <0,21 let, korenska povprečna kvadratna napaka <0,24 leta). Učinkovitost klasifikacije za 18-letno mejo je podobna tudi med tradicionalnimi metodami in modeli rudarjenja podatkov. Tako lahko tradicionalne metode nadomestimo z modeli rudarjenja podatkov pri oceni forenzične starosti z zrelostjo drugega in tretjega molarja pri korejskih mladostnikih in mladih odraslih.
Ocena zobne starosti se pogosto uporablja v forenzični medicini in otroški zobozdravti. Zlasti zaradi visoke povezave med kronološko starostjo in zobozdravstvenim razvojem je ocena starosti s stopnjami razvoja zob pomembno merilo za oceno starosti otrok in mladostnikov1,2,3. Vendar pa ima za mlade ocenjevanje zobne starosti, ki temelji na zobni zrelosti, svoje omejitve, ker je rast zob skoraj popolna, razen tretjega molarja. Pravni namen določanja starosti mladih in mladostnikov je zagotoviti natančne ocene in znanstvene dokaze o tem, ali so dosegli starost večine. V zdravilno prakso mladostnikov in mladih v Koreji je bila starost ocenjena z uporabo Leejeve metode, predviden je bil pravni prag 18 let na podlagi podatkov, ki so jih poročali OH et al.
Strojno učenje je vrsta umetne inteligence (AI), ki se večkrat nauči in razvrsti velike količine podatkov, samostojno rešuje težave in poganja programiranje podatkov. Strojno učenje lahko odkrije uporabne skrite vzorce v velikih količinah podatkov6. V nasprotju s tem imajo klasične metode, ki so delovno intenzivne in zamudne, omejile pri obravnavi velikih količin zapletenih podatkov, ki jih je težko obdelati ročno7. Zato so bile v zadnjem času izvedene številne študije z uporabo najnovejših računalniških tehnologij za zmanjšanje človeških napak in učinkovito obdelavo večdimenzionalnih podatkov8,9,10,11,12. Zlasti se je pri analizi medicinske slike pogosto uporabljalo globoko učenje, za samodejno analizo radiografov pa so poročali o različnih metodah ocenjevanja starosti . Na primer, Halabi in sod. 13 so razvili algoritem strojnega učenja, ki temelji na konvolucijskih nevronskih omrežjih (CNN) za oceno skeletnih starosti z uporabo radiogramov otroških rok. Ta študija predlaga model, ki uporablja strojno učenje pri medicinskih slikah in kaže, da lahko te metode izboljšajo diagnostično natančnost. Li et al14 so ocenili starost iz medeničnih rentgenskih slik z uporabo CNN poglobljenega učenja in jih primerjali z regresijskimi rezultati z uporabo ocene faze okostenja. Ugotovili so, da je model CNN globokega učenja pokazal enako uspešnost ocene starosti kot tradicionalni regresijski model. Študija Guo in sod. [15] je ovrednotila učinkovitost klasifikacije starostne tolerance CNN tehnologije na podlagi zobnih ortofotov, rezultati modela CNN pa so dokazali, da ljudje presegajo svojo učinkovitost svoje starostne klasifikacije.
Večina raziskav o starostni oceni z uporabo strojnega učenja uporablja metode globokega učenja13,14,15,16,17,18,19,20. Ocena starosti, ki temelji na globokem učenju, naj bi bila natančnejša od tradicionalnih metod. Vendar ta pristop ponuja malo možnosti za predstavitev znanstvene podlage za starostne ocene, kot so starostni kazalniki, ki se uporabljajo v ocenah. Obstaja tudi pravni spor o tem, kdo izvaja inšpekcijske preglede. Zato je upravne in pravosodne organe težko sprejeti starostno oceno, ki temelji na globokem učenju. Rudarjenje podatkov (DM) je tehnika, ki lahko odkrije ne le pričakovane, ampak tudi nepričakovane informacije kot metoda za odkrivanje koristnih korelacij med velikimi količinami podatkov6,21,22. Strojno učenje se pogosto uporablja pri rudarjenju podatkov, tako rudarjenje podatkov kot strojno učenje pa za odkrivanje vzorcev v podatkih uporabljata iste ključne algoritme. Ocena starosti z uporabo zobnega razvoja temelji na oceni izpraševalca o zrelosti ciljnih zob in ta ocena je izražena kot stopnja za vsak ciljni zob. DM se lahko uporabi za analizo korelacije med stopnjo ocene zob in dejansko starostjo in lahko nadomesti tradicionalno statistično analizo. Če torej za oceno starosti uporabimo tehnike DM, lahko v forenzični oceni starosti izvajamo strojno učenje, ne da bi skrbeli za pravno odgovornost. Objavljenih je bilo več primerjalnih študij o možnih alternativah tradicionalnim ročnim metodam, ki se uporabljajo v forenzični praksi in metodah, ki temeljijo na EBM, za določanje zobne starosti. Shen et al23 so pokazali, da je model DM natančnejši od tradicionalne formule Camererja. Galibourg et al24 so uporabili različne metode DM za napovedovanje starosti v skladu z Demirdjian Criterion25 in rezultati so pokazali, da je metoda DM pri ocenjevanju starosti francoske populacije presegla metodo Demirdjian in Willems.
Za oceno zobne dobe korejskih mladostnikov in mladih odraslih se Leejeva metoda 4 pogosto uporablja v korejski forenzični praksi. Ta metoda uporablja tradicionalno statistično analizo (kot je večkratna regresija) za preučevanje razmerja med korejskimi osebami in kronološko starostjo. V tej študiji so metode ocenjevanja starosti, pridobljene s tradicionalnimi statističnimi metodami, opredeljene kot "tradicionalne metode". Leejeva metoda je tradicionalna metoda, njegovo natančnost pa so potrdili OH et al. 5; Vendar je uporabnost ocene starosti, ki temelji na modelu DM v korejski forenzični praksi, še vedno vprašljiva. Naš cilj je bil znanstveno potrditi potencialno uporabnost ocene starosti, ki temelji na modelu DM. Namen te študije je bil (1) primerjati natančnosti dveh modelov DM pri ocenjevanju zobne starosti in (2) za primerjavo klasifikacijske zmogljivosti 7 modelov DM v starosti 18 let s tistimi, pridobljenimi z zrelostjo tradicionalnih statističnih metod v drugem in tretji kumi v obeh čeljusti.
Sredstva in standardna odstopanja kronološke starosti glede na stopnjo in zobno vrsto so prikazana na spletu v dodatni tabeli S1 (vadbeni niz), dodatni tabeli S2 (notranji testni niz) in dodatni tabeli S3 (zunanji testni niz). Vrednosti Kappe za zanesljivost znotraj in interobserverja, pridobljene z vadbenim nizom, so bile 0,951 oziroma 0,947. P vrednosti in 95 -odstotni intervali zaupanja za vrednosti Kappa so prikazani v spletni dodatni tabeli S4. Vrednost Kappa je bila razlagana kot "skoraj popolna", kar je skladno z merili Landis in Koch26.
Pri primerjavi povprečne absolutne napake (MAE) tradicionalna metoda rahlo presega model DM za vse spole in v zunanjem moškem testnem nizu, razen večplastnega perceptrona (MLP). Razlika med tradicionalnim modelom in modelom DM na notranjem testnem nizu MAE je bila za moške 0,12–0,19 let in za ženske 0,17–0,21 leta. Za zunanjo testno baterijo so razlike manjše (0,001–0,05 let za moške in 0,05–0,09 let za ženske). Poleg tega je koreninska povprečna kvadratna napaka (RMSE) nekoliko nižja od tradicionalne metode, z manjšimi razlikami (0,17–0,24, 0,2–0,24 za moški notranji testni niz in 0,03–0,07, 0,04–0,08 za zunanji testni niz). ). MLP kaže nekoliko boljšo zmogljivost kot en sloj Perceptron (SLP), razen v primeru žensk zunanjega testnega niza. Za MAE in RMSE je zunanji testni niz višji od notranjega testnega niza za vse spole in modele. Vsi MAE in RMSE so prikazani v tabeli 1 in na sliki 1.
MAE in RMSE tradicionalnih in regresijskih modelov rudarjenja podatkov. Povprečna absolutna napaka MAE, koreninska povprečna kvadratna napaka RMSE, en sloj Perceptron SLP, večplastni perceptron MLP, tradicionalna metoda CM.
Učinkovitost klasifikacije (z 18 -letno mejo) tradicionalnih in DM modelov je bila dokazana v smislu občutljivosti, specifičnosti, pozitivne napovedne vrednosti (PPV), negativne napovedne vrednosti (NPV) in območju pod karakteristično krivuljo sprejemnika (AUROC) 27 (tabela 2, slika 2 in dodatna slika 1 na spletu). Glede na občutljivost notranje testne baterije so se tradicionalne metode najbolje izvajale med moškimi in slabše med ženskami. Razlika v učinkovitosti klasifikacije med tradicionalnimi metodami in SD je 9,7% za moške (MLP) in le 2,4% za ženske (XGBOOST). Med modeli DM je logistična regresija (LR) pokazala boljšo občutljivost pri obeh spolih. Glede specifičnosti notranjega testnega niza je bilo opaziti, da so štirje modeli SD dobro delovali pri samcih, medtem ko je tradicionalni model boljši pri ženskah. Razlike v učinkovitosti klasifikacije pri moških in ženskah so 13,3% (MLP) oziroma 13,1% (MLP), kar kaže na to, da razlika v klasifikaciji med modeli presega občutljivost. Med modeli DM so modeli podpornega vektorja (SVM), drevesa odločitve (DT) in naključnimi gozdovi (RF) najbolj opravljali med moškimi, medtem ko je model LR najbolje deloval med samicami. Auroc tradicionalnega modela in vseh modelov SD je bil večji od 0,925 (K-najbližji sosed (KNN) pri moških), kar je pokazalo odlično klasifikacijsko uspešnost pri diskriminaciji 18-letnih vzorcev28. Za zunanji testni niz je prišlo do zmanjšanja učinkovitosti klasifikacije v smislu občutljivosti, specifičnosti in AUROC v primerjavi z notranjim preskusnim nizom. Poleg tega se je razlika v občutljivosti in specifičnosti med klasifikacijo najboljših in najslabših modelov gibala od 10% do 25% in je bila večja od razlike v notranjem testnem nizu.
Občutljivost in specifičnost modelov klasifikacije rudarjenja podatkov v primerjavi s tradicionalnimi metodami z izklopom 18 let. KNN K najbližji sosed, SVM Podporni vektorski stroj, LR logistična regresija, DT odločitveno drevo, RF naključni gozd, XGB XGboost, MLP večplastni perceptron, tradicionalna metoda CM.
Prvi korak v tej študiji je bil primerjava natančnosti ocen zobne starosti, pridobljenih iz sedmih modelov DM, s tistimi, pridobljenimi z uporabo tradicionalne regresije. MAE in RMSE sta bila ovrednotena v notranjih testnih nizih za oba spola, razlika med tradicionalno metodo in modelom DM pa se je gibala od 44 do 77 dni za MAE in od 62 do 88 dni za RMSE. Čeprav je bila v tej študiji tradicionalna metoda nekoliko bolj natančna, je težko sklepati, ali ima tako majhna razlika klinični ali praktični pomen. Ti rezultati kažejo, da je natančnost ocene zobne starosti z uporabo modela DM skoraj enaka kot pri tradicionalni metodi. Neposredna primerjava z rezultati prejšnjih študij je težka, saj nobena študija ni primerjala natančnosti modelov DM s tradicionalnimi statističnimi metodami z isto tehniko beleženja zob v istem starostnem obdobju kot v tej študiji. Galibourg et al24 so primerjali MAE in RMSE med dvema tradicionalnima metodama (Demirjian metoda25 in Willems metoda29) in 10 modelov DM v francoski populaciji, stari od 2 do 24 let. Poročali so, da so bili vsi modeli DM natančnejši od tradicionalnih metod, pri čemer so bile razlike 0,20 in 0,38 let pri MAE in 0,25 in 0,47 leta v RMSE v primerjavi z metodami Willems in Demirdjian. Neskladje med modelom SD in tradicionalnimi metodami, prikazanimi v študiji Halibourg, upošteva številna poročila 30,31,32,33, da metoda Demirdjian ne ocenjuje natančno zobne dobe v populacijah, razen francoskih Kanadčanov, na katerih je temeljila študija. V tej raziskavi. Tai in sod. 34 so uporabili algoritem MLP za napovedovanje starosti zob iz 1636 kitajskih ortodontskih fotografij in primerjali njeno natančnost z rezultati metode Demirjian in Willems. Poročali so, da ima MLP večjo natančnost kot tradicionalne metode. Razlika med Demirdjian metodo in tradicionalno metodo je <0,32 leta, metoda Willems pa 0,28 leta, kar je podobno rezultatom te študije. Rezultati teh prejšnjih študij24,34 so tudi skladni z rezultati te študije, natančnost ocene starosti modela DM in tradicionalne metode pa sta podobna. Vendar lahko na podlagi predstavljenih rezultatov le previdno sklepamo, da lahko uporaba modelov DM za oceno starosti nadomesti obstoječe metode zaradi pomanjkanja primerjalnih in referenčnih prejšnjih študij. Za potrditev rezultatov, pridobljenih v tej študiji, so potrebne nadaljnje študije z večjimi vzorci.
Med študijami, ki so testirale natančnost SD pri ocenjevanju zobne starosti, so nekatere pokazale večjo natančnost kot naša študija. Stepanovsky in sod. 35 so uporabili 22 modelov SD za panoramske radiografije 976 čeških prebivalcev, starih od 2,7 do 20,5 leta in preizkusili natančnost vsakega modela. Ocenili so razvoj skupno 16 zgornjih in spodnjih levih trajnih zob z uporabo klasifikacijskih meril, ki sta jih predlagala Moorrees et al. 36. MAE se giblje od 0,64 do 0,94 leta, RMSE pa se giblje od 0,85 do 1,27 let, kar sta natančnejši od dveh modelov DM, uporabljenih v tej študiji. Shen et al23 so uporabili metodo kamere za oceno zobne starosti sedmih trajnih zob v levem daljusti pri vzhodnih kitajskih prebivalcih, starih od 5 do 13 let, in jo primerjali s starostmi, ocenjenimi z linearno regresijo, SVM in RF. Pokazali so, da imajo vsi trije modeli DM večjo natančnost v primerjavi s tradicionalno formulo kamere. MAE in RMSE v študiji SHEN sta bila v tej študiji nižja od tistih v modelu DM. Povečana natančnost študij Stepanovsky in sod. 35 in Shen et al. 23 je lahko posledica vključitve mlajših oseb v vzorce študije. Ker ocene starosti za udeležence z razvojem zob postanejo bolj natančne, saj se število zob med zobnim razvojem poveča, lahko natančnost posledične metode ocenjevanja starosti ogrozi, ko so udeleženci študije mlajši. Poleg tega je napaka MLP pri ocenjevanju starosti nekoliko manjša od SLP -jev, kar pomeni, da je MLP bolj natančen kot SLP. MLP velja za nekoliko boljši za oceno starosti, morda zaradi skritih plasti v MLP38. Vendar pa obstaja izjema za zunanji vzorec žensk (SLP 1,45, MLP 1,49). Ugotovitev, da je MLP pri ocenjevanju starosti bolj natančen kot SLP, zahteva dodatne retrospektivne študije.
Primerjali so tudi klasifikacijsko zmogljivost modela DM in tradicionalno metodo na 18-letnem pragu. Vsi testirani modeli SD in tradicionalne metode na notranjem testnem nizu so pokazali praktično sprejemljive stopnje diskriminacije za 18-letni vzorec. Občutljivost za moške in ženske je bila večja od 87,7% oziroma 94,9%, specifičnost pa je bila večja od 89,3% in 84,7%. Auroc vseh testiranih modelov presega tudi 0,925. Kolikor nam je znano, nobena študija ni preizkusila uspešnosti modela DM za 18-letno klasifikacijo na podlagi zobne zrelosti. Rezultate te študije lahko primerjamo s klasifikacijo modelov globokega učenja na panoramskih radiografih. Guo in sod .15 so izračunali klasifikacijsko uspešnost modela globokega učenja, ki temelji na CNN, in ročno metodo, ki temelji na Demirjianovi metodi za določen starostni prag. Občutljivost in specifičnost ročne metode sta bila 87,7% oziroma 95,5%, občutljivost in specifičnost modela CNN pa sta presegla 89,2% oziroma 86,6%. Ugotovili so, da lahko modeli globokega učenja nadomestijo ali presegajo ročno oceno pri razvrščanju starostnih pragov. Rezultati te študije so pokazali podobno uspešnost klasifikacije; Verjame se, da lahko razvrstitev z uporabo modelov DM nadomesti tradicionalne statistične metode za oceno starosti. Med modeli je bil DM LR najboljši model v smislu občutljivosti za moški vzorec in občutljivost ter specifičnost za ženski vzorec. LR se uvršča na drugo mesto po posebnosti za moške. Poleg tega velja, da je LR eden bolj uporabniku prijaznih modelov DM35 in je manj zapleten in ga je težko obdelati. Na podlagi teh rezultatov je LR veljal za najboljši model klasifikacije za 18-letnike v korejskem prebivalstvu.
Na splošno je bila natančnost ocene starosti ali klasifikacije na zunanjem testnem nizu slaba ali nižja v primerjavi z rezultati na notranjem testnem nizu. Nekatera poročila kažejo, da se natančnost ali učinkovitost klasifikacije zmanjšuje, ko se ocene starosti, ki temeljijo na korejski populaciji, uporabljajo za japonsko populacijo5,39, podoben vzorec pa v tej študiji. Ta trend poslabšanja je bil opažen tudi v modelu DM. Zato bi morale biti za natančno oceno starosti, tudi če v postopku analize uporabite DM, prednostne metode, ki izhajajo iz podatkov o domačih populaciji, kot so tradicionalne metode, 5,39,40,41,42. Ker ni jasno, ali lahko modeli globokega učenja kažejo podobne trende, so potrebne študije, ki primerjajo natančnost in učinkovitost klasifikacije z uporabo tradicionalnih metod, modelov DM in modelov poglobljenega učenja na istih vzorcih, da se potrdi, ali lahko umetna inteligenca v omejeni starosti premaga te rasne razlike. ocene.
Dokazujemo, da lahko tradicionalne metode nadomestimo s starostno oceno na podlagi modela DM v praksi ocenjevanja forenzične starosti v Koreji. Odkrili smo tudi možnost izvajanja strojnega učenja za oceno forenzične starosti. Vendar pa obstajajo jasne omejitve, kot so nezadostno število udeležencev v tej študiji, da dokončno določijo rezultate, in pomanjkanje prejšnjih študij za primerjavo in potrditev rezultatov te študije. V prihodnosti bi bilo treba študije DM izvajati z večjim številom vzorcev in bolj raznoliko populacijo, da bi izboljšali njegovo praktično uporabnost v primerjavi s tradicionalnimi metodami. Za potrditev izvedljivosti uporabe umetne inteligence za oceno starosti pri več populacijah so potrebne prihodnje študije za primerjavo natančnosti klasifikacije in učinkovitosti modelov DM in globokega učenja s tradicionalnimi metodami v istih vzorcih.
Študija je uporabljala 2.657 ortografskih fotografij, zbranih od korejskih in japonskih odraslih, starih od 15 do 23 let. Korejski radiografi so bili razdeljeni na 900 vadbenih kompletov (19,42 ± 2,65 leta) in 900 notranjih testnih sklopov (19,52 ± 2,59 let). Usposabljanje je bilo zbrano na eni ustanovi (bolnišnica Seul St. Mary), lastni testni komplet pa je bil zbran na dveh ustanovah (Zobna zobozdravstvena bolnišnica Seul in univerza Yonsei). Za zunanje testiranje smo zbrali tudi 857 radiogramov iz drugih podatkov o populaciji (Iwate Medical University, Japonska). Kot zunanji testni niz so bili izbrani radiografi japonskih oseb (19,31 ± 2,60 let). Podatki so bili zbrani retrospektivno za analizo stopenj zobnega razvoja na panoramskih radiografih, ki so jih vzeli med zobozdravstvenim zdravljenjem. Vsi zbrani podatki so bili anonimni, razen spola, datuma rojstva in datuma radiografa. Merila za vključitev in izključitev so bila enaka kot prej objavljene študije 4, 5. Dejanska starost vzorca je bila izračunana z odštevanjem datuma rojstva od datuma, ko je bil odvzet radiograf. Vzorčna skupina je bila razdeljena v devet starostnih skupin. Starostna in spolna porazdelitev sta prikazana v tabeli 3 Ta študija je bila izvedena v skladu z deklaracijo o Helsinki in jo je odobril institucionalni revizijski odbor (IRB) bolnišnice St. Mary's St. Mary v Katoliški univerzi v Koreji (KC22WISI0328). Zaradi retrospektivne zasnove te študije ni bilo mogoče pridobiti informiranega soglasja vseh bolnikov, ki so bili podvrženi radiografskemu pregledu za terapevtske namene. Univerza Seul Korea University St. Mary's Hospital (IRB) se je odpovedala zahtevam za informirano soglasje.
Razvojne faze bimaksilarnega drugega in tretjega molarja so bile ocenjene v skladu z demircanskimi merili25. Izbran je bil samo en zob, če je bila na levi in desni strani vsake čeljusti najdena isto vrsto zoba. Če so bili homologni zobje na obeh straneh v različnih razvojnih fazah, je bil v oceni starosti izbran zob z nižjo stopnjo razvoja, da se upošteva negotovost. Sto naključno izbranih radiogramov iz vadbenega niza sta dosegla dva izkušena opazovalca, da bi preizkusila zanesljivost Interobserverja po predhodnici, da bi določila stopnjo zrelosti zob. Zanesljivost intraobserverja je primarni opazovalec dvakrat v trimesečnih intervalih ocenil dvakrat.
Spolna in razvojna stopnja drugega in tretjega molarja vsake čeljusti v vadbenem nizu je ocenila primarni opazovalec, usposobljen z različnimi modeli DM, dejanska starost pa je bila postavljena kot ciljna vrednost. Modeli SLP in MLP, ki se pogosto uporabljajo pri strojnem učenju, so bili testirani na regresijskih algoritmih. Model DM združuje linearne funkcije z uporabo razvojnih faz štirih zob in združuje te podatke za oceno starosti. SLP je najpreprostejša nevronska mreža in ne vsebuje skritih plasti. SLP deluje na podlagi menjalnika med vozlišči. Model SLP v regresiji je matematično podoben večkratni linearni regresiji. Za razliko od modela SLP ima model MLP več skritih slojev z nelinearnimi aktivacijskimi funkcijami. Naši poskusi so uporabili skrito plast z le 20 skritimi vozlišči z nelinearnimi aktivacijskimi funkcijami. Kot funkcijo izgube za usposabljanje našega modela strojnega učenja uporabite spust gradienta kot metodo optimizacije in MAE in RMSE. Najbolje pridobljeni regresijski model je bil uporabljen za notranje in zunanje testne sklope in ocenjeno starost zob.
Razvit je bil algoritem klasifikacije, ki na usposabljanju uporablja zrelost štirih zob, da napove, ali je vzorec star 18 let ali ne. Za izgradnjo modela smo izpeljali sedem algoritmov za reprezentativno strojno učenje6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBOOST in (7) MLP . LR je eden najpogosteje uporabljenih algoritmov klasifikacije44. To je nadzorovan algoritem učenja, ki uporablja regresijo za napovedovanje verjetnosti podatkov, ki pripadajo določeni kategoriji od 0 do 1, in podatke razvrsti kot pripadnost bolj verjetni kategoriji, ki temelji na tej verjetnosti; v glavnem se uporablja za binarno klasifikacijo. KNN je eden najpreprostejših algoritmov strojnega učenja45. Ko dajo novi vhodni podatki, najde K podatke blizu obstoječega niza in jih nato razvrsti v razred z najvišjo frekvenco. Nastavili smo 3 za število obravnavanih sosedov (K). SVM je algoritem, ki maksimira razdaljo med dvema razredama z uporabo funkcije jedra za razširitev linearnega prostora v nelinearni prostor, imenovan Fields46. Za ta model uporabljamo pristranskost = 1, moči = 1 in gama = 1 kot hiperparametri za polinomno jedro. DT je bil uporabljen na različnih področjih kot algoritem za delitev celotnega nabora podatkov na več podskupin z zastopanjem pravil odločitve v drevesni strukturi47. Model je konfiguriran z minimalnim številom zapisov na vozlišče 2 in kot merilo kakovosti uporablja indeks Gini. RF je metoda ansambla, ki združuje več DT -jev za izboljšanje zmogljivosti z uporabo metode združevanja zagona, ki ustvari šibek klasifikator za vsak vzorec z naključnim risanjem vzorcev iste velikosti večkrat iz prvotnega nabora podatkov48. Kot merila za ločevanje vozlišč smo uporabili 100 dreves, 10 drevesnih globin, 1 minimalno velikost vozlišča in indeks primesi Gini. Razvrstitev novih podatkov je določena z večino glasov. XGboost je algoritem, ki združuje tehnike povečevanja z uporabo metode, ki kot podatke o usposabljanju sprejme napako med dejanskimi in predvidenimi vrednostmi prejšnjega modela in napako poveča z uporabo gradients49. Je široko uporabljen algoritem zaradi dobre učinkovitosti in učinkovitosti virov ter visoke zanesljivosti kot prekomerna funkcija korekcije. Model je opremljen s 400 podpornimi kolesi. MLP je nevronska mreža, v kateri eden ali več perceptronov tvori več slojev z enim ali več skritimi plastmi med vhodnimi in izhodnimi plastmi38. S tem lahko izvedete nelinearno klasifikacijo, kadar ko dodate vhodno plast in dobite vrednost rezultata, se predvidena vrednost rezultata primerja z dejansko vrednostjo rezultatov in napaka se širi nazaj. Ustvarili smo skrito plast z 20 skritimi nevroni v vsaki plasti. Vsak model, ki smo ga razvili, je bil uporabljen za notranje in zunanje sklope za preizkušanje učinkovitosti klasifikacije z izračunom občutljivosti, specifičnosti, PPV, NPV in Auroc. Občutljivost je opredeljena kot razmerje med vzorcem, ki naj bi bil star 18 let ali več, do vzorca, ki naj bi bil star 18 let ali več. Specifičnost je delež vzorcev, mlajših od 18 let, in tistih, ki naj bi bili stari mlajši od 18 let.
Zobne faze, ocenjene v vadbenem nizu, so bile pretvorjene v številčne faze za statistično analizo. Izvedena je bila multivariatna linearna in logistična regresija za razvoj napovednih modelov za vsak spol in izpeljana regresijske formule, ki jih je mogoče uporabiti za oceno starosti. Te formule smo uporabili za oceno starosti zob za notranje in zunanje testne sklope. V tabeli 4 so prikazani modeli regresije in klasifikacije, uporabljeni v tej študiji.
Zanesljivost znotraj in interobserverja je bila izračunana z uporabo Cohenove statistike Kappa. Za preizkus natančnosti DM in tradicionalnih regresijskih modelov smo izračunali MAE in RMSE z uporabo ocenjenih in dejanskih starosti notranjega in zunanjega preskusnega niza. Te napake se običajno uporabljajo za oceno natančnosti napovedi modela. Manjša kot je napaka, večja je natančnost napovedi24. Primerjajte MAE in RMSE notranjih in zunanjih preskusnih nizov, izračunanih z uporabo DM in tradicionalne regresije. Učinkovitost klasifikacije 18-letnega preseka v tradicionalni statistiki je bila ocenjena z uporabo 2 × 2 tabele ob nepredvidljivih dogodkih. Izračunano občutljivost, specifičnost, PPV, NPV in AUROC preskusnega niza so primerjali z izmerjenimi vrednostmi modela klasifikacije DM. Podatki so izraženi kot povprečni ± standardni odklon ali število (%), odvisno od značilnosti podatkov. Dvostranske vrednosti P <0,05 so bile ocenjene za statistično pomembne. Vse rutinske statistične analize so bile izvedene z uporabo SAS različice 9.4 (SAS Institute, Cary, NC). Regresijski model DM je bil izveden v Pythonu z uporabo Keras50 2.2.4 Backend in Tensorflow51 1.8.0 posebej za matematične operacije. Model klasifikacije DM je bil izveden v okolju Analiza znanja Waikato in na platformi za analizo informacij o Konstancu (KNIME) 4.6.152.
Avtorji priznavajo, da so podatki, ki podpirajo zaključke študije, na voljo v članku in dodatnem gradivu. Nabor podatkov, ustvarjenih in/ali analiziranih med študijo, so na primerni avtor na voljo na razumni zahtevi.
Ritz-Timme, S. et al. Ocena starosti: najsodobnejša za izpolnitev posebnih zahtev forenzične prakse. International. J. Pravna medicina. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., in Olze, A. Trenutno stanje forenzične ocene živih subjektov za kazenske pregone. Forenzika. zdravilo. Patologija. 1, 239–246 (2005).
Pan, J. et al. Spremenjena metoda za oceno zobne starosti otrok, starih od 5 do 16 let, na vzhodni Kitajski. klinično. Ustna raziskava. 25, 3463–3474 (2021).
Lee, SS itd. Kronologija razvoja drugega in tretjega molarja v Korejcih in njegova uporaba za oceno forenzične starosti. International. J. Pravna medicina. 124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, Sy in Lee, SS Natančnost starosti in ocena 18-letnega praga, ki temelji na zrelosti drugega in tretjega molarja v Korejcih in Japoncih. PLoS One 17, E0271247 (2022).
Kim, Jy in sod. Predoperativna analiza podatkov, ki temelji na strojnem učenju, lahko napoveduje rezultat zdravljenja na spanju pri bolnikih z OSA. znanost. Poročilo 11, 14911 (2021).
Han, M. et al. Natančna ocena starosti iz strojnega učenja z ali brez človeškega intervencije? International. J. Pravna medicina. 136, 821–831 (2022).
Khan, S. in Shaheen, M. Od rudarjenja podatkov do rudarjenja podatkov. J.Informacije. znanost. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. in Shaheen, M. Wisrule: Prvi kognitivni algoritem za rudarjenje pravil združenja. J.Informacije. znanost. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. in Abdullah U. Karm: tradicionalno pridobivanje podatkov na podlagi pravil združenja, ki temeljijo na kontekstu. izračunati. Matt. nadaljujte. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. in Habib M. Zaznavanje semantičnih podobnosti, ki temeljijo na globokem učenju, z uporabo besedilnih podatkov. inform. tehnologije. nadzor. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. in Shahin, M. Sistem za prepoznavanje dejavnosti v športnih videoposnetkih. multimedija. Aplikacije orodij https://doi.org/10.1007/S11042-021-10519-6 (2021).
Halabi, SS et al. RSNA izziv za strojno učenje v starosti pediatrične kosti. Radiologija 290, 498–503 (2019).
Li, Y. et al. Ocena forenzične starosti z medeničnih rentgenskih žarkov z uporabo globokega učenja. Evro. sevanje. 29, 2322–2329 (2019).
Guo, YC in sod. Natančna razvrstitev starosti z ročnimi metodami in globokimi konvolucijskimi nevronskimi omrežji iz ortografskih projekcijskih slik. International. J. Pravna medicina. 135, 1589–1597 (2021).
Alabama Dalora in sod. Ocena starosti kosti z uporabo različnih metod strojnega učenja: sistematični pregled literature in metaanaliza. PLoS One 14, E0220242 (2019).
Du, H., Li, G., Cheng, K. in Yang, J. Ocenjevanje starosti Afroameričanov in Kitajcev, specifičnih za populacijo, na podlagi količine celuloze prvih molarjev z uporabo računalniške tomografije stožčastnega žaka. International. J. Pravna medicina. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK in OH KS, ki določajo starostne skupine živih ljudi, ki uporabljajo slike prvih molarjev na osnovi umetne inteligence. znanost. Poročilo 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N., in Urschler, M. Samodejna ocena starosti in večinsko razvrstitev starosti iz multivariatnih MRI podatkov. IEEE J. Biomed. Zdravstvena opozorila. 23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. in Li, G. Ocena starosti, ki temelji na segmentaciji 3D celulozne komore prvih molarjev iz računalniške tomografije Cone Beam z vključevanjem globokega učenja in nivojev. International. J. Pravna medicina. 135, 365–373 (2021).
Wu, WT in sod. Miniranje podatkov v kliničnih velikih podatkih: skupne baze podatkov, korakov in modelov metod. Svet. zdravilo. vir. 8, 44 (2021).
Yang, J. et al. Uvod v medicinske baze podatkov in tehnologije rudarjenja podatkov v obdobju velikih podatkov. J. AVID. Osnovno zdravilo. 13, 57–69 (2020).
Shen, S. et al. Camerejeva metoda za oceno starosti zob z uporabo strojnega učenja. BMC Oral Health 21, 641 (2021).
Galliburg A. et al. Primerjava različnih metod strojnega učenja za napovedovanje zobne starosti z uporabo metode Demirdjian Staging. International. J. Pravna medicina. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. in Tanner, JM Nov sistem za oceno zobne dobe. smrad. biologija. 45, 211–227 (1973).
Landis, Jr in Koch, GG Ukrepi opazovalca o kategoričnih podatkih. Biometrics 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK in Choi HK. Teksturalna, morfološka in statistična analiza dvodimenzionalnega slikanja z magnetno resonanco z uporabo tehnik umetne inteligence za diferenciacijo primarnih možganskih tumorjev. Zdravstvene informacije. vir. https://doi.org/10.4258/hir.2022.28.1.46 (2022).

Čas objave: januar-04-2024

Validacija modela rudarjenja podatkov v primerjavi s tradicionalnimi metodami ocenjevanja zob med korejskimi mladostniki in mladimi odraslimi