Úvod
v Poslední době, rostoucí počet studií, které byly zveřejněny v zájmu řešení fenoménu simulování a detekci malingered kognitivní příznaky. Řada vyšetřování(např. Sartori et al., 2016b; Walczyk et al., 2018) naznačují, že malingering se obvykle vyskytuje ve třech širokých doménách: psychopatologie, kognitivní porucha a zdravotní onemocnění., V souvislosti s kognitivní dysfunkcí, neuropsychologové a klinických psychologů se stále více spoléhal na výsledky z neuropsychologického hodnocení, informovat své názory, pokud jde o povahu, rozsah a důvěryhodnost, tvrdil, kognitivní postižení. Klinické a výzkumné úsilí vedlo k stále více sofistikované a účinné metody a nástroje určené pro detekci simulování, které jsou obvykle pozorovány ve většině medicínsko-právní windows., Existují důkazy, což naznačuje, že vnější motivaci malinger obvykle zahrnuje finanční odškodnění za zranění, což vede k fyzické postižení a/nebo kognitivní deficity. Čím rozsáhlejší je kognitivní dysfunkce, tím více se očekává peněžní kompenzace a jednotlivci mají významný motiv k simulaci nebo nadměrnému přehánění příznaků.
kriticky je většina kognitivních příznaků snadno zfalšována i naivními netrénovanými zkoušejícími za účelem dosažení ekonomické kompenzace., Z výše uvedených důvodu je nezbytné se spoléhat na psychometrické nástroje, aby bylo možné odlišit, na objektivním základě, zda neuropsychologické výsledky přesně odrážejí kognitivní dysfunkcí nebo zda se jednotlivci pokoušeli simulovat nebo over-zveličují své obtíže (Sartori et al., 2016b, 2017). Zatímco novější techniky se spoléhají na složité počítačové nástroje(např., 2016a), testy papíru a tužky (například test b zkoumaný zde) mají stále velké praktické výhody.,
Falešná závažná kognitivní porucha může být klinicky detekována porovnáním výsledků kognitivních testů s každodenními schopnostmi pacienta. Nepoškozený každodenní činnosti spárován s těžkým poškozením na kognitivní testy klepnutím na stejné funkce, je údaj o simulování. Nicméně, mírné kognitivní poruchy jsou obvykle doprovázena každodenní život postižením a simulantů může být obtížné detekovat pomocí jednoduchých strategií, spočívající v porovnávání kognitivní výsledky testů (velmi nízká) a denní činnosti (zachovalé)., Za účelem překonání tohoto omezení je možné se spolehnout na výsledky klinického výzkumu (Coin et al., 2009; Orrù et al., 2009).
jedna strategie používaná při neuropsychologickém testování pro detekci malingeringu je založena na použití jednoduchých testů. Jak uvádí Americké Akademie Klinické Neuropsychologie Konsenzuální Konference Prohlášení o neuropsychologické posouzení úsilí, odezva zkreslení a simulace (Heilbronner et al.,, 2009), tyto testy jsou obvykle dobře prováděny s minimálním úsilím pacientů trpících neurologickými a psychiatrickými chorobami, pokud neexistuje úmyslný záměr je provádět špatně. Většina testů platnosti výkonu (PVTs) používaných v nastavení hledání kompenzací je navržena tak, aby detekovala předstírané krátkodobé poruchy paměti (Boone et al., 2000; Sharland and gfeller, 2007; Young et al., 2016). Kromě toho existují také testy pro detekci simulovaných deficitů v různých kognitivních oblastech, například v nadučených informacích a rychlosti zpracování.,
jedním takovým testem je Test b (Boone et al., 2002). Skládá se z 15-stránkový booklet: každá stránka obsahuje 72 podněty včetně malé b (cíl podněty) a další symboly, které se používají jako distraktorů, jako písmena d, q, a p, a a b buď s diagonální nebo další stonky. Celkově je ve stimulační brožuře 255 cílových podnětů: 20 na první stránce, 16 ve druhé a 15 ve třetí. Tyto stránky se opakují pětkrát ve stále menším formátu., B Test vyžaduje, aby vyšetřovaná na kruhu b, které se objeví na každé stránce, jak rychle, jak je to možné; během úkolu, různých typů chyby mohou být spáchány: chyby, opomenutí (vynechání kruhu cílové podněty), d chyby (zakroužkováním d), a komise chyb (zakroužkováním symboly, které nejsou b, včetně d). Zkoušející bere na vědomí celkovou dobu odezvy, a to čas, který účastník potřebuje k dokončení testu., Celkové chyby a střední čas na stránku se používají k výpočtu skóre indexu intenzity (nebo E-skóre), které vyplývá z rovnice: (celkové chyby d + celkové chyby provize) × 10 + celkové chyby opomenutí + střední čas na stránku.
Test b posuzuje přeučené dovednosti a může být použit v lékařsko-právním prostředí. Pacienti s mozkovou dysfunkcí, kteří se snaží o test, pravděpodobně nebudou nesprávně klasifikováni jako nespolupracující. Pacienti s poruchou paměti nemusí při testu selhat, což může způsobit méně falešných pozitiv než test intenzity založený na paměti., Konečně, ohrožení b testování výkonnosti vzhledem k přítomnosti přestřelil příznaky a v nepřítomnosti zdokumentovány poruchami učení je velmi podezřelé, že simulování (Boone et al., 2002).
b Test může rozlišovat podezření simulanti z mnoha různých klinických skupin, včetně: depresivní poruchy, schizofrenie, středně závažné nebo závažné poranění hlavy, mrtvice, poruchy učení a zdravých starších osob (viz Boone et al., 2002).
Vilar-Lòpez et al., (2007) analyzoval vystoupení na b Test z španělského vzorku populace s pootřesový syndrom (KS) zapojeny do soudního sporu, a není sporu, že ukazujeme dobrou citlivost a specifičnost. Navíc v další studii (Vilar-Lòpez et al., 2008), stejní autoři analyzovali výkony pacientů s mírným traumatickým poraněním mozku., Účastníci byli rozděleni do tří skupin: první skupina nebyla zapojena do žádného odškodnění-hledání procesů, druhá skupina byla kompenzace-hledání skupiny, která není podezření ze simulování, třetí skupina zahrnovala pacienty, kteří hledají náhradu, kteří byli podezření ze simulování. Výsledky studie ukázaly, že existují statisticky významné rozdíly mezi skupinami a simulant versus non-simulant klasifikace. Podobně Marshall et al. (2010) zkoumali platnost testu b při detekci předstírané ADHD ve velkém vzorku (n = 257).,
navzdory slibným výsledkům Shandera et al. (2010) provedla studii o platnosti testu b u vzorku dospělé populace trpícího mírnou mentální retardací. Výsledky ukázaly neuspokojivé výsledky, když je třeba odlišit malingerery od tohoto klinického vzorku.
Vzhledem k tomuto výsledku, diagnosticity b Testu zůstává stále nejasné, rozlišovat mezi Mírné Neurokognitivní Poruchy a simulanti. Pokud je nám známo, pouze Dean et al. (2009) vyhodnotila specifičnost B testu n mírná demence s neuspokojivými výsledky.,
s cílem zkoumat potenciál b testování v klasifikaci originální kognitivní poruchou z předstíraný kognitivní deficity u starší populace, současné studie zkoumala b Test hodnoty v italské vzorku s Mírné Neurokognitivní Poruchy a u zdravých věkově starší jedinci, nařídil předstírat, kognitivní dysfunkce. Dále bylo naším cílem zhodnotit, zda klasifikátory strojového učení mohou mít za následek zvýšenou přesnost klasifikace ve srovnání s tradičnějším přístupem založeným na cut-off skóre.,
Materiály a Metody
Účastníci
Šedesát tři italsky mluvící účastníci byli přijati (36 mužů a 27 žen, průměrný věk: 73.43 ± 5.97 let, rozsah: 58-87; střední vzdělání: 7.03 ± 2.78 let, rozsah: 3-19). Vzorek se skládal ze tří skupin. První skupina se skládala z pacientů se smíšenými neurologické etiologie, které splňují kritéria Diagnostický a Statistický Manuál Duševních Poruch-5 (DSM-5) (APA, 2013) pro Mírné Neurokognitivní Poruchy (Skupina A, n = 21)., Tito pacienti byli diagnostikováni podle DSM-5 kritérií pro Mírné Neurokognitivní Poruchy odborník neurolog (RV) prostřednictvím anamnestické rozhovory, neurologické vyšetření, neuropsychologické vyšetření. Neuropsychologické hodnocení zahrnovalo: Mini vyšetření duševního stavu (MMSE, Folstein et al., 1975; mince et al., 2009) a čelní baterie (FAB, Dubois et al., 2000; Appollonio et al., 2005). Skupina A byla rekrutována z neurologické jednotky na severovýchodě Itálie.,
druhá skupina (n = 21, Skupina B) zdravých věkově jedinců, bylo nutné provést test bez zvláštních pokynů, zatímco třetí skupina (n = 21, Skupina C) zdravých věkově odpovídajícími kontrolami byl poučen reagovat lstivě k testu, jako kdyby byly kognitivně postižené.
zdravé kontroly a malingerers (skupina B a skupina C) byli rekrutováni ze dvou rekreačních center pro seniory.,
Mírné Neurokognitivní Poruchy
Účastníci S Mírné Neurokognitivní Poruchy
Zdravých Účastníků a Simulanti Kognitivní poruchy
Zdravé Účastníků
Čtyřicet dva zdravé účastníci byli přijati. Neměli v anamnéze neurologické nebo psychiatrické onemocnění nebo zneužívání návykových látek / alkoholu. MENTÁLNÍ korigovat skóre ≥ 26 a č. účastník získat odpovídající skóre < 2 na FAB. Všichni účastníci byli náhodně přiděleni jedné z následujících dvou skupin., Jedna skupina (Skupina B: zdravé kontroly) byla dána standardní instrukce pro b-Test (n = 21, 14 mužů a 7 žen), zatímco druhý (Skupina C: simulantů), obdržel instrukce, aby se předstírat, b Testu (n = 21, 8 mužů a 13 žen) s cílem falešné kognitivní poruchou. Konkrétně simulantů (Skupina C) byli poučeni, aby provádět MENTÁLNÍ a FAB, jak nejlépe, jak je to možné, a to pouze pro b Testu dostal pod předstírat pokyny (byli požádáni, aby simulovat přijetím strategií v souladu s jejich přesvědčení a společné znalosti o mírné kognitivní deficit).,
experimentální postupy
Test b byl podán po MMSE a FAB všem účastníkům. Těsně před experimentálním úkolem byli účastníci přiděleni skupině malingerers instruováni, aby lhali o svém kognitivním stavu. Pro zvýšení shody dostali účastníci následující scénář: „test byste měli dokončit, protože by byl proveden pacientem trpícím mírnou demencí nebo mírným kognitivním poškozením. Zejména předstírejte, že jsem členem komise, která potvrzuje zdravotní postižení; měli byste mě přesvědčit, že máte nárok na platby v invaliditě.,“Po dokončení testu, simulanti skupiny byl také ptal takto: „Popište strategii použít a vysvětlit důvod, proč jste si vybrali to.“
pacienti a zdravé kontroly byly povinny provádět všechny testy s maximálním úsilím.
Analýza dat
Data byla analyzována pomocí neparametrické statistické analýzy. Kromě toho, za účelem hodnocení klasifikace přesnosti b testování a zabránilo overfitting, jsme ve velké míře používají leave-one-out cross validation (LOOCV) postup (Cawley a Talbot, 2010)., Overfitting je přehnané optimistické přizpůsobení datům odvozeným od testování modelu na stejné datové sadě používané pro vývoj samotného modelu. V zájmu dosažení realistický odhad klasifikační chyby (simulantů vs. pacientů), overfitting je třeba se vyhnout. Overfitting je abnormální model kování, které je obvykle počítadlo pomocí odhadu přesnosti out-of-vzorku (metoda hold-out), které se používají jako proxy přesnosti v terénu. Takové odhady přesnosti mimo vzorek vyžadují velké vzorky, které je obtížné sbírat s klinickými populacemi., Bylo prokázáno, že křížová validace n-fold je dobrým postupem pro odhad skutečné přesnosti u malých vzorků. Speciální případ n-fold cross validace je LOOCV (Cawley a Talbot, 2010), metoda volby v klinických studiích (Orrù et al., 2012). V LOOCV je statistický model vyvíjen pouze pomocí příkladů n − 1 a testován na zbývajícím příkladu. Postup se opakuje systematickým otáčením vynechaného příkladu a chyba klasifikace mimo vzorek je odvozena od průměrné chyby modelů n – 1., Z tohoto důvodu jsme použili LOOCV za účelem odvození kříž ověřené diskriminace čísla mezi simulantů a pacientů.
nedávno bylo prokázáno, že psychometrické testování může být rozšířeno pomocí technik strojového učení (ML) (James et al., 2013). ML již byl použit k vývoji vysoce výkonných klasifikačních modelů zaměřených na detekci malingerers (Monaro et al., 2018a, b).
analýza dat byla provedena pomocí SPSS a Weka 3.8 (Hall et al., 2009).,
výsledky
Neparametrická Statistická analýza
prostředky a standardní odchylky pro věk, vzdělání a výsledky testů jsou uvedeny v tabulce 1. Protože ne všechny výsledky testů byly obvykle rozděleny do skupin, byla vypočítána neparametrická srovnání skupin (Kruskal-Wallis ANOVAs). Skupiny se významně nelišily ve věku, a o roky vzdělávání, ale oni se liší v MENTÁLNÍ a FAB skóre, se Skupinou bodování výrazně horší než Skupina B (zdravé kontroly) a C (simulantů) na MENTÁLNÍ a FAB.,
Tabulka 1. Demografické charakteristiky a výkon na B testu pro každou skupinu účastníků a Kruskal-Wallis ANOVAs.
jak je znázorněno, skupiny se výrazně lišily ve všech B testech. Tabulka 2 uvádí výsledky testů Mann-Whitney U použitých v párových srovnáních na zkušebních datech b(hodnoty bonferroni korigované významností byly stanoveny na 0,02)., Malingerers (skupina C) udělali více chyb Komise (včetně chyb d) a chyb vynechání a získali výrazně vyšší skóre E než kontroly a pacienti (skupina B A A). Zdravé kontroly také významně překonaly pacienty v těchto skóre. Skupina srovnání na odezvy byly také významné, s ovládacími prvky dokončení testu výrazně rychleji, než simulanti a pacientů, kteří neměli výrazně liší od sebe navzájem.
Tabulka 2., Mann-Whitney U srovnání mezi skupinami na B skóre testu.
Chyba vzory odhalila, že u pacientů a kontrol udělal další chyby, opomenutí, než komise chyb (včetně d chyby), zatímco simulanti z více komisí chyby obecně, následuje opomenutí, chyby a d chyb.
Přesnost Klasifikace Mezi Pacienty a Simulanti
Při použití b Test v medicínsko-právní prostředí, nejvíce zajímavé, je srovnání mezi simulantů a pacientů., Vzhledem k tomu, že v medicínsko-právní prostředí, jedinec je simulování náchylný, cílem je zjistit, zda vyšetřovaný je skutečný patologický případ, nebo simulant. Z tohoto důvodu, je maximální zájem je efektivně rozlišovací (v našem experimentu) pacientů z simulantů pouze na základě b výsledky Testu. Práh skóre, které klasifikovat správně 90% pacientů pro každé opatření (opomenutí, chyby, d chyby, komise chyby, doba odezvy, a E-skóre spolu s AUC) mělo za následek vysokou přesnost klasifikace (viz Tabulka 3)., Například, pokud jde o opomenutí, chyby, cut-off >56 klasifikovány 90% pacientů (Skupina A) a 90.4% simulantů (Skupina C) správně.
Tabulka 3. B testovací skóre cut – off s přidruženou citlivostí a specifičností s cílem diskriminovat pacienty ze simulátorů.
Tento výsledek však může trpět overfitting., Jak bylo uvedeno výše, abychom mohli vyhodnotit účinnost testu b a vyhnout se nadměrnému testování, Testovali jsme různé modely strojového učení pomocí postupu LOOCV.
prediktory používané při vývoji modelu strojového učení byly následující: věk, vzdělání, pohlaví, chyby d, chyby Komise, chyby opomenutí, celkové RT (sec), E-skóre. Byla použita metoda křížové validace (LOOCV) (např. vapnik a Chapelle, 2000). Taková technika ponechává jeden jediný případ z výcvikového vzorku používaného k vývoji modelu., Po vývoji modelu je jeho přesnost testována (mimo vzorek)v tomto držáku. Proces se opakuje pro všechny případy ve vzorku (při porovnávání pacientů a malingerů, 42-1). Chyba je pak zprůměrována v průběhu výpočtů 42-1 a tato průměrná chyba je odhadem chyby mimo vzorek. LOOCV je metoda volby, když je k dispozici malý počet případů, například v neuroimagingových studiích (Orrù et al., 2012).,
devět funkcí uvedených výše byly zadány v různých strojového učení klasifikátorů, které byli vyškoleni, aby klasifikovat každý předmět jako patřící do jedné ze dvou kategorií zájmu (pacientů a simulanti). Zejména, jsme vybrali následující klasifikátory jako zástupce různých kategorií klasifikátory: Naivní Bayes, Logistická Regrese, Jednoduché Logistické regrese, Support Vector Machine, a Náhodný Les (WEKA Manuál pro Verzi 3-7-8, Bouckaert et al., 2013). Výsledky mezi různými klasifikátory jsou uvedeny v tabulce 4.,
Tabulka 4. Přesnost měřených % správné, plocha pod křivkou (AUC) a F1 získaných pěti různými ML klasifikátory v leave-one-out cross validation.
Všechny klasifikátory založené na různých předpokladech a zástupce různých tříd klasifikátorů přineslo podobné přesné výsledky s podobnými údaje jak pro falešně pozitivní a falešně negativní chyby.
výsledky uvedené v tabulce 5 odkazují na srovnání mezi pacienty a simulátory.,
Tabulka 5. Srovnání mezi pacienty a malingery, správně identifikované každým klasifikátorem.
a Konečně, Random Forest multiclass klasifikátor, který klasifikuje předměty, ale ve třech třídách (pacienty od zdravých kontrol, a simulantů) a ne ve dvou kategoriích, jak je uvedeno v Tabulkách 4, 5 přineslo následující výsledky: (1) celková přesnost = 79.4; (2) AUC = 0.87; (3) F1 = 0.8., Pacienti správně klasifikovány jako výše uvedené, byly 17/21, zdravé kontroly byly 15/21, a simulanti byli 18/21.
všechny výše uvedené ML modely jsou neprůhledné a základní logika, která poskytuje konečnou klasifikaci, není přímočará., Aby bylo možné mít více jasnou představu o klasifikaci logiky, jsme se spustit stromu modelu ML, který vybere optimální rozhodovací pravidlo, které maximalizuje přesnost klasifikace, J48 (Quinlan, 1993), který přinesl následující optimální rozhodovací pravidlo:
v případě opomenutí chyby jsou < = 78, pak předmět je klasifikován jako pacient s přesností rovnající se 95.,2%;
a
v případě opomenutí chyby jsou > 78, pak předmět je zařazen simulátoru s přesností rovnající se 86%.
uvedené rozhodnutí zásadě není nejlepší klasifikátor ale dává snadný způsob, jak pochopit pravidla, což má za následek vysokou přesnost při klasifikaci pacientů a simulanti., Jako původně indikována Boone (2000), opomenutí, chyby jsou ty, které jsou více přispívá správně rozlišovat simulátory od pacientů a také tento výzkum ukazuje, že optimální klasifikace by mohl být založen na pravidlo, které je založeno na počtu opomenutí.
kromě toho, související analýzy byl použit pro zvýraznění, který z prediktorů maximálně přispívá k správné zařazení pacientů vs. simulátory. Výsledky byly následující: vynechání = 0,81; Komise = 0,66; E-skóre = 0,66; d chyby = 0,56., Random Forest také umožňuje třídit význam prediktorů v přispívání k přesné klasifikaci a význam prediktorů byl podobný vyplývající ze související analýzy je uvedeno výše s maximální přínos pro klasifikaci pocházející z opomenutí a komise chyb a E-skóre.,
Diskuse
i když klinické a výzkumné úsilí vedlo k stále sofistikovanější metody a přinesly slibné výsledky pro detekci simulování, stále existují významné teoretické a praktické problémy v detekci simulování, a to zejména u starší populace s Mírné Neurokognitivní Poruchy. Předstíral těžká kognitivní porucha může být detekována klinicky porovnáním nízké skóre na kognitivní výsledky testů a neznehodnocené fungování odvozené od každodenního života., Ve skutečnosti, neznehodnocené každodenní činnosti spárován s těžkým poškozením na kognitivní testy klepnutím na stejné funkce jsou orientační simulace. Nicméně, Mírné Neurokognitivní Poruchy jsou obvykle doprovázena každodenní život postižením a simulantů může být obtížné detekovat pomocí jednoduchých strategií, spočívající v porovnávání kognitivní výsledky testů (velmi nízká) a denní činnosti (zachovalé).
existuje řada strategií, které identifikují malingerery kognitivních deficitů., Například, Lékařské Příznakem Platnosti Testu (MSVT) je široce používaný test paměti s tři vestavěné úsilí opatření, které mají za cíl odhalit předstírání (Green, 2004; Dandachi-FitzGerald a Merckelbach, 2013). K MSVT dosáhl působivě vysokou mírou citlivosti a specifičnosti v experimentálních studiích, které mají ve srovnání kontroly s simulantů nařídil předstírat problémy s pamětí (Merten et al., 2005).
Test b patří do stejné třídy testů, tzv.,, Rey 15, Reznek, 2005), což jsou testy, které jsou velmi snadné i pro vysoce kognitivně postižené.
abychom mohli vyhodnotit, zda Test b může pomoci při identifikaci tohoto typu malingererů, podali jsme Test b skupině pacientů s mírnou neurokognitivní poruchou. Tato skupina byla ve srovnání se zdravými kontrolami pokyn reagovat lstivě na zkoušky (uměle vyrábět podobné modely kognitivní poruchy) a skupiny zdravých kontrol pokyn reagovat pravdivě k testu.,
hlavní výsledky ukazují, že malingerers skóroval více špatně než kontroly a pacienti na testu b, na všech parametrech odvozených z testu s výjimkou celkové doby odezvy. Zejména pacienti a kontroly dělali více chyb opomenutí než chyby Komise, včetně chyb d, zatímco malingerers dělali neúměrně více chyb Komise, následované chybami opomenutí a chybami d. Tato zjištění úzce odrážejí strategie pro předstírání, jak ústně uvádějí malingerers., Ve skutečnosti, polovina z nich uvedla, že oni dělali náhodné opomenutí a komise chyb, zatímco přibližně čtvrtina z nich uvedla, že se pokusili kruhu všechny cíle, které nebyly b. Polovina simulantů také hlásil, že oni úmyslně zpomalil jejich doba odezvy. Proto, simulanti mohou být odlišeny od pravdomluvných na základě jejich chyba vzory, které je radikálně odlišné od těch, ukázal pacientů. Naproti tomu pacienti a zdravé kontroly mají podobný vzorec odpovědí a chyb., Při kontrolách významně lepší než u pacientů na všech chyb skóre, obě skupiny se zobrazí více chyb, opomenutí, než komise, zatímco, jak je uvedeno výše, simulanti zobrazí opak vzor.
údaje uvedené v naší studii jsou v souladu s původními validačními experimenty od Boone et al. (2002), který dokumentoval, že to bylo velmi neobvyklé pro originální pacientů s depresí, mrtvice, traumatické poškození mozku, schizofrenie, poruchy učení a pokročilého věku, aby misidentify non-b jako b., Údaje ze současné studie rozšiřují toto pozorování na starší pacienty s mírnou demencí.
pacienti v našem experimentu provedli Test b mnohem pomaleji než Boone et al. (2002) pacienti (včetně většinou psychiatrických pacientů). Tato zjištění jsou v souladu s pozorováními, že kognitivní zpomalení je prominentní U časné demence (McGuinness et al., 2010) a naznačují, že doba odezvy má velmi omezenou hodnotu při diferenciaci skutečné versus předstírané mírné demence. Naopak, chyby na nadměrně naučených informačních úkolech se zdají být mnohem efektivnější., Povaha neurologické poruchy spojené s mírnou kognitivní poruchou může vysvětlit důvod, proč indexy založené na čase jsou zvláště užitečné při odhalování simulantů.
v naší studii malingerers úmyslně zpomalují svůj výkon. Nicméně, snížená rychlost odezvy je také funkce většiny neurologických onemocnění, a to může být důvod, proč se indexy založené na načasování nemusí být schopen efektivně rozlišovat mezi simulantů a pacientů.,
kromě standardní statistické analýzy, jejíž výsledky byly shrnuty výše, jsme použili pokročilejší analýzu založenou na ml technikách. Máme také hlášeny přesnost klasifikace na základě K-fold Cross Validace (konkrétně leave-one-out cross validation, LOOCV; obvykle považován za nejlepší technika pro zpracování těchto problémů v malé vzorky) aby získali nestranné odhady out-of-sample přesnost., Tato analýza naznačila, že simulanti mohou být odlišeny od pacientů výhradně na b Test výkonu s celkovou přesností 90% nebo více (maximální přesnost s Jednoduchou Logistickou klasifikátor). Podobné výsledky vykazovaly různé typy modelů strojového učení. Zatímco někteří klasifikátoři mají velmi složitá rozhodovací pravidla (např. náhodný Les), jiní mohou být pro klinika intuitivnější., Například, optimální rozhodovací strom přineslo následující rozhodovací pravidlo:
v případě opomenutí chyby jsou < = 78, pak předmět je klasifikován jako pacient s přesností rovnající se 95.2%;
a
pokud > 78 je simulátor s přesností rovnající se 86%.
navzdory nižší vzdělávací úrovni (M = 6.7, SD = 2.2), střední doba odezvy zdravých kontrol (M = 634.76, SD= 236.23) a chyby Komise (M = 1.28, SD=2.,75) byly podobné těm, které uvádí Boone et al. (2002). Starší kontroly (úroveň vzdělání = 15,2 let; průměrná doba odezvy = 10,8 min; průměrné chyby provize = 1,0). Ovládací prvky v aktuálním studiu opominutím dopustil více chyb, než v Boone a kolegů vzorku (průměr opomenutí, chyby: 18.0 versus 8.0). Tato zjištění naznačují, že se zdá, že vzdělání má malý dopad na výkon testu b, což naznačuje, že Test b je relativně neovlivněn úrovní vzdělání zkoušejícího.,
omezení aktuální studie zahrnuje použití pokyn simulantů (také volal experimentální simulantů). Pokyn simulantů obecně produkují zvýšené citlivosti sazby, protože mají tendenci předstírat více nadměrně než jejich „reálném světě“ protějšky (Boone et al., 2005). Navíc, v současné studii, simulanti byli instruováni, aby předstírat nemoc, která splňuje podmínky pro kompenzaci postižení, takže účastníci mohou mít pokus o další over-exaggerate kognitivní poruchy., Míra citlivosti v naší studii proto vyžaduje budoucí replikaci v lékařsko-právním prostředí pomocí účastníků, kteří jsou spontánně motivováni k falešným, spíše než instruováni, aby předstírali kognitivní poruchy.
dostupnost dat
datový soubor používaný a analyzovaný během současné studie je k dispozici od příslušného autora na základě přiměřené žádosti.
etické prohlášení
Etická komise pro klinické studie provincií Belluno a Treviso (Itálie) schválila experimentální postup., Všechny subjekty poskytly písemný informovaný souhlas v souladu s prohlášením o Helsinkách.
autorské příspěvky
GS a FG koncipovaly experiment. GP, RV, a GS navrhl experimentální úkol. GP přispěl k získávání dat zdravých subjektů. RV a GP přispěly k získávání dat zdravých pacientů. GO a AG přispěly k analýze dat. GO a KB přispěly k interpretaci dat. GP, GS, KB a GO vypracoval rukopis. Všichni autoři kriticky revidovali rukopis a dali konečný souhlas s publikováním verze.,
Prohlášení o střetu zájmů
autoři prohlašují, že výzkum byl proveden bez jakýchkoli obchodních nebo finančních vztahů, které by mohly být chápány jako potenciální střet zájmů.
Americká psychiatrická asociace (2013). DSM-5: Diagnostický a statistický manuál duševních poruch. (Washington, DC: American Psychiatric Association), 5.
Google Scholar
Boone, k., Lu, P. a Herzberg, D. S. (2002). Zkušební příručka b. Los Angeles: Západní Psychologická Služba.
Google Scholar
Green, P., (2004). Green ‚ s medical symptom validity test (MSVT) pro Microsoft Windows: uživatelská příručka. Edmonton, Kanada: Green ‚ s Publishing.
Google Scholar