はじめに
最近、malingeringの現象とmalingered認知症状の検出に対処するための研究が増 多くの調査(例えば、Sartori et al.,2016b;Walczyk et al.,2018)は、マリンガリングは、典型的には精神病理学、認知障害、および医学的疾患の三つの広い領域で起こることを示している。, 認知機能不全の文脈では、神経心理学者および臨床心理学者は、主張された認知障害の性質、程度、および信頼性に関する意見を知らせるために、神経心理学的評価の結果にますます依存している。 臨床および研究の努力は、通常、ほとんどの医学的法的設定で観察されるmalingeringを検出するように設計されたますます洗練された効果的な方法および, 証拠は、マリンジャーへの外部インセンティブは、典型的には、身体障害および/または認知障害をもたらす傷害のための財政的補償を含むことを示唆 認知機能障害がより広範に表示されるほど、より多くの金銭的補償が期待され、個人は症状をシミュレートまたは過度に誇張する重要な動機を有する。
批判的には、認知症状のほとんどは、経済的補償を達成するために、指導されていない素朴な被験者によってさえも容易に偽造されています。, 上記の理由から、神経心理学的検査のスコアが認知機能不全を正確に反映しているかどうか、または個人が困難をシミュレートしようとしたかどうかを客観的に区別するためには、心理測定ツールに依存することが重要である(Sartori et al.、2016b、2017)。 より最近の技術は複雑なコンピュータベースのツールに依存しているが(例えば、Sartori et al.、2016a)、紙と鉛筆のテスト(ここで調査されたbテストなど)はまだ大きな実用的な利点を持っています。,
偽の重度の認知障害は、認知テスト結果を患者の日常の能力と比較することによって臨床的に検出することができる。 認知テストで重度の障害と対になっていない日常生活活動は、同じ機能をタップすることは、malingeringの指標です。 しかし、軽度の認知障害は通常、日常生活障害を伴わず、認知テスト結果(非常に低い)と日常活動(保存されている)を比較する単純な戦略を用いて、malingerersを検出することは困難である可能性がある。, この制限を克服するために、臨床研究によって提供されるアウトカムに依存することが可能である(Coin et al.,2009;Orr†et al., 2009).
malingeringを検出するための神経心理学的検査で使用される一つの戦略は、単純なテストの使用に基づいています。 American Academy of Clinical Neuropsychology Consensus Conference Statement on the neuropsychological assessment of effort,response bias and malingeringによって報告されているように(Heilbronner et al.,,2009)、これらの検査は、通常、神経疾患および精神疾患に罹患している患者によって最小限の労力で十分に行われるが、それらを不十分に行う意図的な意 補償シーク設定で使用されるほとんどの性能validity validity性試験(Pvt)は、偽りの短期記憶障害を検出するように設計されている(Boone et al.,2000;Sharland and Gfeller,2007;Young et al., 2016). さらに、過度に学習された情報や処理速度など、さまざまな認知領域におけるシミュレートされた欠陥を検出するためのテストもあります。,そのようなテストの一つがbテストである(Boone et al., 2002). それは15ページの小冊子で構成されています:各ページには、小文字のb(ターゲット刺激)と、小文字のd、q、pなどの気晴らしとして使用される他の記号を含む72の刺激が含まれており、斜めまたは余分な茎を持つbのいずれかが含まれています。 全体的に、刺激ブックレットには255のターゲット刺激があります:最初のページに20、第二に16、および第三に15。 これらのページを繰り返し回は、ますます小型化する形式です。, Bテストでは、被験者は各ページに表示されるすべてのbをできるだけ早く丸で囲む必要があります。 審査官は、総応答時間、すなわち参加者がテストを完了するために必要とする時間に注意します。, 合計エラーとページあたりの平均時間は、(合計dエラー+合計手数料エラー)×10+合計漏れエラー+ページあたりの平均時間から得られる努力指数スコア(またはEスコア)を計算するために使用されます。
bテストは、過度に学んだスキルを評価し、メディコ-リーガルの設定で適用することができます。 テストで努力をする大脳の機能障害の患者は非協力的として誤って分類されてまずないです。 記憶障害を有する患者は、テストで失敗することはなく、これは記憶ベースの努力テストよりも少ない偽陽性を生成する可能性がある。, 最後に、過剰な症状の存在および文書化された学習障害の不在によるb試験の性能の低下は、malingeringの非常に疑わしい(Boone et al., 2002).b試験は、大うつ病性障害、統合失調症、中等度または重度の頭部外傷、脳卒中、学習障害、および健康な高齢者を含む多くの異なる臨床群と疑われるmalingerersを区別することができる(Boone et al., 2002).
Vilar-Lúpez et al., (2007)は、訴訟に関与し、良好な感度と特異性を示す訴訟に関与していないポスト脳震盪症候群(PCS)とスペインの人口サンプルのbテストのパフォーマンス さらに、追加の研究において(Vilar-Lβpez et al.、2008)、同じ著者は、軽度の外傷性脳損傷を有する患者のパフォーマンスを分析した。, 参加者は三つのグループに分けられた:第一のグループは、任意の補償求めるプロセスに関与していなかった、第二のグループは、malingeringの疑いのない補償求めるグループであった、第三のグループは、malingering 研究の結果は、グループとmalingerer対非malingerer分類の間に統計的に有意な差があることを示しました。 同様に、Marshar et al. (2010)は、大きなサンプル(n=257)で偽りADHDを検出する際のbテストの妥当性を調査しました。,
有望な結果にもかかわらず、Shandera et al. (2010)は、軽度の精神遅滞に苦しんでいる成人集団サンプルにおけるbテストの妥当性に関する研究を実施した。 結果はmalingerersがこの臨床サンプルと区別されるように要求するとき不満足な結果を示しました。
この結果を考えると、Bテストの診断性は、軽度の神経認知障害とmalingerersを区別する上で、まだ不明のままである。 私たちの知る限りでは、Dean et al. (2009)は、bテストn軽度の認知症の特異性を評価し、不十分な結果をもたらした。,
高齢者の偽認知障害から本物の認知障害を分類する際にbテストの可能性を調べるために、本研究では、軽度の神経認知障害を有するイタリアのサンプルおよび認知機能不全を偽装するように指示された健康な年齢マッチした高齢者におけるbテスト値を調査した。 さらに、カットオフスコアに基づく従来のアプローチと比較して、機械学習分類器が分類精度を向上させるかどうかを評価することを目的としました。,
材料と方法
参加者
六十から三イタリア語を話す参加者が募集されました(36男性と27女性、平均年齢:73.43±5.97年、範囲:58-87;平均教育:7.03±2.78年、範囲:3-19)。 試料は三つのグループからなった。 最初のグループは、軽度の神経認知障害(グループa;n=21)の精神障害の診断および統計マニュアル-5(DSM-5)(APA、2013)の基準を満たす混合神経学的病因を有する患者, これらの患者は、既往のインタビュー、神経学的検査、および神経心理学的検査を通じて、専門家の神経科医(RV)によって軽度の神経認知障害のDSM-5基準に 神経心理学的評価には以下が含まれる:ミニ精神状態検査(MMSE,Folstein et al.,1975;Coin et al.,2009)および前面評価バッテリー(FAB,Dubois et al.,2000;Appollonio et al., 2005). グループAは、イタリアの北東にある神経学ユニットから募集されました。,
健康な年齢マッチした個人の第二のグループ(n=21、グループB)は、特定の指示なしにテストを完了する必要がありましたが、健康な年齢マッチしたコントロールの第三のグループ(n=21、グループC)は、彼らが認知的に障害されているかのようにテストに偽って応答するように指示されました。
健康なコントロールとmalingerers(グループBとグループC)は、高齢者のための二つのレクリエーションセンターから募集されました。,
軽度の神経認知障害
軽度の神経認知障害を有する参加者
健康な参加者および認知障害のMalingerers
健康な参加者
四十から二 彼らは神経学的または精神医学的疾患または物質/アルコール乱用の病歴はなかった。 MMSE補正スコアは≥26であり、参加者はfab上で同等のスコア<2を取得しませんでした。 すべての参加者をランダムに割り当てで、かつ以下のいずれかの内容である。, 一つのグループ(グループB:健康なコントロール)は、bテスト(n=21、14人の男性と7人の女性)のための標準的な指示を与えられ、もう一つのグループ(グループC:malingerers)は、認知障害を偽るためにbテスト(n=21、8人の男性と13人の女性)を偽るように指示を受けた。 具体的には、malingerers(グループC)はできるだけ最高のMMSEとFABを実行するように指示され、bテストのためにのみ偽の指示を受けました(彼らは彼らの信念と軽度認知欠損についての共通の知識に従って戦略を採用することによってシミュレートするように求められました)。,
実験手順
Bテストは、MMSEおよびFABの後にすべての参加者に投与した。 実験タスクの直前に、malingerersグループに割り当てられた参加者は、認知状態について嘘をつくように指示されました。 コンプライアンスを高めるために、参加者には次のシナリオが与えられました:”軽度の認知症または軽度の認知障害に苦しむ患者が行うように、テストを完了する必要があります。 特に、私が障害を証明する委員会のメンバーであることをふりをする;あなたは障害の支払いの対象となることを私に納得させる必要があります。,”テストが完了した後、malingerersグループも次のように質問されました:”使用された戦略を説明し、あなたがそれを選択した理由を説明してください。”
患者と健康なコントロールは、最大限の努力ですべてのテストを実行する必要がありました。
データ分析
ノンパラメトリック統計分析を用いてデータを分析した。 さらに、b検定の分類精度を評価し、オーバーフィットを避けるために、leave-one-out cross validation(LOOCV)手順を広く使用しました(Cawley and Talbot、2010)。, Overfittingは誇張した楽観的なフィッティングされたデータからの試験のモデルと同じデータセット利用の発展のためのモデルそのものです。 分類誤差(malingerers対患者)の現実的な推定を達成するためには、過剰適合は避けるべきである。 オーバーフィッティングは、通常、現場の精度のプロキシとして使用されるサンプル外精度推定(ホールドアウト法)を使用してカウンターされる異常なモデルフィッティングです。 このようなサンプル外精度推定は、臨床集団で収集することが困難な大きなサンプルを必要とする。, N倍交差検証は小さな試料における真の精度を推定するための良い手順であることを示した。 N倍交差検証の特別なケースは、臨床研究において選択される方法であるLOOCV(Cawley and Talbot,2010)である(Orrβ et al., 2012). LOOCVでは、統計モデルはn−1の例のみを使用して開発され、残りの例でテストされます。 この手順は、左の例を体系的に回転させて繰り返され、サンプル外分類誤差は、n-1モデルの平均誤差から導出されます。, このため、LOOCVを使用して、malingerersと患者間の交差検証された識別数値を導出しました。最近、心理測定テストは、より伝統的な統計的手法に加えて、機械学習(ML)技術を使用することによって増強され得ることが示されている(James et al., 2013). MLは、malingerersを検出することを目的とした高性能分類モデルを開発するためにすでに使用されている(Monaro et al.、2018年8月、b)。
データ分析は、SPSSおよびWeka3.8を用いて行われている(Hall et al., 2009).,
結果
ノンパラメトリック統計分析
年齢、教育、およびテストスコアの平均および標準偏差を表1に報告する。 すべてのテストスコアがグループ間で正規分布しているわけではないため、ノンパラメトリックグループ比較(Kruskal-Wallis ANOVAs)が計算されました。 グループは年齢と教育年数に有意差はなかったが、MMSEとFABのスコアは異なり、グループAはMMSEとFABのグループB(健康なコントロール)とC(malingerers)よりも有意に悪かった。,
テーブル1. 参加者とKruskal-Wallis ANOVAsの各グループのためのbテストの人口統計学的特性とパフォーマンス。
示されているように、グループはすべてのbテストスコアで有意に異なっていました。 表2は、B検定データに対するペアワイズ比較で使用されたMann-Whitney U検定の分析の結果を報告します(Bonferroni補正された有意水準は0.02に設定されています)。, Malingerers(グループC)は、より多くの手数料エラー(dエラーを含む)と省略エラーを作り、コントロールと患者(グループBとa、それぞれ)よりも有意に高いEスコアを得た。 健康な対照はまたかなりこれらのスコアの患者に優っていました。 応答時間に関するグループ比較も有意であり、対照は互いに有意に異ならなかったmalingerersおよび患者よりも有意に迅速に試験を完了した。
テーブル2., Bテストの得点に関するグループ間のマン-ホイットニーuの比較。
エラーパターンは、患者およびコントロールが手数料エラー(dエラーを含む)よりも多くの省略エラーを犯したことを明らかにしたが、malingerersは一般的により多くの手数料エラーを犯し、省略エラーおよびdエラーが続くことを明らかにした。
患者とMalingerers間の分類精度
メディコ法的設定でbテストを適用する際に、最も興味深いのは、malingerersと患者との比較です。, 医療法的設定では、個人がmalingering傾向があることを考えると、目的は、被験者が本当の病理学的症例であるかmalingererであるかを識別することです。 このため、最大の関心は、bテスト結果に基づいて、(私たちの実験で)患者をmalingerersから効率的に区別することです。 各尺度について患者の90%を正しく分類するしきい値スコア(省略エラー、dエラー、手数料エラー、応答時間、およびAUCとともにEスコア)は、高い分類精度をもたらした(表3参照)。, 例えば、省略エラーに関しては、カットオフ>56は、患者の90%(グループA)およびmalingerers(グループC)の90.4%を正しく分類した。
テーブル3. bテストは、シミュレータから患者を区別するために、関連する感度および特異性を有するカットオフを得点する。
ただし、この結果はオーバーフィッティングに苦しむ可能性があります。, 上記で報告したように、b検定の有効性を評価し、過剰適合を避けるために、LOOCV手順を使用して異なる機械学習モデルをテストしました。
機械学習モデルの開発に使用された予測変数は、年齢、教育、性別、dエラー、手数料エラー、省略エラー、総RT(秒)、Eスコアでした。 Leave-one-out交差検証(LOOCV)(例えば、VapnikおよびChapelle、2000)技術を使用した。 する技術が一つのシングルの場合のサンプルトレーニング開発に利用されてきました。モデルです。, モデルが開発された後、正確さはこの保持の主題で(サンプルから)テストされる。 このプロセスは、サンプル中のすべての症例について繰り返される(患者とmalingersを比較する場合、42-1)。 その後、誤差は42-1の計算で平均化され、この平均誤差はサンプル外誤差の推定です。 LOOCVは、少数の症例が、例えば、神経画像研究(Orrβ et al., 2012).,
上記の九つの特徴は、関心の二つのカテゴリ(患者とmalingerers)のいずれかに属するものとして、すべての被験者を分類するように訓練された異なる機械学 特に、ナイーブベイズ、ロジスティック回帰、単純ロジスティック回帰サポートベクターマシン、およびランダムフォレスト(Weka Manual for Version3-7-8,Bouckaert et al., 2013). 異なる分類器間の結果を表4に報告する。,
テーブル4. 正確さは、leave-one-out交差検証で五つの異なるML分類器によって得られた%correct、曲線下面積(AUC)およびF1によって測定されます。
異なる仮定および異なるクラスの分類器の代表に基づくすべての分類器は、偽陽性および偽陰性エラーの両方について同様の数値で同様の正確な結果をもたらした。
表5に報告されている結果は、患者とシミュレータとの比較を参照しています。,
テーブル5. 各分類器によって正しく識別される患者とmalingerers間の比較。
最後に、表4、5で報告されているように、被験者を分類するランダムフォレストマルチクラス分類器は、(1)全体の精度=79.4;(2)AUC=0.87;(3)F1=0.8の結果をもたらした。, 前述のように正しく分類された患者は17/21であり、健康な対照は15/21であり、malingerersは18/21であった。
上記で報告されたすべてのMLモデルは不透明であり、最終的な分類をもたらす基礎となるロジックは簡単ではありません。, 分類ロジックをより明確に理解するために、分類精度を最大化する最適な決定ルール、J48(Quinlan,1993)を選択するツリーモデルMLを実行し、
省略エラーが<=78の場合、被験者は95に等しい精度の患者として分類される。,2%;
および
省略エラーが>78の場合、被験者は86%に等しい精度でシミュレータに分類されます。
上記の決定原則は最良の分類子ではありませんが、ルールを理解する簡単な方法を提供し、患者とmalingerersを分類する際に高精度になります。, もともとBoone(2000)によって示されているように、省略エラーは、シミュレータと患者を正しく区別する上でより寄与しているものであり、この研究は、最適な分類
さらに、相関分析を使用して、どの予測因子が患者対シミュレータの正しい分類に最大限寄与するかを強調している。 結果は以下の通りであった:省略=0.81;委員会=0.66;Eスコア=0.66;dエラー=0.56。, ランダムフォレストはまた、正確な分類に寄与する予測変数の重要性をソートすることを可能にし、予測変数の重要性は、省略およびコミッションエラーおよびEスコアから来る分類への最大の寄与と上記で報告された相関分析から生じるものと同様であった。,
Discussion
臨床および研究の努力はますます洗練された方法につながっており、malingeringを検出するための有望な結果をもたらしているが、特に軽度の神経認知障害を有する高齢者集団において、malingeringの検出には依然として重要な理論的および実用的な課題がある。 偽の重度の認知障害は、認知テスト結果で低いスコアと日常生活から派生した不対機能を比較することによって臨床的に検出することができる。, 実際には、同じ機能をタップする認知テストで重度の障害と対になっていない日常生活の活動は、malingeringを示しています。 しかし、軽度の神経認知障害は通常、日常生活の障害を伴わず、認知テスト結果(非常に低い)と毎日の活動(保存)を比較する単純な戦略を用いてmalingerersを検出することは困難である可能性がある。
認知障害のmalingerersを識別するための戦略の数が利用可能です。, 例えば、医学的症状の妥当性テスト(MSVT)は、偽りを検出することを目的とする三つの組み込みの努力の尺度を備えた広く使用されている記憶テストである(Green、2004;Dandachi-FitzGerald and Merckelbach、2013)。 MSVTは、記憶問題を装うように指示されたマリンゲラーと対照を比較した実験的研究において、印象的に高い感度および特異性を達成している(Merten et al., 2005).
bテストは、同じクラスのテスト、いわゆるパフォーマンスの妥当性テストに属します(例えば,,Rey15items,Reznek,2005),これは、非常に認知的に障害のある人にとっても非常に簡単なテストです。
bテストがこのタイプのmalingerersの識別に役立つかどうかを評価するために、我々は軽度の神経認知障害を有する患者群にbテストを投与した。 このグループは、テストに偽りに応答するように指示された健康なコントロール(人工的に認知障害の同様のパターンを生成する)とテストに正直に応答するように指示された健康なコントロールのグルー,
主な結果は、malingerersは、総応答時間を除いて、テストから派生したすべてのパラメータに、bテストでコントロールと患者よりも悪い得点ことを示しています。 特に、患者とコントロールは、dエラーを含む手数料エラーよりも多くの省略エラーを作ったが、malingerersは不釣り合いに多くの手数料エラーを作り、省略エラーとdエラー これらの知見は、malingerersによって口頭で報告されたように、偽りの戦略を密接に反映しています。, 実際には、それらの半分は、彼らがランダムな省略と手数料エラーを作ったことを示しました,それらの約四分の一は、彼らがbのではなかったすべてのターゲットを丸めようとしたことを示しながら、. 従って、malingerersは患者によって示されるそれらと根本的に異なっている間違いパターンに基づいて真実テラーから区別されるかもしれません。 対照的に、患者および健康な対照は、同様の応答および誤りのパターンを有する。, コントロールはすべてのエラースコアで患者よりも有意に優れていたが、両方のグループは手数料よりも省略のエラーが多く表示され、上記のように、malingerersは反対のパターンを表示した。
私たちの研究で報告されたデータは、Boone et alからの元の検証実験と一致しています。 (2002)は、うつ病、脳卒中、外傷性脳損傷、統合失調症、学習障害、および高齢の本物の患者が非bをbと誤認することは非常に珍しいことを文書化した。, 現在の研究からのデータは、この観察を軽度認知症の高齢患者にまで拡張している。
私たちの実験の患者は、Boone et alよりもはるかにゆっくりとbテストを行った。 (2002)患者(主に精神科患者を含む)。 これらの知見は、認知の減速が早期認知症において顕著であるという観察と一致する(Mcguinness et al.,2010)そして、応答時間は、実際と偽りの軽度認知症を区別する上で非常に限られた価値を有することを示唆している。 逆に、過剰に学習された情報タスクのエラーははるかに効率的であるように見えます。, 軽度の認知障害に関連する神経学的障害の性質は、時間に基づく指標がmalingerersの検出に特に有用ではない理由を説明することができる。
私たちの研究では、malingerersは意図的に彼らのパフォーマンスを遅くします。 但し、減らされた応答の速度はまたほとんどの神経学的な条件の特徴であり、これはタイミングに基づく索引がmalingerersと患者を効果的に区別できないかもしれない理由であるかもしれません。,
上記の結果を要約した標準的な統計分析に加えて、ML技術に基づくより高度な分析を適用しました。 また,サンプル外精度の不偏推定を得るために,K倍交差検証(特にlea-one-out交差検証,LOOCV)に基づく分類精度を報告した。, この分析はmalingerersが90%または多くの全面的な正確さのbテスト性能の患者から専ら区別されるかもしれないことを示した(簡単な記号論理学の分類器 異なるタイプの機械学習モデルも同様の結果を示した。 一部の複て自体が非常に複雑な意思決定ルール(例えば、森林その他がより直感的に、臨床医., 例えば、最適な決定木は、以下の決定規則をもたらした:
省略エラーが<=78である場合、被験者は95.2%に等しい精度を有する患者として分類される。
および
if>78は86%に等しい精度を持つシミュレータです。
より低い教育レベル(M=6.7、SD=2.2)にもかかわらず、健康なコントロールの平均応答時間(M=634.76、SD=236.23)および手数料エラー(M=1.28、SD=2。,75)はBooneらによって報告されたものと同様であった。 (2002). より古いコントロール(教育レベル=15.2年、平均応答時間=10.8分、平均手数料エラー=1.0)。 現在の研究の対照は、Booneと同僚のサンプルよりも多くの省略エラーを犯しました(平均漏れエラー:18.0対8.0)。 これらの知見は、教育がbテストのパフォーマンスにわずかな影響を与えるように見えることを示唆しており、bテストは被験者の教育レベルに比,
現在の研究の制限は、指示されたマリンガー(実験マリンガーとも呼ばれる)の使用を含む。 指示されたmalingerersは、一般的に、彼らの”現実世界”の対応物よりも過度に偽りをする傾向があるため、高い感度率を生じる(Boone et al., 2005). さらに、現在の研究では、malingerersは障害補償の対象となる疾患を装うように指示されたため、参加者は認知障害をさらに誇張しようとした可能性がありま, したがって、我々の研究における感度率は、認知障害を偽るように指示されるのではなく、自発的に偽るように動機づけられた参加者を使用して、医学的法
データの可用性
現在の研究中に使用および分析されたデータセットは、合理的な要求に応じて対応する著者から入手できます。
倫理声明
ベルーノ州とトレヴィーゾ州(イタリア)の臨床試験のための倫理委員会は、実験手順を承認しました。, すべての科目また同意書に基づくヘルシンキ宣言.
著者の貢献
GSとFGは実験を考案しました。 GP、RV、およびGSは実験的なタスクを設計しました。 GPは健常者のデータ取得に貢献しました。 RVおよびGPは健康な患者のデータ収集に貢献しました。 GOとAGはデータ分析に貢献しました。 GOとKBはデータ解釈に貢献しました。 GP、GS、KB、およびGOが原稿を起草しました。 すべての著者は、原稿を批判的に改訂し、出版されるバージョンの最終承認を与えました。,
利益相反声明
著者らは、この研究が潜在的な利益相反と解釈され得る商業的または財務的関係がない場合に行われたと宣言している。
アメリカ精神医学協会(2013)。 DSM-5:精神障害の診断および統計マニュアル。 (ワシントンD.C.:米国精神医学会),5.
Google Scholar
Boone,K.,Lu,P.,And Herzberg,D.S.(2002). Bテストマニュアル。 ロサンゼルス:西洋心理サービス。
グーグルスカラー
グリーン、P。, (2004). マイクロソフトWindows用グリーンの医療症状の妥当性テスト(MSVT):ユーザーズマニュアル。 エドモントン、カナダ:グリーンの出版。
Google Scholar