Welcome to Our Website

국경에서 심리학 (한국어)

많은 연구원을 비판했 null 이 가설을 의미 테스트,하지만 많은 옹호 그것은 너무(참조하십시오 Balluerka et al.,2005,검토를 위해). 경우에 따라 유형 I 오류율을 낮추기 위해 알파 수준을보다 보수적 인 값으로 줄이는 것이 좋습니다. 예를 들어,1950-1962 년 Journal Of Experimental Social Psychology 의 편집자 인 Melton(1962)은 일반적인 0.05 알파 수준보다 0.01 의 알파 수준을 선호했습니다. 보다 최근에,벤자민 등., (2018)추천동 0.005—으로 일관된 멜의 의견도 0.01 수준이 되지 않을 수도 있습”충분히 인상적인”보증하는 간행물(p. 554). 또한,벤자민 등. (2018)규정하는 0.005alpha 수준이어야에 대한 새 연구 결과였지만 막으로 수행 할 작업에 대한 연구 결과는 새로운되지 않습니다. 반드시 유의 테스트를 선호하는 추론 통계 절차로지지하지는 않지만(많은 저자들은 분명히 베이지안 절차를 선호한다),Benjamin et al. (2018)는 0 을 사용한다고 주장했습니다.,005 컷오프는 유의 테스트로 잘못된 것을 많이 고칠 것입니다. 불행하게도,을 보여 드리겠습니다,이 문제가 중요성을 테스트할 수 없는 중요한 완화 단순하게 함으로써 더 보수적인 거부 기준,일부 문제는 더욱 악화을 채택하여 더 보수적인 기준을 사용할 수 있습니다.

우리는 Benjamin et al.의 부분에 대한 몇 가지 주장을 시작합니다. (2018). 예를 들어,그들이 쓴”…변화하는 P 값은 임계값은 간단하는 장치와 함께 훈련을 수행하여 많은 연구원할 수 있으며,빠르게 달성하는 넓은 합격입니다.,”만약 중요성 테스트—어떤 p-값 임계 값에서—우리가 그것을 유지할 것만 큼 심하게 결함이 있다면(또한 Amrhein et al.,2017;그린란드,2017),이러한 이유는 단순히 컷오프를 변경하는 것을 정당화하기에는 분명히 부족합니다. 또 다른 고려 주장:”새로운 의 임계값을 도울 것입니다 연구자들과 독자들이 이해하고 통신 증거를 더 정확합니다.”하지만 경우에 연구자들은 이해와 커뮤니케이션 문제를 0.05 임계값,그것은 불분명하는 방법을 사용하여 0.005 임계 값을 제거 하는 것이 문제입니다., 고 고려하는 또 다른 클레임:”저자와 독자들을 주도권에 대해 설명 및 결과 해석상에서 적절한 빛의 새로운 제안된 정의의 통계적 의미를 갖는다.”다시,이것은 명확하지 않는 방법을 채택하 0.005 임계값을 허용할 것이 저자와 독자들을 주도권과 관련하여 데이터 해석됩니다. 따라서,이전에도 토론의 주요 인수는 이유가 독자를 위해 의심의 성급한 주장이 없는 경험적 지원합니다.,중요성검사에 대한 기본적인 문제점은 귀무가설을 거부하는 것이 목표라는 점을 고려해보자. 이 목표를 요구하는 것으로 보인—는 경우 베이지안—는 후부 확률의 널 가정해야 낮게 얻을 수 있다. 그러나는 p 값은 하나를 얻는의 가능성을 찾는 것,그리고 극단적 연구 결과는 주어진,null 가설과 다른 모든 가정 모델에 대한 올바른(그린란드 et al.,,2016;그린란드 2017 년),한해야하는 것 잘못된 역 추론을 그리는 결론에 대한의 확률 null 가설이 주어집니다. 고 있는 경우 frequentist 는 방법은 없을 통과하는 논리적 갭에서의 가능성을 발견하고 더 많은 극단적 연구 결과,주어진 널 가정하에 대한 결정을 내리는지 여부를 해야 하나 받아들이거나 거부하는 null 을 가설(브릭스,2016;Trafimow,2017 년). 우리가 받아들이는 frequentist 논리,확률의 종 오류가 정말 낮은 우리가 사용하는 경우에는 0.005 구분 p 이상 0.05 차단,이는 모두는 같습니다., 우리는 또한 Benjamin 등의 베이지안 주장을 받아들입니다. (2018)귀무 가설은 p=0.005 인 경우 p=0.05 인 경우보다 가능성이 적고 다른 모든 것은 동일하다는 것입니다. 마지막으로,우리는 Benjamin et al. (2018)은 중요성 테스트에 대한 논쟁을 더욱 자극하여 과학에 대한 서비스를 제공했습니다. 그러나 중요한 문제 벤자민 등이있다. (2018)는 다음 섹션에서 논의 된 것으로 간주되지 않은 것 같습니다.,

회귀하고 반복 가능성

Trafimow 및겠(2017 년)다고 주장에 대한 일반적인 개념을 설정하는 알파 수준을 결정을 거부하거나 거부하지 않 null 가설,그리고 인수를 유지하는 그들의 힘 경우에도 수준을 감소하 0.005. 어떤면에서는 감소가 문제를 악화시킵니다. 한 가지 문제는 다른 통계(Cumming,2012)와 마찬가지로 p-값이 샘플링 변동성을 갖는다는 것입니다., 하지만 p-값에서 특별하는 것처럼 보이도록 설계되어 순수한 소음 경우에는 null 을 가설과 다른 모든 모델의 가정이 올바른지에 대한,이 경우에는 p 값은 균일하게 배포에서(그린란드,2018). 대안적인 가설 하에서,그 분포는 p 가 선택된 컷오프 아래로 떨어질 확률이 시험의 힘인 상태에서 아래쪽으로 이동된다. 기 때문에 실제적인 전력의 일반적인 연구가 매우 높지 않을 때,대안은 올바른 것이 크게 행운의 문제 여부를 샘플링하는 p 값은 아래의 선택 alpha 수준입니다., 때로는 자주의 경우,능력이 훨씬 아래의 50%(Smaldino 및 제작으로 세계적인 명성을 쌓았,2016),연구원가능성시 샘플 p 값 아래의 의미는 문턱에 복제,이 있을 수 있으므로 더 많은 p-위의 값보다 임계값 아래에서 p 값 분포(Goodman,1992;Senn,2002;할시 et al., 2015). 이 문제는 일정한 샘플 크기의 경우 컷오프와 함께 전력이 떨어지기 때문에 컷오프가 낮아짐에 따라 더욱 악화됩니다.,

경우에도 하나 사용하지 않았 차단,이러한 현상의 회귀를 의미는 p 값에서 얻어진 복제 실험을 가능성이 퇴보를 어떤 의미는 p 값은 것이 많은 경우 복제 수행되었습니다. 얼마나 많은 회귀가 발생해야합니까? 귀무 가설이 잘못된 경우,이는 점 추정치가 얼마나 가변적인지,따라서 p-값이 무엇인지에 달려 있습니다.

또한,p-값의 가변성은 복제 전반에 걸친 상관 관계가 불량한 결과를 초래한다., 데이터를 기반으로 배치하여 온라인으로 오픈 과 공동 작업(2015 년;https://osf.io/fgjvw),Trafimow 및 드 보어(제출)계산이의 상관 관계의 단 0.004 사는 p 값에서 얻어진 원래 집단의 연구는 p 값에서 얻어진 복제 집단에 비해 예상되는 상관 관계의 모든 경우 null 가설 및 모델을 계산하는 데 사용되는 p 값이 올바른(에서 p 값을 균일하게 배).,

는 몇 가지 이유가 있을 수 있에 대한 상호 관계,포함하여는 대부분의 연구 협회도 사실이 있습니다 거의 null,그래서는 p 값아 주로 소음과 따라서 근로 관련 예상되어야 합니다., 하지만 경우에도 많은 또는 대부분의 협회에서 멀리했 null,따라서 이동하는 p 값 아래로 향해 제고를 만드는 긍정적 상관관계에 복제,는 상관 관계를 유지됩니다 저해하지만 큰 임의의 오류에서 p 값만,또한이 때문에 불완전한 복제 방법론 및 비선형적 관계 p 값이고 효과 크기(“수정”상관관계에 대한 감쇠로 인해 제한의 범위로서 원래 집단의 연구는 증가하고,상호 관계 0.01 는 여전히 낮음)., 또한,경우의 대부분 테스트 null 가설 false,낮은 p 값을 반복 가능성 입증에 의해 열린 과학을 공동 작업에 기인할 수 있어서,부분 바에 의해 발생하는 출판 기준에 기반하는 p 값(Locascio,2017a;Amrhein 고 그린란드,2018)., 하지만 경우에 한하고자 하는 이러한 저작자 표시,하지만 그것을 제공할 수 있습니다 정당화를 위해 사용하는 p 값은 가상적인 과학적인 우주에는 p 값을 false null 은 더 복제의 부족 때문에 publication bias,속성을 제공하는 또 다른 중요한 이유를 피하는 모든 종류의 출판 기준에 기반하는 p 값 또는 다른 통계적 결과(Amrhein 고 그린란드,2018).,

따라서 얻어진 p-value 원래의 연구가 조금으로 할 수 p-얻어진 값에 복제 실험(는 실제 이론 p 값의 말해야 하는 경우). 최고의 예측 것 p 값에 대한 복제 실험을 훨씬 더 가까운 것을 의미의 p-value 배포하는 것보다는 p 값에서 얻어진 원래 실험입니다. 어떤 가설 하에서도 원래 실험에서 발표 된 p-값이 낮을수록(예:0 이 아닌 0.001.,01),p-값 평균에서 p-값의 더 큰 거리를 나타낼 가능성이 높으며,평균에 대한 증가 된 회귀를 암시한다.

이 모든 것을 의미하는 바이너리 결정에 기초하여,p-값에 대해 거부 또는 승인의 가설에 대해 강의 증거(피셔,1925,1973),또는에 대해의 심각성 테스트(Mayo,1996),신뢰할 수을 결정합니다. 이 될 수 있다고 주장하는 것이 좋은 이유로 사용하지 않는 p 값이든,또는 적어도 그들을 사용하지 않을 만들기 위한 의사 결정에는지 여부를 판단하는 과학적 가설되는 것으로 올바른(Amrhein et al., 2018).,

오류가 요금 변수 Alpha 수준

의 또 다른 단점을 사용하여 어떤 설정파 수준에 대한 출판물은 상대적 중요성의 종 및 II 오류가 다를 수 있습니다 연구에 걸쳐 내에서 또는 사역과 연구팀은(Trafimow 및겠,2017 년). 설정을 담요의 수준을 어느 0.05 또는 0.005,또는 다른 것이 힘 연구자들은 척 하는 상대적 중요성의 유형 I 및 II 종 오류는 상수입니다. 벤자민 등. (2018)은 0 으로 줄이기 위해 자신의 추천을 정당화하려고합니다.,005 수준을 가리키는 몇 가지 분야의 과학이 사용하는 매우 낮은 알파 수준이지만,이는 관찰은 아이디어와 일치하는 담 수준에서 과학적이지 않습니다. 고 있는 좋은 이유가 변동에 필드 주제를 예상되:의 다양한 요인 영향을 미칠 수 있는 상대적 중요성의 종 및 II 로 렌더링하는 담 추천 바람직하지 않습니다. 이러한 요소에는 이론의 명확성,보조 가정,실용적 또는 적용된 우려 또는 실험적 엄격함이 포함될 수 있습니다., 실제로 Miller and Ulrich(2016)는 이러한 요인과 다른 요인들이 최종 연구 보수에 직접적인 영향을 미치는 방법을 보여주었습니다. 담요 수준 권장 사항을 설정하는 데 어려움을 증명하는 인상적인 문헌이 있습니다(예:Buhl-Mortensen,1996;Lemons et al.,1997;Lemons and Victor,2008;Lieberman and Cunningham,2009;Myhr,2010;Rice and Trafimow,2010;Mudge et al.,2012;Lakens 외., 2018).

그러나 우리가 주장하지 않는 모든 연구원은 것을 얻어야 한다는 그녀는 자신의 알파 수준에 대한 각 연구로서,추천에 의해 Neyman 및 피어슨(1933)및 Lakens et al., (2018),그것도 문제가 있기 때문에(Trafimow and Earp,2017). 예를 들어,가진 변수 임계값에,많은 오래된 문제와 중요성 테스트에 남아 있는 미해결 같은 문제의 회귀를 의미의 p-값,인플레이션의 효과 크기(이하”승자의 저주를,”아래 참조),선택적인 보고 및 publication bias,그리고 일반적인 단점을 강제로 결정이 너무 빨리 보다는 오히려 고려하고 누적 증거에서 실험입니다. 통계적 추론을 둘러싼 모든 불확실성에 비추어 볼 때(Greenland,2017,2018;Amrhein et al.,,2018),우리는 Lakens et al. (2018)는 Benjamin et al 에 대한 그들의 논평에서 제안한 것으로 보인다. (2018). 그럼에도 불구하고,Lakens et al. (2018)은”‘통계적으로 유의미한’이라는 용어를 더 이상 사용하지 않아야한다고 결론 지었다.”우리 동의하지만,우리가 생각하는 중요성 테스트와 정당화된 알파입니다 여전히 중요성을 테스트할지 여부를 용어는”의미”을 사용하거나지 않습니다.,

주어진 담요 변수 alpha 수준이 모두 문제가 있는것이 합리적이지 않은 다시 정의하는 통계적 의미하지만,분배과성 테스트 모두에 의해 제안 맥 셰인 et al. (2018)과 Amrhein 과 Greenland(2018),Benjamin et al.에 대한 두 가지 다른 의견. (2018).

복제 가능성 정의

또 다른 단점은 Benjamin et al. (2018)은 제안의 주요 이점으로 선전되었으며,발표 된 연구 결과는 0.05 알파 수준보다 0.005 를 사용하여 더 복제 될 것입니다., 이것은”복제”가 의미하는 바에 달려 있습니다(일부 정의는 lykken,1968 참조). 는 경우 하나의 주장에 동일한 수준에 대한 원래의 연구와 복제 공부한 다음,우리는 더 볼 것을 믿을만한 이유가 있는 것이 더 성공적인 복제를 사용하여 0.005 수준 이상을 사용하여 0.05 수준입니다. 사실,통계적 회귀분 인수를 만든 이전에 나왔다면 회귀 문제를 만들어도 나빠를 사용하여 0.005 보를 사용하여 0.05. 대안으로,벤자민 등으로서. (2018)은 원래 연구에 0.005 를 사용하고 복제 연구에 0.05 를 사용할 수 있다고 제안합니다., 이 경우에,우리는 동의하는 것을 조합의 0.005 0.05 을 만들 것입 적은 실패 복제보다 조합의 0.05 0.05 초기와 복제 연구,각각합니다. 그러나,이것은 임의성에 높은 가격에 온다. 다고 가정하는 두 가지 연구에 와서 p<0.005 및 p<0.05,각각합니다. 이것은 성공적인 복제로 계산됩니다. 에 대비한다고 가정하는 두 가지 연구에 와서 p<0.05 및 p<0.005,각각합니다., 두 번째 연구 만이 계산 될 것이고,그 조합은 성공적인 복제를 나타내는 것으로 자격이 없을 것입니다. 을 주장하는 설정의 구분의 0.005 렌더링하는 연구는 더 복제 요구하는 것은 훨씬 더 많은 특이는 방법에 대한 개념을 반복 가능성이 있습니다.또한 단일 복제 성공 또는 실패를 결정적인 것으로 보지 않습니다. 복제 성공 또는 실패에 대한 강력한 사례를 만들고 싶다면 여러 복제 시도가 바람직합니다. 인지 심리학에서 최근의 성공적인 복제 연구에 의해 입증 된 바와 같이(Zwaan et al., 또한,사회 과학(Mullinix et al.,2015),이론의 질과 모델 가정이 충족되는 정도는 복제 가능성에 중요한 영향을 미칠 것이다.

질문 가정

토론 지금까지는 허위의 밑에는 기본 가정을 해석하는 p 값은 사실이다. 그러나 이것이 얼마나 가능성이 있습니까? Berk and Freedman(2003)은 인구에서 무작위 및 독립적 인 샘플링의 가정이 거의 사실이 아니라는 강력한 사례를 만들었습니다., 문제는 특히 두드러진 임상의과학,어디로 허위의 가정뿐만 아니라 분기 사이의 통계 및 임상적 의미,특히 분명하고 극적인(Bhardwaj et al.,2004;Ferrill 등.,2010;페트니,2010;페이지,2014). 그러나,통계적 테스트 뿐만 아니라 가설을 테스트하지만 수많은 가정과 전체 환경에서는 연구소(그린란드,2017,2018 년;Amrhein et al., 2018)., 의 문제를 가능성이 잘못된 가정과 함께,다른 문제는 이미 논의 렌더링하 밀어붙이는 환상의 진리에서 p 값에서 또는 다른 통계 방법,아직 더 극적이다.

인구 효과 크기

저희에게 계속 중요성과 복제 문제를 되돌리기,허위는 모델의 가정이 올바른지를 유지하면서,마음에는 이는 거의 없습니다. 사정이 지금 0 를 가진 중요성의 시험을 사용하여 서 있기 때문에 고려하십시오.,05 기준,인구 효과 크기 있는 중요한 역할을 모두 취득에 통계적 유의성(모든 사람이 동등하게되고,샘플 효과는 크기가 큰 경우 인구 효과는 크기가 더 크)과를 얻는 통계적 의미는 두 번의 성공적인 복제. 로 전환하 0.005 컷오프지 않을 것입을 줄이는 중요성을 인구의 효과 크기,그리고 증가할 것이라 그것의 중요성 않는 샘플 크기의 증가에서 실질적으로 사람들이 현재 사용됩니다. 그리고 복제 가능성이 모집단 효과 크기에 의존해야한다는 것을 거부 할 좋은 이유가 있습니다., 이를 빨리 보려면 Michelson and Morley(1887)의 가장 중요한 과학 실험 중 하나를 고려하십시오. 그들은 그들의 간섭계는지 여부를 테스트하는 우주가 가득 luminiferous 에테르 수 있는 빛을 여행하여 지구상에서 별. 그들의 샘플을 효과 크기는 아주 작고,물리학자들은 받아들이는 인구의 효과 크기는 것은 영이 없기 때문에 luminiferous ether. 0.05 또는 0 중 하나를 사용하여 유의 전통적인 테스트를 사용합니다.,005 컷오프,Michelson 과 Morley 를 복제하는 것은 문제가 될 것입니다(가설 테스트의 맥락에서이 실험에 대한 논의는 sawilowsky,2003 참조). 그럼에도 불구하고 물리학 자들은 실험을 매우 복제 가능하다고 생각합니다(meehl,1967 참조). 어떤 제안을 하는 기능 p-value 거절 기준을 강제로 복제 가능성에 영향을 받는 인구 효과 크기,그리고 거부하는 경우 우리가 받아들이는 개념을 반복 가능성해야에 의존하지 않는 인구 효과 크기입니다.

또한 알파 레벨이 0 입니다.,005,큰 효과 크기는 것이 더 중요하 게,그리고 연구자들은 기울어 있습니다 훨씬 더 향해”분명한”연구상을 향해 테스트를 창의적인 아이디어가 있는 더 위험의 작은 효과하고 p 값의 실패를 맞 0.005 됩니다. 매우 가능성이,이유 null 결과는 너무 어렵 게시 과학에서 같은 심리학문의 전통을 사용하는 p 값은 대진표가 그렇게 뿌리 깊. 이 전통을 종결시키는 것이 유익 할 것입니다.,

출판 된 효과 크기의 정확도

과학적 문헌에서 출판 된 사실이 현실을 정확하게 반영하는 것이 바람직합니다. 회귀 문제를 다시 생각해보십시오. 더 엄격한 기준에 대한 수준을 게시,더 많은 거리에서 발견을 전달하는 조건을 의미,그리고 증가 회귀분석 효과가 있다. 심지어 0 에서.,05 알파 수준으로,연구진은 오랫동안 인식되는 게시된 효과 크기를 가능성이 현실을 반영하지 않거나,적어도되지 않는 현실을 보면 많았 복제의 각 실험 및 모든 출판되었다(참조하십시오 브릭스,2016;Grice,2017 년;하이 먼,2017 년;클,2017 년;Locascio,2017a,b;마크 2017 년에 대한 최근의 논의를 이 문제는). 에서 합리적인 샘플 크기와 합리적인 인구 효과 크기,그것은 비정상적으로 큰 샘플 효과 크기는 p 값을 만족하는 0.05 수준,또는 0.,통계적 회귀의 관점에서 명백한 것처럼 005 레벨 또는 다른 알파 레벨. 고로 일반적으로 낮은 샘플 크기,통계적으로 유의한 효과는 종종 과대의 인구 효과 크기는”이라고 효과 크기 인플레이션,””진실,인플레이션”또는”자의 저주”(Amrhein et al., 2017). 효과 크기를 쉽게 확인했 경험적으로 증명에서 열린 과학을 공동 작업(2015 년),평균 효과가 크기에 복제 집단의 연구에 획기적으로 감소되었에서 평균 효과 크기를 원래 동(에서 0.403 을 0.197)., 더 엄격한 0.005 컷오프로 변경하면 효과 크기 과대 평가가 더 심해집니다(Button et al.,2013;Amrhein And Greenland,2018). 의 중요성을 출판하는 데 효과 크기를 정확하게 반영구 효과는 크기가 모순의 사용은 임계값을 기준의 중요성 테스트에서 모든 알파 수준입니다.

샘플 크기와 대안을 중요성 테스트

우리는 스트레스는 복제에 크게 의존하는 샘플 크기,하지만 요소가 있을 방해 연구자들은 사용하여 큰 샘플 크기 위해 필요한 좋은 샘플링이 정밀도와 반복 가능성이 있습니다., 큰 표본 크기를 얻는 데 드는 명백한 비용 외에도 표본 크기가 얼마나 중요한지에 대한 과소 평가가있을 수 있습니다(Vankov et al.,2014),복제 가능성보다 참신함을 선호하는 인센티브의 중요성(Nosek et al.,2012)및 p-값의 보완이 복제 가능성을 측정한다는 널리 퍼진 오해(Cohen,1994;Thompson,1996;Greenland et al., 2016). 표본 크기에 대한 초점은 유의성 테스트의 대안을 제시합니다., Trafimow(2017;Trafimow 과 맥도날드,2017 년)제안된 절차는 다음과 같습니다:연구원을 지정하는 방법에 가까운 그녀는 소원은 통계 샘플을 해당하는 인구는 매개변수,그리고 원하는 확률의되고 있는 가깝습니다. Trafimow 의 방정식은이 근접성 사양을 충족시키는 데 필요한 샘플 크기를 얻는 데 사용될 수 있습니다., 연구자는 다음을 획득에 필요한 샘플 크기 계산의 설명,통계 및 그들로 정확한의 추정 인구는 매개변수(일시적으로 새로운 데이터의 최적의 방법으로 얻을 신뢰할 수 있는 추정을 통해 이 강력한 방법을 참조하십시오 Huber,1972;Tukey,1979;Rousseeuw,1991;Portnoy 그는,2000;Erceg-식 건물 et al.,2013;필드와 윌콕스,2017). 샘플 크기가 신뢰 구간에 대해 원하는 최대 너비를 기반으로하는 유사한 방법이 오랫동안 존재 해왔다.,

이 친밀감 절차를 강조(a)결정하기 위해서 무엇을 믿는 샘플 통계는 좋은의 추정 인구는 매개변수하기 전에 데이터 수집보다는 나중에,그리고(b)를 얻기 충분히 큰 샘플 크기의 수 있다는 확신을 얻은 샘플 통계는 정말 내의 지정된 거리의 해당 인구 매개 변수입니다. 이 절차는 또한 출판 결정에 대한 컷오프가 없기 때문에 출판 편견을 조장하지 않습니다., 과 친밀감 절차와 동일하지 않는 전통적인 전력 분석:첫째,목표의 전통적인 전력 분석을 찾을 수 있는 샘플 크기하는 데 필요한 좋은 기회를 얻는 통계적으로 p-값입니다. 둘째,전문적인 분석을 적극에 의해 영향을 받는 영향을 미치는 것으로 크기는 반면,친밀감 절차에 의해 영향을 받지 않는 영향을 미치는 것으로 크기의 정상에서(가우스)모델이다.

더 중요한 포인트가 있다는 것을 창조적 인 대안을 중요성 테스트 직면하는 샘플 크기 많은 문제보다 더 직접적으로 중요성을 테스트 않습니다., 은”통계적 도구”(Gigerenzer 및 Marewski,2015)포함한,예를 들어,자신감을 간격(는 오히려 이름을 바꾸고 있으로 사용된”호환성 간격으로”볼 Amrhein et al.,2018 년;그린란드,2018),동등성 테스트,p-값으로 지속적인 조치의 refutational 증거에 대한 모델이(그린란드,2018),가능성 비율,Bayesian 방법,또는 정보 기준입니다. 그리고 제조 또는 품질 관리 상황에서도 Neyman-Pearson 결정은 의미가 있습니다(Bradley and Brand,2016).,

만을 위한 과학적 탐색,그 도구를 통해 새로운 마법을주는 명확한 기계적인 답변(코헨,1994),기 때문에 모든 선택 기준을 무시합니다 불확실성에의 호의 바이너리 의사 결정에 따라서 생산하는 동일한 문제로 사람들에 의 중요성을 테스트합니다. 예를 들어 베이 즈 인자에 대한 임계 값을 사용하면 p-값에 대한 임계 값과 마찬가지로 유사한 딜레마가 발생합니다:konijn et al. (2015)는”하나님은 3.01 의 베이 즈 팩터를 거의 2.99 의 베이 즈 팩터만큼 좋아할 것입니다.,”

마지막으로 유추하지 않아야 기반으로 한 연구에서는 모두(Neyman 및 피어슨,1933;Fisher,1937 년;그린란드 2017 년),또는 복제에서는 동일한 실험실이지만,에 누적 증거에서 여러 개의 독립적인 연구이다. 그것을 얻는 것이 바람직하다 정확한 예측에서 이러한 연구들,그러나 더 중요한 목표를 제거하는 바를 포함하여 넓은 간격으로 신뢰하고 작은 효과 문헌에는 없이 누적 증거가 될 것입니다 왜곡(Amrhein et al.,2017,2018;Amrhein And Greenland,2018)., 이와 더불어,브릭스(2016)에 대한 주장을 포기 매개 변수는 기반추고 채택 하는 순수 예측,따라서 검증,확률이 모델,그리고 그린란드(2017 년)보고”절실히 필요로하는 멀리에서 얻을 추론 통계가 찍 자세하게 설명 연구의 절차,데이터 수집 및 결과 데이터입니다.”

결론

것에 적합한 결론으로 기본적인 문제는 우리와 함께 처음부터., P 값을하고 p 값은 임계값,또는 다른 통계적 도구로 사용할 기본 기준을 만들기 위한 출판을 결정 또는 결정에 받아들이거나 거부하는 가설을? 단순한 사실이는 연구는 우려와 함께 복제,그러나 그것은 개념화,을 나타내는 감사는 단일 연구는 거의 확정적인 거의 정당화를 최종 결정이다., 을 평가할 때 강도의 증거는,세련된 연구원,고려에 틀림없이 주관적인 방법으로,이론적 고려 사항과 같은 범위 설명 폭이며,예측력;의 가치 보조 연결 가정 nonobservational 측면에서는 이론,관측 조건에서 실험적인 가설;힘의 실험적 디자인과 의미합니다. 끓는 모든이 내려진 결정에 기반하는 p 값은 임계값의 0.05,0.01,0.005,또는 다른 것은 허용되지 않습니다.,

저자는 기여금

나열된 모든 저자가 직접적으로 기여하는 종이나 보증하는 콘텐츠,그리고 승인에 대한 출판물이다.

이해 상충 진술

Fk-N 은 Oikostat GmbH 에 의해 고용되었다. GM 은 Janssen Research And Development,LLC 의 컨설턴트 역할을 해왔습니다.

다른 저자가 선언하는 연구가 수행되었의 부재에서 어떠한 상업 또는 금융 서비스를 제공하는 것으로 해석될 수 있는 잠재적인 이해의 충돌.,

인정

우리는 의견과 토론에 대한 샌더 그린란드와 링크 Hoekstra 감사합니다. MG 는 VEGA2/0047/15 교부금의 지원을 인정합니다. Rvds 는 네덜란드 과학 연구기구의 보조금으로 지원되었습니다:NWO-VIDI-45-14-006. 게시 재정적으로 지원하는 권한을 부여 156294 에서 스위스 국립 과학 재단지는 않습니다.째쨀짚쨘쨍쨍짝 쨘쨍짙째챠 쨈쨈. 중요성 테스트 요구사항 분류:는 방법 또는 Fisher,Neyman-Pearson 논란을 초래 추정 꼬리를 흔들고 측정이 개입니다. 사이콜. 하원 의원 119,487-504., doi:10.1177/0033294116662659

PubMed Abstract|CrossRef 전체 텍스트|Google Scholar

Briggs,W.M.(2016). 불확실성:모델링,확률 및 통계의 영혼. 뉴욕,뉴욕:스프링거.나는 이것이 내가 할 수있는 유일한 방법이라고 생각한다. 지구가 둥글다(p<0.05). 오전. 사이콜. 49, 997–1003.

Google 학술검색

피셔,R.A.(1925). 연구 종사자를위한 통계적 방법,1st Edn. 에딘버러:올리버와 보이드.나는 이것이 어떻게 작동하는지 잘 모르겠습니다., 실험 설계,2nd Edn. 에딘버러:올리버와 보이드.나는 이것이 어떻게 작동하는지 잘 모르겠습니다. 통계적 방법 및 과학적 추론,3rd Edn. 런던:맥밀란.째쨀짚쨘쨍 쨘쨍짙쨍짝 쨘쨍짙쨍짝 쨘쨍짙째챠 쨈쨈. 오류와 실험 지식의 성장. 시카고,일리노이:시카고 대학 출판부.나는 이것이 내가 할 수있는 유일한 방법이라고 생각한다. 사설. 제이 특급. 사이콜. 64, 553–557. doi:10.1037/h0045549

CrossRef 전체 텍스트

Open Science Collaboration(2015). 심리 과학의 재현성 추정., 과학 349:aac4716. 도이:10.1126/과학.aac4716

CrossRef 전체 텍스트

페이지,P.(2014). 통계적 유의성을 넘어서:재활 연구 문헌의 임상 해석. Int. J. 스포츠 Phys. 테르. 9:72.

PubMed Abstract|Google Scholar

Thompson,B.(1996). 통계적 유의성 테스트에 관한 AERA 편집 정책:세 가지 제안 된 개혁. 교육하십시오. 레스 25,26-30. doi:10.2307/1176337

CrossRef 전체 텍스트|Google Scholar

Trafimow,D.(2017)., 신뢰의 계수를 사용하여 선험적 추론 통계에 대한 사후 통계에서 철학적 전환을합니다. 교육하십시오. 사이콜. 미아스. 77, 831–854. doi:10.1177/0013164416667977

CrossRef 전체 텍스트|Google Scholar

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다