재귀적 언어 구조의 인간 처리에 대한 자원 합리적 모델 3부

Jan 23, 2024

실험 2: 의미 단서의 효과

다음으로 두 번째 항목 세트에 대해 실험 1을 복제하고 동시에 의미 호환성의 예측 효과를 테스트했습니다.

의미적 호환성이란 언어, 단어, 기호의 서로 다른 단위 간의 호환성과 상호 관계에 대한 사람들의 이해와 숙달을 의미합니다. 기억이란 정보를 기억하고 저장하는 능력을 말합니다.

의미론적 호환성과 기억 사이에는 밀접한 관계가 있습니다. 좋은 의미 호환성은 사람들의 기억 품질을 향상시킬 수 있지만, 나쁜 의미 호환성은 사람들의 정보 이해와 기억 효과를 방해합니다.

첫째, 의미적 호환성은 정보의 관련성을 향상시켜 사람들이 정보를 더 잘 이해하고 기억하도록 돕습니다. 서로 다른 단위 사이에 분명한 상관관계가 있다면 사람들은 이 상관관계를 이용해 정보 간의 연결을 구축하고 정보 간의 네트워크 구조를 형성할 수 있습니다. 이러한 네트워크 구조는 정보의 기억 효과를 향상시키고 사람들의 정보 저장 능력을 향상시킬 수 있습니다.

둘째, 좋은 의미 호환성은 정보의 이해 가능성을 향상시켜 사람들이 더 쉽게 기억할 수 있게 해줍니다. 정보 사이에 명백한 호환성 관계가 있으면 사람들은 정보 사이의 연관성을 쉽게 이해할 수 있으며, 이를 통해 정보에 대한 이해와 기억이 형성됩니다. 반대로, 정보 사이에 명백한 불일치가 있으면 사람들은 혼란스럽고 혼란스러워하며 정보를 이해하고 기억하는 데 어려움을 겪게 됩니다.

마지막으로, 의미론적 호환성이 좋지 않으면 사람들의 기억 성능에 부정적인 영향을 미칠 수 있습니다. 단위 간의 차이가 너무 크면 사람들이 정보를 이해하고 기억하기 어려워지기 때문에 기억의 가치를 잃게 됩니다. 그러므로 정보를 작성하고 전달하는 과정에서 의미적 호환성을 최대한 유지하여 사람들의 이해와 기억력을 향상시켜야 한다.

요약하면 의미론적 호환성과 기억 사이에는 강한 관계가 있습니다. 좋은 의미 호환성은 정보의 관련성과 이해성을 향상시켜 사람들의 정보 저장 능력과 기억 효과를 향상시킬 수 있습니다. 따라서 일상생활과 업무에서 정보에 대한 이해와 기억력을 향상시키기 위해서는 의미적 호환성을 최대한 유지해야 한다. 기억력 향상이 필요함을 알 수 있는데, 시스탄체 데저티콜라는 기억력 향상이라는 독특한 효능이 많은 중국 전통 약재이기 때문에 기억력을 크게 향상시킬 수 있습니다. 다진 고기의 효능은 산, 다당류, 플라보노이드 등 포함된 다양한 활성 성분에서 비롯됩니다. 이러한 성분은 다양한 방식으로 뇌 건강을 증진할 수 있습니다.

help with memory

기억력 향상을 위한 보충제 알아보기

실험 1의 두 가지 조작 외에도 두 가지 조건과 세 가지 조건에서 마지막에서 두 번째 동사구를 추가로 변경했습니다. COMPATIBLE 조건에서 첫 번째 명사는 그럴듯한 주제였습니다(예: "환자를 짜증나게 했습니다"). INCOMPATIBLE 조건에서는 그렇지 않았습니다(예: "환자를 치료했습니다"). COMPATIBLE 조건에서 "the Report by..."와 같은 검증되지 않은 버전은 더 높은 사전 확률을 가져야 하며 마지막 동사를 예측해야 합니다. 덜 정확합니다. 42개의 자극 아이템을 구축했습니다.

그림 3B는 이러한 항목에 대한 자원합리적 모델과 이전 이론의 예측을 보여줍니다. 실험 1의 효과 외에도 모델은 COMPATIBLE 조건, 특히 THREE 내에서 더 높은 난이도를 예측합니다. 놀라움 이론이나 DLT 모두 호환성의 효과를 예측하지 않습니다.

우리는 두 가지 조건과 세 가지 조건에서 호환 가능 및 비호환 가능 변형을 모두 포함하여 200명의 참가자로부터 읽기 시간 데이터를 수집했습니다. 다른 모든 측면에서 실험 및 데이터 분석은 실험 1과 동일했습니다. 판독 시간은 그림 3B에 표시됩니다.

실험 1의 결과가 재현되었습니다. 첫째, 판독 시간은 TWO(=0.29, 95% CrI [0.24, 0.35], P(보다 THREE에서 더 높았습니다. < 0) ​​< 0.0001; 원시 판독 시간 효과: 337 ms, 95% CrI [267, 411] ms).

둘째, 삽입 편향과 "that" 절(= −0.06, 95% CrI [−0.1{)의 존재 사이에 상호 작용이 있었습니다. {9}}, −0.024],P( > 0)=0.0007). 실험 1에서와 같이, 임베딩 편향의 효과는 ONE 조건("사실"과 "보고" 사이의 차이: 193ms, 95% CrI[37, 357] ms)에서 긍정적이었고, 2개와 3개 조건("사실"과 "보고" 사이의 차이: 193ms, 95% CrI[37, 357] ms)에서는 부정적이었습니다(" 사실" 및 "보고": −105ms, 95% CrI [−194, −18]ms).

셋째, 모델 예측과 일치하게 INCOMPATIBLE 조건보다 COMPATIBLE 조건에서 판독 시간이 더 높았습니다({{0}}.083, 95% CrI [0.031, 0.136 ],P( < 0)=0.0014; 원시 판독 시간의 효과: 96ms, 95% CrI[36, 156]ms). 추가 분석은 SI 부록, 섹션 S3을 참조하십시오.

임베딩 편향 및 호환성의 효과는 두 가지 조건보다 세 가지 조건에서 수치적으로 더 큽니다. 메타 분석에 따르면 이러한 차이는 읽기 시간과 모델의 매개변수 공간 부분 모두에서 통계적으로 의미가 있는 것으로 나타났습니다(SI 부록, 섹션 S2.1 및 S6.6).

COMPATIBLE과 INCOMPATIBLE 사이의 임베딩 편향 기울기의 수치적 차이는 통계적으로 의미가 없었으며(SI 부록, 그림 S23), 두 실험 간의 모델 예측 인터셉트의 수치적 차이도 없었습니다(SI 부록, 그림 S6).

이전 읽기 시간 연구(총 n=501)의 증거를 수렴하려면 SI 부록, 섹션 S6을 참조하세요. 우리는 두 가지 평가 연구(총 n=335; SI 부록, 섹션 S5)에서 이해에 대한 편향 삽입 효과를 추가로 재현했습니다.

실험 3: 생산 연구

지금까지 우리는 읽기 시간에 대한 모델 예측을 확인했습니다. 읽기 시간에서 측정된 난이도는 인간의 기대가 위반되었음을 의미하지만 인간의 기대가 무엇인지 직접적으로 나타내지는 않습니다.

인간의 기대에 대한 두 번째 테스트를 제공하기 위해 우리는 언어 연구에서 서문 바로 다음에 어떤 단어가 예상되는지 평가하는 데 사용된 생산 패러다임인 Cloze 완성(40,41)으로 전환했습니다. 우리는 이 방법을 사용하여 다중 중첩 구조의 복잡성을 평가하고 복잡한 서문 다음에 인간이 예상하는 동사 수를 측정합니다.*

우리는 참가자들에게 "외교관인 의사가..."라는 양식의 맥락을 완전한 문장으로 완성하도록 요청했습니다. 우리는 참가자들이 "...불신이 치료한 환자를 치료했다"와 같이 세 개의 동사로 문법적 완성을 생성할 것으로 기대했습니다. 놀라운" 또는 "...신뢰할 수 없다는 것은 놀라운 일이었습니다."와 같이 동사 수가 더 적은 비문법적인 버전입니다. 자원-합리적 손실-맥락 놀라움은 임베딩 편향이 높은 명사(예: "사실")에 대해 이러한 비문법적 완성 비율이 낮아야 한다고 예측합니다. 이는 불완전한 메모리 표현에서 실제 컨텍스트를 더 쉽게 복구할 수 있도록 하기 때문입니다(그림 4A). 기존 기대 기반 모델과 메모리 기반 모델은 문법 완성률이 임베딩 편향에 따라 다르다는 것을 예측하지 않습니다.

improve cognitive function

80명의 참가자를 모집했습니다. 그림 4는 임베딩 편향의 함수로서 불완전 완성(동사 3개 미만) 비율을 보여줍니다. 예측한 대로, 비문법적 응답 비율에 임베딩 편향의 영향이 있었습니다(=−0.32, 95% CrI[−0.60, −0.05 ], P( > 0)=0.0123) 시행별 로지스틱 혼합 효과 분석에서.

우리는 이 연구를 센터 임베딩의 난이도가 영어(42)보다 상당히 약한 언어(독일어)를 포함하여 두 가지 추가 언어(스페인어 및 독일어)로 재현했습니다.

ways to improve your memory

스페인어에서는 덜 자연스러운 주어-초기 목적어 상대절을 피하기 위해 주어 상대절(el hechode que el Director que, "the Director who"라는 사실)을 목표로 삼았으며, 동시에 다른 구문 구성에 대한 일반화를 테스트했습니다. 독일어에서는 임베디드 구조(예: Klaus hat erzahlt, ¨dass die Behauptung, dass der Student, den der Professor, "Klaus는 학생이 교수라는 주장")를 목표로 삼았습니다. 영어 (35).

각 언어별로 60명의 참가자를 모집했습니다. 두 언어 모두 임베딩 비율의 효과는 음수로 추정되었으며 추정 효과 크기는 영어 결과(스페인어:=−0.23, 95% CrI [−{{7) }}.34, −0.12], P( > 0)< 0.0003; German: β = −0.28, 95% CrI [−0.56, −0.03], P(β > 0) = 0.01738). These results suggest that the-previously undocumented-effect of embedding bias on human expectations holds across different languages, even when they vary in the overall difficulty of center embeddings.

논의

우리는 현대 기계 학습 방법을 사용하여 임의 입력으로 확장된 자원 합리적 예측으로 인간 언어 처리 모델을 도입했습니다. 인간 구문 처리에 대한 기억 및 기대 기반 관점을 조화시키는 것을 목표로 하는 이 모델은 이전 이론이 올바른 경우 예측을 복구할 뿐만 아니라 이전에 문서화되지 않은 메모리 제한과 확률적 기대 사이의 상호 작용을 예측합니다. 이는 인간의 재귀 처리를 조사하는 세 가지 행동 실험에서 확인되었습니다. 구조.

우리의 결과는 기존 메모리 기반 모델(5, 7, 36)의 핵심인 긴 언어 종속성을 통합하는 데 있어 잘 문서화된 어려움이 확률적 기대에 의해 실질적으로 조정된다는 것을 보여줍니다. ONE 조건과 THREE 조건 간의 비교는 다음과 같은 것을 보여줍니다. 지역성 효과는 비지역적 구문 구조가 선험적 확률이 높을 때 약화되거나 심지어 역전될 수 있습니다. 이는 우리가 제안한 기억 및 기대 기반 관점의 통합에서 자연스럽게 떨어지는 예측입니다.

우리의 연구는 단일 실험과 단일 모델을 사용하여 심리언어학 문헌의 세 가지 주요 효과 계열, 즉 지역성 효과(세 가지의 난이도 증가), 예측 가능성 효과(ONE 조건에서 임베딩 편향 효과) 및 의미 간섭 효과(의미 호환성 효과)를 추가로 문서화합니다. ).

이러한 계열의 효과에 대한 통일된 이론적 처리에 상당한 관심이 있어 왔습니다. 우리의 작업은 단일 모델이 상호 작용하는 방식을 자세히 설명할 수 있는 방법을 보여줍니다. 우리 실험의 목표가 아닌 현상 그룹 중 하나는 유사성 기반 간섭입니다(43, 44). 이 모델링 프레임워크를 사용하여 설명할 수 있는지 여부를 조사하는 것은 향후 연구의 흥미로운 문제입니다.

우리의 자원 합리적 모델은 공식적으로 다양한 영역의 모델과 관련되어 있습니다. 고전 연구에서는 보유 확률에 대한 합리적인 분석이 인간 기억의 기본 속성을 설명할 수 있음을 보여주었습니다(28, 29). 최근 연구(45-48)는 시각적 작업 기억, 속도 왜곡 이론, 자원 제약 하에서 고충실도 인코딩을 도출하는 정보 이론 프레임워크 등 일부 영역에서 인간 작업 기억의 합리적 모델을 공식화했습니다.

속도 왜곡 이론과 우리 모델의 주요 차이점은 경제성의 척도가 여기에서 사용 가능한 단어의 비율인 반면 속도 왜곡 이론에서는 인코딩된 비트 수라는 것입니다. 문장 이해에 적용되는 비율 왜곡 이론은 과거 맥락에 대한 완전히 압축된 "요점" 표현으로 이어질 것입니다. 이러한 완전히 압축된 표현은 우리 실험에서 관찰된 난이도 패턴으로 이어지지 않습니다(자세한 내용은 SI 부록, 섹션 S8 참조).

반면에, 우리 모델은 최근 컨텍스트를 일련의 단어로 모델링한다는 점에서 단순화된 것이기도 합니다. 이는 개별 단어가 잊혀졌을 수 있지만 의미에 대한 기억은 남아 있는 더 긴 컨텍스트의 메모리 표현의 역할을 과소평가할 수 있습니다. 기계의 추가 발전 학습을 통해 자원 합리적 최적화로부터 보다 정교한 형식의 메모리 표현을 추론할 수 있습니다.

컴퓨터 과학에서 재귀 구조는 일반적으로 스택 기반 데이터 구조를 사용하여 처리됩니다. 이에 따라 인간 구문 처리의 초기 모델은 스택 크기 또는 동시에 메모리에 보관할 수 있는 노드 수에 대한 한계를 가정했습니다(2, 24).

이러한 모델은 더 깊은 임베딩이 더 어렵다고 예측하지만, 난이도가 통계적 또는 의미론적 단서에 의해 조정된다는 것을 예측하지는 않습니다. 스택 기반 아키텍처와 달리 우리의 이론은 재귀 구조를 설정하는 데 있어 확률적 단서에 중요한 역할을 할당합니다. 이러한 점에서 이는 인간이 스택과 같은 데이터 구조를 유지하지 않고 대신 연관 큐 기반 검색을 사용하여 구문 구조를 설정한다고 가정하는 보다 최근의 메모리 기반 이론에 동의합니다(5, 7, 49, 50). 현재 구현된 대로(7)는 모델에서 예측하고 실험에서 관찰한 독특한 난이도 패턴을 설명하지 않습니다. 그럼에도 불구하고 우리는 우리의 이론이 그 문헌의 아이디어와 양립할 수 있다고 생각합니다.

우리의 이론은 기존 메모리 기반 모델과 호환되는 예측을 만드는 계산 수준 모델을 제공하지만, 이러한 모델과는 달리 언어의 풍부한 통계 구조에 합리적으로 조정되어 메모리 제한이 확률적 기대와 어떻게 상호 작용하는지 예측할 수 있습니다. 우리의 결과는 여기에 설명된 자원 합리 모델의 알고리즘 수준 구현으로 연관 검색 모델의 확률적 버전을 식별하는 것이 심리언어학 연구에 대한 흥미로운 문제임을 시사합니다. 검색 기반 메모리 모델에 대한 결과의 의미에 대한 자세한 내용은 SI 부록, 섹션 S7.2를 참조하세요.

우리가 제안한 기대 기반 모델과 기억 기반 모델의 통합은 불완전한 작업 기억 표현이 언어 통계에 대한 지식을 때로는 부정확하게 사용하더라도 합리적으로 재구성된다는 아이디어에 기초합니다. 이 아이디어는 언어 작업 기억의 재통합에 대한 연구에서 중요한 선례를 가지고 있습니다. 예를 들어, 참고문헌 51-55), 저하된 단기 기억이 장기 기억의 지식을 사용하여 복원되는 과정입니다. 이는 단어 목록 메모리(예: 참조 52-55)에 적용되었으며, 최근에는 구문 패턴 메모리(56)에 적용되었습니다. 우리 모델은 자원 합리성에 의해 제한된 베이지안 추론에 기반을 둔 그러한 프로세스에 대한 설명을 제공합니다. 작업 기억이 자체 기억의 구성 요소가 아니라 처리와 장기 기억의 상호 작용에서 발생하는 것으로 간주되는 모델도 있습니다(57, 58). 이러한 모델의 경우, 우리의 결과는 장기 지식이 처리에 어떻게 영향을 미치는지에 대한 데이터를 제공합니다. .

우리의 실험은 확률적 기대가 메모리 제약 조건과 어떻게 상호 작용하는지 조사하기 위해 구문 구조의 통계적 상관 관계를 활용합니다. 이는 애니메이션과 상대절 유형 간의 상관 관계가 기존 메모리 기반 계정(예: 참조 59-61)에서 설명되지 않는 방식으로 처리에 어떻게 영향을 미치는지 보여주는 이전 작업 기대 기반 모델과 몇 가지 유사점을 갖습니다. 우리의 작업은 메모리 제약과 확률적 기대 사이의 상호 작용에 대한 구현된 이론을 명시함으로써 이러한 작업 라인을 확장합니다.

우리 모델에는 보유 단어의 평균 수인 자유 매개변수 δ가 있습니다. 우리는 예측을 도출하고 이를 인간의 독서 시간과 비교할 때 단일 값을 가정했습니다. 이를 개인 대상에 맞추고 개인차에 대한 확립된 척도와의 관계를 이해하는 것은 향후 연구의 흥미로운 문제입니다.

인간 구문 처리의 연결주의 모델(8, 62-64)은 신경망 표현에서 파생된 기대를 사용하여 인간 처리를 설명하는 것을 목표로 하며 메모리 제한 및 확률적 기대와 관련된 효과를 모델화하도록 제안되었습니다. 그러나 GPT-2에 의해 계산된 단순한 놀라움과 자원 합리적 손실 컨텍스트 놀라움 사이의 차이점은 인간과 같은 메모리 제한이 연결주의 모델에서 자동으로 나타날 필요가 없음을 보여줍니다.

우리는 자원 합리적 언어 처리 모델이 자연 언어의 풍부한 통계 구조로 어떻게 확장될 수 있는지 보여주었습니다. 우리의 기계 학습 기반 방법은 자연 입력 통계 및 기타 인간 인지 영역에 정교하고 합리적인 모델을 적용할 수 있는 문을 열 수 있습니다.

우리 모델의 일반성은 또한 유사한 현상이 언어 외부에도 존재할 수 있음을 시사합니다. 인간이 모든 부분을 동시에 처리하기에는 너무 복잡한 입력을 처리할 때마다 처리는 유사한 입력의 통계적 구조에 의해 영향을 받아야 합니다.

improve brain

재료 및 방법

명사. Penn Treebank(65), English Web Treebank(66), 스페인어의 AnCoRA treebank(67), 독일어의 HDT Treebank(68)를 사용하여 문장 보완을 취할 수 있는 명사를 수집했습니다. 영어 위키피디아(23억 단어), 독일어 위키피디아(8억 단어), 스페인어 위키피디아(5억 단어)를 사용하여 "the NOUN" 뒤에 "that"이 올 로그 확률로 임베딩 편향을 추정했습니다. 자세한 내용은 SI 부록, 섹션 S11을 참조하십시오. 우리는 미국 및 영국 영어의 다른 두 가지 대규모 코퍼스(SI 부록, 섹션 S10.1)를 사용하여 영어 추정치를 검증했습니다.

모델. 자원 합리적 손실 컨텍스트 놀라움은 보유 확률 θ={qw, i: i, w} 계열로 정의됩니다. 여기서 w는 단어 및 i=1, ..., N에 걸쳐 있으며 여기서 N은=20는 실험에 나타나는 모든 컨텍스트를 수용할 수 있을 만큼 충분히 긴 고려된 최대 컨텍스트 길이입니다. 우리는 과거 단어의 동일성과 중간 단어 수를 결합하는 신경망을 사용하여 qw를 매개변수화하여 보존을 출력합니다. 확률(SI 부록, 섹션 S1.1). 모델 θ는 우도 p(c|c)와 사후 p(c|c)를 발생시킵니다. 결과적인 다음 단어 사후 p(w|c)에 대한 평균 다음 단어 놀라움을 최소화하도록 선택됩니다.

improve working memory

독서 시간 연구를 위한 실험 설정. 모든 연구에 대해 실험 프로토콜은 StanfordUniversity의 Institutional Review Board에서 승인되었습니다. 모든 참가자로부터 사전 동의를 얻었습니다.

각 참가자에게는 10개의 중요한 시험이 제공되었습니다. 두 실험 모두에서 2번의 시도는 1번이었고, 4번의 시도는 각각 2번과 3번이었습니다. 실험 2에서는 2번과 3번의 실험 중 절반이 각각 COMPATIBLE(INCOMPATIBLE) 상태였습니다. 우리는 작업 중 중앙 임베딩에 대한 통계적 적응의 영향을 최소화하기 위해 소수의 중요한 시험을 선택했습니다.

통계적 정확성을 최대화하기 위해 임베딩 편향이 매우 높은 15개의 명사와 매우 낮은 임베딩 편향을 갖는 15개의 명사를 선택했습니다(SI 부록, 그림 S36). 각 참가자에 대해 우리는 임베딩 편향이 높은 명사 5개와 값이 낮은 명사 5개를 샘플링하여 이를 10개의 중요한 시험과 일치시켰습니다. 각 참가자에 대해 우리는 또한 센터 임베딩(42)에 대한 이전 읽기 시간 연구에서 56개 필러 풀에서 30개 필러를 샘플링했습니다.

전제 위반(예: "사실이 틀렸다")으로 인한 의미 이상을 제거하기 위해 명사를 수반(예: "사실"), 비수반 중립(예: "주장") 및 비수반 부정(예: " 비난") 명사 및 이 세 가지 클래스 각각과의 호환성을 위해 분류된 항목입니다(SI 부록, 섹션 S11). 각 참가자에 대해 우리는 10개의 명사를 의미상 호환되는 항목과 연결했습니다.

미로 작업의 경우 Gulordava 언어 모델(69)을 사용하여 자동으로 선택 항목(39)을 생성했습니다. 이러한 선택 항목은 빈도 및 길이에서 대상 단어와 일치하는 동안 문맥 확률이 매우 낮습니다. 선택 항목은 두 번째 항목 내를 제외하고 조건에 따라 일치되었습니다. -실험 2의 (IN)COMPATIBLE 조건의 마지막 동사구. 특히, 모든 조건에서 중요한 단어에 선택 항목이 일치했습니다.

참가자가 실수를 했을 때(즉, 주의를 끄는 단어를 선택했을 때) 현재 단어를 다시 시도하라는 메시지가 표시되었습니다(70). 그러한 시험에 대한 반응 시간은 제외되었습니다. 이 선택은 결론에 영향을 미치지 않았습니다(SI 부록, 섹션 S3.6).

각 주제에 대해 임상시험은 두 개의 중요한 임상시험이 인접하지 않도록 무작위 순서로 제시되었습니다. Prolific 학술 플랫폼에 모집된 참가자들은 중앙값 13분을 획득하고 £2.20(약 3 USD)를 받았습니다.

독서 시간에 대한 데이터 분석. 우리는 1) 정답이 틀린 시험, 2) 단어의 20% 이상에서 오류를 범한 참가자, 3) 전체 읽기 시간의 99% 미만 또는 그 이상의 시험을 제외했습니다. 조건 1에 대한 견고성은 SI 부록, 섹션 S3.6을 참조하고, 조건 3에 대한 견고성은 SI 부록, 섹션 S3.7을 참조하십시오. 그런 다음 Stan(71)에서 구현된 최종 동사 표현 베이지안 혼합 효과 모델에 대한 로그 변환 읽기 시간을 분석했습니다. 무기 사용(72). 사전 선택 및 사전 선택에 대한 견고성에 대해서는 SI 부록, 섹션 S3.3을 참조하십시오. 우리는 "that" 절(ONE 대 TWO/THREE), 깊이(TWO 대 THREE) 및 호환성 조작(COMPATIBLE 대 INCOMPATIBLE)이 있는 대비 코딩을 대조로 사용했습니다. 임베딩 편향이 중심에 있었고 모든 비공공 이진 상호 작용이 고정 효과로 추가되었습니다(SI 부록, 섹션 S3.2).

실험 설계에 의해 정당화되는 최대 무작위 효과 구조를 포함하고 항목, 명사 및 참가자를 무작위 효과로 입력했습니다. 원시 읽기 시간(밀리초)의 효과를 추정하기 위해 먼저 두 조건(예: COMPATIBLE 및 INCOMPATIBLE)에서 예측된 로그 변환 읽기 시간을 계산한 다음 지수화하여 두 조건을 밀리초로 변환하고 차이를 계산했습니다(SI 부록, 섹션 S3.4 참조). 자세한 내용은) 그림 3에서는 "사실" 또는 "보고"와 일치하는 바이어스가 포함된 명사에 대한 모든 조건에서 예상 읽기 시간의 사후 평균을 표시합니다. 오류 막대는 후방 SD를 나타냅니다.

생산 연구에 대한 세부 사항. 우리는 "The XXXthat the 외교관이자 상원의원" 형식의 28개 항목을 구성하고 임베딩 편향이 매우 높거나 매우 낮은 명사 6개를 포함한 12개의 명사를 선택했습니다. 각 참가자에 대해 항목과 명사를 무작위로 쌍으로 연결했습니다. 12개의 중요한 시험은 27개의 필러를 사용하여 무작위 순서로 제시되었습니다. 언어학자는 제공된 각 완성에 대해 올바른 수의 동사구(3개)가 생성되었는지 수동으로 주석을 달았습니다. 주석자는 명사의 정체성을 알지 못했습니다.

스페인어와 독일어에서는 각 언어에서 매우 높거나 매우 낮은 임베딩 편향을 갖는 명사 20개를 선택했으며, 각 참가자에 대해 6개의 높은 임베딩 편향 명사와 6개의 낮은 임베딩 편향 명사를 샘플링했습니다. 영어 버전에서와 마찬가지로 각 참가자에 대해 12개의 항목을 12개의 샘플링 명사와 무작위로 연결했습니다. 필러는 영어 실험에서 번역되었습니다.

독일어에서는 12개의 행렬 문장(예: "Klaus Saidthat")을 추가로 구성하고 이를 각 참가자의 항목 및 명사와 무작위로 일치시켰습니다. 고정 효과로 편향을 삽입하는 베이지안 시행별 로지스틱 혼합 효과 분석을 수행했습니다. , 명사, 항목, 참가자 및 (독일어) 행렬 문장의 무작위 효과. 자세한 내용은 SI 부록, 섹션 S4를 참조하세요.

데이터, 자료 및 소프트웨어 가용성. 적합 유지 확률 및 모델 예측은 Zenodo(https://zenodo.org/record/6602698)(73), (https://zenodo.org/record/6988696)(74)에 기탁되어 있습니다. 익명화된 독서 시간, 언어 생성 데이터, 소스 코드가 GitLab(https://gitlab.com/m-hahn/resource-rational-surprisal)(75)에 보관되어 있습니다.

감사의 말씀. 원고를 개선하는 데 도움이 되는 건설적인 피드백을 주신 편집자와 검토자에게 감사드립니다. 또한 유용한 토론과 피드백을 주신 Judith Degen, Tiwalayo Eisape, Hailin Hao, Jennifer Hu, Dan Jurafsky, PengQian, Cory Shain, Shravan Vasishth, Tom Wasow, Ethan Wilcox 및 2020 CUNY 문장 처리 컨퍼런스의 청중에게도 감사드립니다.

improve memory


참조

1. N. Chomsky, 구문 구조(Mouton, The Hague, 1957).

2. GA Miller, N. Chomsky, 수학적 심리학 핸드북의 "언어 사용자의 유한 모델", RD Luce, RR Bush, G. Galanter, Eds. (John Wiley, 1963), pp. 269–321.

3. L. Frazier, 자연어 구문 분석의 "구문적 복잡성": 심리적, 계산적, 이론적 관점, DR Dowty, L. Karttunen, AM Zwicky, Eds. (Cambridge University Press, NewYork, 1985), pp. 129-189.
4. E. Gibson, 언어적 복잡성: 구문적 종속성의 지역성. 인지 68, 1–76 (1998).

5. B. McElree, S. Foraker, L. Dyer, 문장 이해를 보조하는 기억 구조.J. Mem.Lang. 48, 67–91 (2003).

6. W. Tabor, B. Galantucci, DC Richardson, 문장 처리에 대한 단지 지역적 구문 일관성의 효과.J. 기억. 랭. 50, 355–370 (2004).

7. RL Lewis, S. Vasishth, 숙련된 기억 검색으로서 문장 처리의 활성화 기반 모델.Cogn. 과학. 29, 375–419 (2005).

8. MH Christiansen, MC MacDonald, 문장 처리의 재귀에 대한 사용 기반 접근 방식.Lang. 배우다. 59, 126–161 (2009).

9. J. Hale, (2001) "심리언어학 모델로서의 확률론적 초기 파서", 전산 언어학 협회 북미 지부 2차 회의 회보, NAACL 2001,L. 레빈, K. 나이트, Eds. (전산 언어학 협회, 펜실베니아주 스트로즈버그), pp. 1–8.

10. R. Levy, 기대 기반 구문 이해. 인지 106, 1126-1177(2008).

11. K. Rayner, AD 음, 읽기 시 눈 움직임에 대한 상황적 제약의 효과: 추가 조사. 사이콘. 황소. 개정 3, 504–509(1996).

12. A. Staub, 읽기 시 눈 움직임에 대한 어휘 예측 가능성의 효과: 비판적 검토 및 이론적 해석.Lang. 언어학자. 나침반 9, 311–327(2015).


For more information:1950477648nn@gmail.com



당신은 또한 좋아할지도 모릅니다