제2기 코퍼스언어학학교 강좌 소개
AntConc입문
시간: 2023년 8월 18일(금) 9:30-12:00
강사: 최지명 (연세대학교)
강좌 소개: 본 강의에서는 코퍼스 활용 도구 중의 하나인 AntConc(ver.4.x)의 기초 사용법에 대해 학습을 하게 됩니다. AntConc는 코퍼스를 활용하기 위한 도구인 Concordancer 중 하나로, 영어와 같은 알파벳 기반 언어 외에 한국어, 일본어 등의 아시아 언어를 다룰 수 있고, 윈도우즈 시스템 외에 맥이나 리눅스 시스템에서도 작동 가능하여 다양한 환경의 연구자들이 쉽게 활용할 수 있습니다. 코퍼스를 이용한 연구는 1) 정제된 코퍼스를 구축하고, 2) 코퍼스 데이터에 접근하여 정보를 추출한 후, 3) 추출한 정보를 정제, 비교 등의 과정을 통해 함의를 얻는 과정으로 진행됩니다. 본 강의에서는 2)의 가장 기본적인 사항에 초점을 맞추게 됩니다. 2)의 단계에서 추출하는 기본적인 정보의 종류에는 어휘 빈도(word frequency), 사용 맥락(usage context), 연어 정보(collocation), 키워드(keywords) 등이 있습니다. 이 정보들은 AntConc의 여러 기능을 통해 쉽게 추출할 수 있습니다.
준비된 코퍼스 데이터 둘러보기
AntConc 설치 및 메뉴 둘러보기
영어와 한국어 텍스트를 다루기 위한 설정하기
각 기능별 정보 추출해 보고 정보 저장하기
AntConc를 이용한 한국어 코퍼스분석
시간: 2023년 8월 19일(토) 9:30-12:00
강사: 김한샘 (연세대학교)
강좌 소개: 이 강좌는 AntConc를 활용하여 한국어 말뭉치를 분석하는 실습을 수행하는 것을 목적으로 한다. 실습에 사용할 말뭉치는 모어화자 한국어 말뭉치인 새연세말뭉치의 문어 및 구어 말뭉치와 국립국어원의 한국어 학습자 말뭉치이다. 새연세말뭉치를 분석해 문법 범주 표지를 비롯한 특징적 언어 표현을 추출하여 비교함으로써 한국어 문어와 구어의 매체 레지스터 차이를 확인하고, 한국어의 형태적, 통사적, 의미적 특성을 말뭉치 기반으로 기술하는 데에 AntConc를 활용하기 위한 기초를 익힌다. 한국어 학습자 말뭉치는 말뭉치를 생산한 학습자의 모어, 숙달도에 따라 다르게 나타나는 언어 양상을 분석하는 데에 활용된다. 한국어 학습자 말뭉치는 주석을 가하지 않은 원시 말뭉치, 단어 및 형태소 단위에 주석을 부착한 형태 주석 말뭉치, 교정 표현과 함께 오류의 위치, 오류 양상, 오류 층위를 주석한 오류 주석 말뭉치로 구성되어 있다. 한국어 학습자 말뭉치의 각 주석의 특성을 파악하고 단계별 말뭉치를 연구하기 위해 AntConc를 활용하기 위한 기본적인 방법을 익힌다.
R 통계 입문
시간: 2023년 8월 19일(금) 13:00-15:30
강사: 이용철 (한남대학교)
강좌 소개: R은 통계 분석 및 데이터 시각화에 널리 사용되는 프로그래밍 언어이며, 이를 활용하여 다양한 통계 분석을 수행할 수 있습니다. 본 강의는 R을 처음 접하는 학습자를 대상으로 하며, R의 기본 설치 및 사용법부터 기초 통계 분석까지 포괄적으로 다룰 예정입니다. 먼저, 강의 초반부에는 R을 설치하는 방법을 배우고 다음으로는 R을 통해 통계 분석을 수행하는 방법을 학습합니다. R을 사용하여 데이터를 불러오고, 분석하고자 하는 데이터가 정규 분포를 따르는지 정규성 검정하는 방법을 살펴보고자 합니다. 이어서 chi-square test, t-test, ANOVA test와 같은 통계 분석 방법을 학습합니다. Chi-square test는 범주형 데이터 간의 관계를 검정하고, t-test는 두 집단 간의 평균 차이를 검정하며, ANOVA test는 두 개 이상 다수의 집단을 비교할 때 사용됩니다. 본 강의에서는 각 통계 분석 방법에 대해 R의 함수 작성 및 사용법에 대해 차근차근 진행할 계획입니다.
R을 이용한 논문 작성법
시간: 2023년 8월 20일(토) 13:30-15:30
강사: 이용훈 (충남대학교)
강좌 소개: 본 강좌에서는 ‘R 통계 입문’의 내용을 바탕으로 코퍼스언어학에서 통계적인 분석을 어떻게 논문에 반영하는 지를 구체적으로 배운다. 첫 번째 파트에서는 통계분석에 대한 기본 지식들과 함께 실제 코퍼스데이터를 가지고 그 데이터에 적합한 통계분석 방법을 어떻게 선택하는 지를 살펴본다. 두 번째 파트에서는 실제 출판된 논문들 몇 편을 살펴보면서, 그 논문들에서는 어떠한 통계방법이 쓰이었고, 왜 그러한 통계방법이 선택되었으며, 통계분석의 결과가 어떻게 제시되었는지를 살펴본다.
언어학자를 위한 Python 입문
시간: 2023년 8월 18일(금) 15:45-18:15
강사: 이공주(충남대학교)
강좌 소개: 본 강좌는 언어학자를 위한 Python 입문으로 Python의 기본 문법을 배운다. 구체적으로는 (1) Python을 설치하는 법, (2) 기본연산자, 입출력, 조건문, (3) 반복문, 리스트, (4) 스트링, (5) 함수, 클래스 등이 포함된다.
Python을 이용한 코퍼스 분석
시간: 2023년 8월 19일(토) 15:45-18:15
강사: 이공주(충남대학교)
강좌 소개: 본 강좌는 Python을 이용하여 어떻게 코퍼스분석을 수행하는 지에 대하여 학습한다. 구체적으로는 (1) 파일 및 디렉토리, (2) 딕셔너리, (3) 정규식, (4) 코퍼스로부터 데이터 추출 등이 포함된다.
시간: 2023년 8월 18일(금) 9:30-12:00
강사: 최지명 (연세대학교)
강좌 소개: 본 강의에서는 코퍼스 활용 도구 중의 하나인 AntConc(ver.4.x)의 기초 사용법에 대해 학습을 하게 됩니다. AntConc는 코퍼스를 활용하기 위한 도구인 Concordancer 중 하나로, 영어와 같은 알파벳 기반 언어 외에 한국어, 일본어 등의 아시아 언어를 다룰 수 있고, 윈도우즈 시스템 외에 맥이나 리눅스 시스템에서도 작동 가능하여 다양한 환경의 연구자들이 쉽게 활용할 수 있습니다. 코퍼스를 이용한 연구는 1) 정제된 코퍼스를 구축하고, 2) 코퍼스 데이터에 접근하여 정보를 추출한 후, 3) 추출한 정보를 정제, 비교 등의 과정을 통해 함의를 얻는 과정으로 진행됩니다. 본 강의에서는 2)의 가장 기본적인 사항에 초점을 맞추게 됩니다. 2)의 단계에서 추출하는 기본적인 정보의 종류에는 어휘 빈도(word frequency), 사용 맥락(usage context), 연어 정보(collocation), 키워드(keywords) 등이 있습니다. 이 정보들은 AntConc의 여러 기능을 통해 쉽게 추출할 수 있습니다.
준비된 코퍼스 데이터 둘러보기
AntConc 설치 및 메뉴 둘러보기
영어와 한국어 텍스트를 다루기 위한 설정하기
각 기능별 정보 추출해 보고 정보 저장하기
AntConc를 이용한 한국어 코퍼스분석
시간: 2023년 8월 19일(토) 9:30-12:00
강사: 김한샘 (연세대학교)
강좌 소개: 이 강좌는 AntConc를 활용하여 한국어 말뭉치를 분석하는 실습을 수행하는 것을 목적으로 한다. 실습에 사용할 말뭉치는 모어화자 한국어 말뭉치인 새연세말뭉치의 문어 및 구어 말뭉치와 국립국어원의 한국어 학습자 말뭉치이다. 새연세말뭉치를 분석해 문법 범주 표지를 비롯한 특징적 언어 표현을 추출하여 비교함으로써 한국어 문어와 구어의 매체 레지스터 차이를 확인하고, 한국어의 형태적, 통사적, 의미적 특성을 말뭉치 기반으로 기술하는 데에 AntConc를 활용하기 위한 기초를 익힌다. 한국어 학습자 말뭉치는 말뭉치를 생산한 학습자의 모어, 숙달도에 따라 다르게 나타나는 언어 양상을 분석하는 데에 활용된다. 한국어 학습자 말뭉치는 주석을 가하지 않은 원시 말뭉치, 단어 및 형태소 단위에 주석을 부착한 형태 주석 말뭉치, 교정 표현과 함께 오류의 위치, 오류 양상, 오류 층위를 주석한 오류 주석 말뭉치로 구성되어 있다. 한국어 학습자 말뭉치의 각 주석의 특성을 파악하고 단계별 말뭉치를 연구하기 위해 AntConc를 활용하기 위한 기본적인 방법을 익힌다.
R 통계 입문
시간: 2023년 8월 19일(금) 13:00-15:30
강사: 이용철 (한남대학교)
강좌 소개: R은 통계 분석 및 데이터 시각화에 널리 사용되는 프로그래밍 언어이며, 이를 활용하여 다양한 통계 분석을 수행할 수 있습니다. 본 강의는 R을 처음 접하는 학습자를 대상으로 하며, R의 기본 설치 및 사용법부터 기초 통계 분석까지 포괄적으로 다룰 예정입니다. 먼저, 강의 초반부에는 R을 설치하는 방법을 배우고 다음으로는 R을 통해 통계 분석을 수행하는 방법을 학습합니다. R을 사용하여 데이터를 불러오고, 분석하고자 하는 데이터가 정규 분포를 따르는지 정규성 검정하는 방법을 살펴보고자 합니다. 이어서 chi-square test, t-test, ANOVA test와 같은 통계 분석 방법을 학습합니다. Chi-square test는 범주형 데이터 간의 관계를 검정하고, t-test는 두 집단 간의 평균 차이를 검정하며, ANOVA test는 두 개 이상 다수의 집단을 비교할 때 사용됩니다. 본 강의에서는 각 통계 분석 방법에 대해 R의 함수 작성 및 사용법에 대해 차근차근 진행할 계획입니다.
R을 이용한 논문 작성법
시간: 2023년 8월 20일(토) 13:30-15:30
강사: 이용훈 (충남대학교)
강좌 소개: 본 강좌에서는 ‘R 통계 입문’의 내용을 바탕으로 코퍼스언어학에서 통계적인 분석을 어떻게 논문에 반영하는 지를 구체적으로 배운다. 첫 번째 파트에서는 통계분석에 대한 기본 지식들과 함께 실제 코퍼스데이터를 가지고 그 데이터에 적합한 통계분석 방법을 어떻게 선택하는 지를 살펴본다. 두 번째 파트에서는 실제 출판된 논문들 몇 편을 살펴보면서, 그 논문들에서는 어떠한 통계방법이 쓰이었고, 왜 그러한 통계방법이 선택되었으며, 통계분석의 결과가 어떻게 제시되었는지를 살펴본다.
언어학자를 위한 Python 입문
시간: 2023년 8월 18일(금) 15:45-18:15
강사: 이공주(충남대학교)
강좌 소개: 본 강좌는 언어학자를 위한 Python 입문으로 Python의 기본 문법을 배운다. 구체적으로는 (1) Python을 설치하는 법, (2) 기본연산자, 입출력, 조건문, (3) 반복문, 리스트, (4) 스트링, (5) 함수, 클래스 등이 포함된다.
Python을 이용한 코퍼스 분석
시간: 2023년 8월 19일(토) 15:45-18:15
강사: 이공주(충남대학교)
강좌 소개: 본 강좌는 Python을 이용하여 어떻게 코퍼스분석을 수행하는 지에 대하여 학습한다. 구체적으로는 (1) 파일 및 디렉토리, (2) 딕셔너리, (3) 정규식, (4) 코퍼스로부터 데이터 추출 등이 포함된다.