RAW CORPORA

  5. SEJONG-7R
DICORA
2016-03-28 | | 조회 422 | 댓글0


5. CORPUS NAME: SEJONG-7R (7 RAW COPORA)


SEJONG-7R consists of 2 types:


- 5 TYPES OF SMALL CORPORA


    [1] CREATIVE WRITING - 25,000 Tokens {Integrated In UNITEX System}

    [2] ENJOYING MOVIES - 32,000 Tokens

    [3] THE BOY PLAYING A FLUTE - 36,000 Tokens

    [4] NGO GOVERNMENT POLICY - 49,000 Tokens

    [5] THE SCENT OF PEOPLE - 32,000 Tokens


- 2 TYPES OF COMPOSED CORPORA


    [6] SEJONG-WRITTEN-CORPUS-150,000 Tokens

    [7] SEJONG-SPOKEN-CORPUS-150,000 Tokens

 

세종 말뭉치에서 발췌한 작은 사이즈의 {5가지 코퍼스 모음 }& 연구용으로 재구성한 {복합 코퍼스 15만 사이즈 (문어코퍼스 & 구어코퍼스) 2가지}를 포함하여 전체 7개의 파일을 내장하고 있음. 

 

Copyright © 2015 DICORA-HUFS KOREA (SEJONG-7R)

 

첨부파일 1-Creative_writing-NF-25000.txt (195.87KB) [7] 2016-03-31 00:35:16
첨부파일 2-Enjoying_Movies-NF-32000.txt (255.25KB) [1] 2016-03-31 00:35:16
첨부파일 3-The_boy_playing_a_flute-F-36000.txt (288.47KB) [2] 2016-03-31 00:35:16
첨부파일 4-NGO_Government_Policy-49000.txt (454.97KB) [1] 2016-03-31 00:35:16
첨부파일 5-The_scent_of_people-F-32000.txt (262.74KB) [2] 2016-03-31 00:35:16
첨부파일 SejongWritten-subtotal01-150000.txt (1.36MB) [27] 2016-04-03 20:54:31
첨부파일 SejongSpoken-subtotal01-150000.txt (1.44MB) [11] 2016-04-03 20:54:31
이전글다음글
리스트