몇 가지 쓸만한, 어쩌면 쓸모없는 source files


개요
몇 가지 쓸만한, 어쩌면 쓸모없는 source files

파일을 다운로드 받으려면 여기를 누르세요

한국어 정보처리를 하면서 쓸모있는 몇 가지 utility들을 올려 놓았습니다.
각 file들이 어떨 때 유용한지는 아래와 같습니다.

sortchk.c

	line별로 sort되어 있는 한글 data file에서 sort 순서 및 동일한
	data가 2번 이상 반복되는지를 검사하는 program

unify.c

	'sortchk.c'에 의하여 동일한 data가 중복되어 있는 경우에 하나만
	남기고 나머지는 제거하는 program

nwords.c

	한 line에 한 단어씩 나열되어 있는 file을 출력하면 page 수가
	많아져서 곤란하다. 이런 경우에 한 line에 여러 개의 data를
	나열해 주는 program
	즉, 한글 wordprocessor에서 다단 편집 기능과 유사하다.

head.c, tail.c, split.c

	unix에 있는 head, tail, split 명령을 DOS에서 쓸 수 있도록 짠 program


한국어 형태소 분석기