유틸리티 소개

텍스트에서 중복 줄 제거하고 고유한 줄만 남기는 방법

로그 파일이나 데이터에서 중복된 줄을 제거하고 고유한 값만 남기고 싶을 때가 있습니다. 다양한 방법을 알아봅니다.

온라인 도구

텍스트 변환기에서 중복 제거 기능을 사용하면 한 번에 처리됩니다. 순서 유지 옵션도 있습니다.

명령줄

Linux: sort file.txt | uniq. 정렬 후 중복 제거. 순서 유지하려면 awk를 사용합니다.

프로그래밍

Python: list(dict.fromkeys(lines)) 또는 set(lines). Set은 순서를 보장하지 않습니다.

Excel

데이터 > 중복 제거 기능을 사용합니다. 또는 UNIQUE() 함수(Excel 365)를 사용합니다.

주의

대소문자, 공백 차이로 중복으로 인식되지 않을 수 있습니다. 전처리가 필요할 수 있습니다.

프로그래밍과 텍스트 변환

프로그래밍에서 문자열 처리는 가장 기본적이면서도 중요한 영역입니다. 사용자 입력을 받아 처리하거나, 외부 API와 통신하거나, 데이터베이스에 저장할 때 항상 텍스트 변환이 필요합니다. 잘못된 처리는 보안 취약점이나 버그로 이어질 수 있습니다.

텍스트 변환기로 변환 결과를 미리 확인하면 코드 작성 시 참고할 수 있습니다. 특히 이스케이프 처리나 인코딩 변환은 규칙이 복잡해서, 도구를 사용해 검증하는 것이 좋습니다.

다양한 텍스트 형식의 이해

JSON, XML, CSV, HTML 등 텍스트 기반 데이터 형식은 각각 고유한 규칙을 가지고 있습니다. 한 형식에서 다른 형식으로 변환할 때는 이런 규칙을 정확히 이해하고 적용해야 합니다. 온라인 변환 도구는 이런 변환 작업을 정확하게 수행하는 데 도움이 됩니다.

특히 특수문자 처리는 형식마다 다릅니다. HTML에서는 앰퍼샌드를 엔티티로 변환해야 하고, JSON에서는 따옴표를 이스케이프해야 합니다. 이런 세부 규칙을 모두 외우기는 어렵기 때문에 적절한 도구를 활용하는 것이 현명합니다.