Offcanvas

라이프 / 머신러닝|딥러닝 / 애플리케이션

무하유, "자소서 데이터 123만 건 분석해보니, 47%가 표절"

2022.04.07 편집부  |  CIO KR
무하유가 자사 인공지능(AI) 채용 솔루션 ‘프리즘’(service.prism.work/)이 지난 한 해 검토한 123만 건의 자기소개서 데이터를 분석한 결과를 공개했다. 글자수 미달·회사명 오기재 등의 ‘결함’은 39%, ‘블라인드 위반’은 37%, 그리고 ‘30% 이상 표절’한 자기소개서도 47%에 달했다.
 

무하유는 2011년 출시한 논문 표절 검사 솔루션 ‘카피킬러’를 통해 자연어처리(NLP) 노하우를 쌓아왔다. 이를 통해 단순 매칭이 아닌 자기소개서의 문맥까지 읽어내는 AI를 통해 결함, 블라인드, 표절은 물론 업무 적합성까지 평가하는 채용 솔루션 ‘프리즘’을 개발했다.

채용담당자 육안으로는 알아채지 못하는 표절과 구직자들 또한 놓치기 쉬운 오기재, 반복 기재, 블라인드 위반 요소까지 프리즘은 검출할 수 있다. 사람이 자기소개서를 검토하는 평균 시간은 ‘10분’인 반면 프리즘의 AI는 평균 ‘8초’로 줄였다.

회사에 따르면 현재 민간부터 공공 영역에서 270여 곳의 기업이 프리즘을 이용 중이다. 프리즘은 채용 1회 당 평균 3,000건 내외, 작년 한 해에만 123만 건이 넘는 문서를 검토했다. 이를 분석한 결과 결함은 39%, 블라인드 위반 37%, 그리고 30% 이상의 표절률을 보인 자기소개서도 47%에 달했다.

결함 검사에서 ‘반복 단어’, ‘반복 문항’, ‘글자수’ 이 세 가지는 1건만 적발이 되어도 탈락 처리하는 ‘중대결함’으로 기업들이 많이 선정하는 요소다. 실제 123만 건 중 39%가 검출된 ‘결함’ 중 글자수 미달이 26%로 가장 많았고, 반복 문항도 13%로 나왔다. 한 은행 검사 문서 1만2,256건 중 중대 결함이 포함된 문서의 비율이 70%에 육박하기도 했다. 그 외 회사명 오기재(13%), 타기업 지원(11%) 등도 많이 발견됐다.

많은 기업들이 도입한 블라인드 평가에서 또한 37%의 자기소개서가 위반 요소를 포함하고 있었다. 블라인드에서 중대결함은 출신 대학교, 지원자 이름, 가족 직업 세 가지가 많이 꼽힌다. 이 중 지원자 이름을 노출한 경우가 40%로 가장 많았고, 성별을 노출한 경우가 31%, 그 외 가족 직업도 13%가 검출됐다. 오히려 출신 대학명은 0.9%로 비교적 적었다.

한 연구원 검사 문서 수 209건 중 중대결함이 포함된 문서의 비율이 86% 이상 나오기도 했다. 특히 군복무 키워드는 지원자들도 미처 생각하지 못하고 쓰는 사례 중 하나다. 블라인드 채용 시 성별을 드러내면 안되기 때문에 ‘전문 연구 요원’, ‘병장’, ‘병역 특례’ 등의 키워드는 모두 프리즘에 의해 검출된다.

자기소개서는 글자수가 많지 않고, 쓸 수 있는 표현이나 내용이 한정적이어서 논문이나 보고서(표절률 15~20% 이상일 때 위험)에 비해 기업의 경우 30~50% 수준으로 표절률 기준이 낮은 편이다. 그럼에도 프리즘 데이터 123만 건 중 47%의 자기소개서가 표절률 30% 이상을 보였다. 잡포털 합격 자기소개서, 인터넷 기사, 기업 홈페이지 등이 지원자가 많이 표절하는 문서로 꼽힌다. 특히 지원 기업 홈페이지의 설명글을 본인의 생각과 판단인 것처럼 기재하는 것도 표절로, 프리즘에 의해 검출됐다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.