Offcanvas

������

무하유, "자소서 데이터 123만 건 분석해보니, 47%가 표절"

무하유가 자사 인공지능(AI) 채용 솔루션 ‘프리즘’(service.prism.work/)이 지난 한 해 검토한 123만 건의 자기소개서 데이터를 분석한 결과를 공개했다. 글자수 미달·회사명 오기재 등의 ‘결함’은 39%, ‘블라인드 위반’은 37%, 그리고 ‘30% 이상 표절’한 자기소개서도 47%에 달했다.   무하유는 2011년 출시한 논문 표절 검사 솔루션 ‘카피킬러’를 통해 자연어처리(NLP) 노하우를 쌓아왔다. 이를 통해 단순 매칭이 아닌 자기소개서의 문맥까지 읽어내는 AI를 통해 결함, 블라인드, 표절은 물론 업무 적합성까지 평가하는 채용 솔루션 ‘프리즘’을 개발했다. 채용담당자 육안으로는 알아채지 못하는 표절과 구직자들 또한 놓치기 쉬운 오기재, 반복 기재, 블라인드 위반 요소까지 프리즘은 검출할 수 있다. 사람이 자기소개서를 검토하는 평균 시간은 ‘10분’인 반면 프리즘의 AI는 평균 ‘8초’로 줄였다. 회사에 따르면 현재 민간부터 공공 영역에서 270여 곳의 기업이 프리즘을 이용 중이다. 프리즘은 채용 1회 당 평균 3,000건 내외, 작년 한 해에만 123만 건이 넘는 문서를 검토했다. 이를 분석한 결과 결함은 39%, 블라인드 위반 37%, 그리고 30% 이상의 표절률을 보인 자기소개서도 47%에 달했다. 결함 검사에서 ‘반복 단어’, ‘반복 문항’, ‘글자수’ 이 세 가지는 1건만 적발이 되어도 탈락 처리하는 ‘중대결함’으로 기업들이 많이 선정하는 요소다. 실제 123만 건 중 39%가 검출된 ‘결함’ 중 글자수 미달이 26%로 가장 많았고, 반복 문항도 13%로 나왔다. 한 은행 검사 문서 1만2,256건 중 중대 결함이 포함된 문서의 비율이 70%에 육박하기도 했다. 그 외 회사명 오기재(13%), 타기업 지원(11%) 등도 많이 발견됐다. 많은 기업들이 도입한 블라인드 평가에서 또한 37%의 자기소개서가 위반 요소를 포함하고 있었다. 블라인드에서 중대결함은 출신 대학교, 지원자 이름, 가족 직업 세 가지가 많이 ...

무하유 자기소개서 채용 표절 자연어처리

2022.04.07

무하유가 자사 인공지능(AI) 채용 솔루션 ‘프리즘’(service.prism.work/)이 지난 한 해 검토한 123만 건의 자기소개서 데이터를 분석한 결과를 공개했다. 글자수 미달·회사명 오기재 등의 ‘결함’은 39%, ‘블라인드 위반’은 37%, 그리고 ‘30% 이상 표절’한 자기소개서도 47%에 달했다.   무하유는 2011년 출시한 논문 표절 검사 솔루션 ‘카피킬러’를 통해 자연어처리(NLP) 노하우를 쌓아왔다. 이를 통해 단순 매칭이 아닌 자기소개서의 문맥까지 읽어내는 AI를 통해 결함, 블라인드, 표절은 물론 업무 적합성까지 평가하는 채용 솔루션 ‘프리즘’을 개발했다. 채용담당자 육안으로는 알아채지 못하는 표절과 구직자들 또한 놓치기 쉬운 오기재, 반복 기재, 블라인드 위반 요소까지 프리즘은 검출할 수 있다. 사람이 자기소개서를 검토하는 평균 시간은 ‘10분’인 반면 프리즘의 AI는 평균 ‘8초’로 줄였다. 회사에 따르면 현재 민간부터 공공 영역에서 270여 곳의 기업이 프리즘을 이용 중이다. 프리즘은 채용 1회 당 평균 3,000건 내외, 작년 한 해에만 123만 건이 넘는 문서를 검토했다. 이를 분석한 결과 결함은 39%, 블라인드 위반 37%, 그리고 30% 이상의 표절률을 보인 자기소개서도 47%에 달했다. 결함 검사에서 ‘반복 단어’, ‘반복 문항’, ‘글자수’ 이 세 가지는 1건만 적발이 되어도 탈락 처리하는 ‘중대결함’으로 기업들이 많이 선정하는 요소다. 실제 123만 건 중 39%가 검출된 ‘결함’ 중 글자수 미달이 26%로 가장 많았고, 반복 문항도 13%로 나왔다. 한 은행 검사 문서 1만2,256건 중 중대 결함이 포함된 문서의 비율이 70%에 육박하기도 했다. 그 외 회사명 오기재(13%), 타기업 지원(11%) 등도 많이 발견됐다. 많은 기업들이 도입한 블라인드 평가에서 또한 37%의 자기소개서가 위반 요소를 포함하고 있었다. 블라인드에서 중대결함은 출신 대학교, 지원자 이름, 가족 직업 세 가지가 많이 ...

2022.04.07

김진철의 How-to-Big Data | 빅데이터 조직과 시스템 (4)

지금까지 필자의 기고문은 각 회 전반부는 CERN과 LHC 실험의 현황과 실제 사례를 소개하고, 글의 후반부에 이 사례가 빅데이터 비즈니스에 주는 시사점을 논의하는 방식이었다. 필자가 약속한 빅데이터 조직과 시스템, 데이터 과학자 인력 채용과 운용에 관련된 추가 기고에서는 형식을 조금 바꾸어서 필자가 고객들과 지인들로부터 받은 가장 많은 질문과 고충사항에 대한 의견을 정리하는 식으로 글의 형식을 잠시 바꾸고자 한다.   글의 형식을 이렇게 바꾸는 이유는 일단 CERN과 LHC 실험의 빅데이터 조직과 시스템, 인력 운용에 대한 필자의 경험과 찾을 수 있는 문헌이 다소 제한되어 문의 사항에 대한 적절한 사례를 바로바로 찾기 어려운 점도 있고, 고객들과 지인분들의 고충사항에 대한 궁금증을 먼저 해소해드리는 것이 글의 취지에 더 적절할 것 같다는 생각도 있기 때문이다. 추가 기고에서 빅데이터 비즈니스 조직과 운영, 그리고 데이터과학자로서 커리어 계발에 대한 궁금증이 조금이나마 먼저 해소되길 바란다. 빅데이터 비즈니스 조직과 운영, 데이터과학자 커리어에 대한 추가 기고가 이어진 후에는 이 How-to-Big Data 시리즈를 마무리하는 의미로 몇 회에 걸쳐서 지금까지 살펴본 빅데이터 비즈니스의 교훈을 앞으로의 기업 비즈니스 개발에 적용하는 문제를 같이 생각해보고, 지금까지 살펴본 빅데이터 비즈니스의 전반적인 요소가 최근 기업 IT 트렌드와 어떤 연관이 있고 앞으로 어떻게 발전해 나갈 것인지 같이 예측해 보려고 한다. 부디 미래의 기업 IT 인프라를 어떻게 발전시켜야 할지 고민하는 CIO 및 IT 전문가들에게 조금이나마 도움이 되길 바란다. 좋은 데이터과학팀을 만들기 위해서는 어떻게 해야 하는가? - 데이터과학팀의 문화적 규범 지난 스물 네번째 글에서는 데이터과학자로서 LHC 물리학자들의 일반적인 특성에 대해서 알아보았다. 물론, LHC 실험을 수행하는 물리학자도 모두 사람이고, 물리학자마다 개성이 다르고 차이가 크지만, 그 개인적인 차이에도 불구하고 ...

CIO 데이터 조작 뇌과학 직업윤리 김진철 데이터과학자 데이터과학 노벨상 연구 문화 컨설팅 빅데이터 표절

2019.01.28

지금까지 필자의 기고문은 각 회 전반부는 CERN과 LHC 실험의 현황과 실제 사례를 소개하고, 글의 후반부에 이 사례가 빅데이터 비즈니스에 주는 시사점을 논의하는 방식이었다. 필자가 약속한 빅데이터 조직과 시스템, 데이터 과학자 인력 채용과 운용에 관련된 추가 기고에서는 형식을 조금 바꾸어서 필자가 고객들과 지인들로부터 받은 가장 많은 질문과 고충사항에 대한 의견을 정리하는 식으로 글의 형식을 잠시 바꾸고자 한다.   글의 형식을 이렇게 바꾸는 이유는 일단 CERN과 LHC 실험의 빅데이터 조직과 시스템, 인력 운용에 대한 필자의 경험과 찾을 수 있는 문헌이 다소 제한되어 문의 사항에 대한 적절한 사례를 바로바로 찾기 어려운 점도 있고, 고객들과 지인분들의 고충사항에 대한 궁금증을 먼저 해소해드리는 것이 글의 취지에 더 적절할 것 같다는 생각도 있기 때문이다. 추가 기고에서 빅데이터 비즈니스 조직과 운영, 그리고 데이터과학자로서 커리어 계발에 대한 궁금증이 조금이나마 먼저 해소되길 바란다. 빅데이터 비즈니스 조직과 운영, 데이터과학자 커리어에 대한 추가 기고가 이어진 후에는 이 How-to-Big Data 시리즈를 마무리하는 의미로 몇 회에 걸쳐서 지금까지 살펴본 빅데이터 비즈니스의 교훈을 앞으로의 기업 비즈니스 개발에 적용하는 문제를 같이 생각해보고, 지금까지 살펴본 빅데이터 비즈니스의 전반적인 요소가 최근 기업 IT 트렌드와 어떤 연관이 있고 앞으로 어떻게 발전해 나갈 것인지 같이 예측해 보려고 한다. 부디 미래의 기업 IT 인프라를 어떻게 발전시켜야 할지 고민하는 CIO 및 IT 전문가들에게 조금이나마 도움이 되길 바란다. 좋은 데이터과학팀을 만들기 위해서는 어떻게 해야 하는가? - 데이터과학팀의 문화적 규범 지난 스물 네번째 글에서는 데이터과학자로서 LHC 물리학자들의 일반적인 특성에 대해서 알아보았다. 물론, LHC 실험을 수행하는 물리학자도 모두 사람이고, 물리학자마다 개성이 다르고 차이가 크지만, 그 개인적인 차이에도 불구하고 ...

2019.01.28

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.5.0.9