Offcanvas

������������

블로그ㅣML 모델 ‘모니터링’이 중요한 이유

변화하는 가정과 끊임없이 바뀌는 데이터는 머신러닝 모델을 프로덕션에 배포한 후에도 작업이 끝나지 않는다는 의미다.  애자일 개발팀은 마이크로서비스, 애플리케이션, 데이터베이스를 관찰할 수 있어야 하고, 운영 문제를 파악하기 위한 모니터링 기능을 갖춰야 하며, AI옵스를 활용하여 관리 가능한 인시던트를 경고 알림과 연계시켜야 한다.  사용자와 비즈니스 이해관계자가 (모델) 개선을 요청할 때 많은 데브옵스 팀은 애자일 방법론을 따라 피드백을 처리하고 새 버전을 배포한다. 만약 요청이 없더라도 데브옵스 팀은 앱을 업그레이드하고, 기본 구성 요소를 패치해야 한다는 점을 알고 있다. 그렇지 않으면 오늘 개발된 소프트웨어가 내일의 기술 부채가 될 것이다.    머신러닝 모델의 라이프사이클 관리는 소프트웨어보다 더 복잡하다. 와이랩스(WhyLabs)의 공동설립자 겸 엔지니어링 부문 책임자 앤디 당은 “모델 개발 라이프사이클은 하이 레벨에서 소프트웨어 개발 라이프사이클과 유사하지만 훨씬 더 복잡하다. 소프트웨어는 코드로 취급되지만 ML 모델의 기반인 데이터는 복잡하고, 고차원적이며, 동작을 예측할 수 없다”라고 전했다.  코드, 구성 요소, 인프라 외에도 모델은 알고리즘, 구성, 학습 데이터세트를 사용하여 구축된다. 이는 설계 당시에 선택 및 최적화되기 때문에, 시간이 지나면서 가정 및 데이터가 변경되면 업데이트를 해야 한다.  머신러닝 모델을 모니터링하는 이유 애플리케이션의 성능, 안정성, 오류 조건을 모니터링하는 것과 마찬가지로, 머신러닝 모델 모니터링은 데이터 과학자에게 모델 성능에 관한 가시성을 제공한다. 모니터링은 모델이 예측에 사용되거나 해당 ML이 변동성 높은 데이터 세트에서 실행될 때 특히 중요하다.  이터레이티브(Iterative)의 공동설립자 겸 CEO 드미트리 페트로프에 따르면 “ML 팀이 모델을 개선하고 모든 것이 의도한 대로 실행되길 원하기 때문에 모델 모니터링은 성능 및 문제...

머신러닝 인공지능 데이터 과학 애널리틱스 예측 애널리틱스

3일 전

변화하는 가정과 끊임없이 바뀌는 데이터는 머신러닝 모델을 프로덕션에 배포한 후에도 작업이 끝나지 않는다는 의미다.  애자일 개발팀은 마이크로서비스, 애플리케이션, 데이터베이스를 관찰할 수 있어야 하고, 운영 문제를 파악하기 위한 모니터링 기능을 갖춰야 하며, AI옵스를 활용하여 관리 가능한 인시던트를 경고 알림과 연계시켜야 한다.  사용자와 비즈니스 이해관계자가 (모델) 개선을 요청할 때 많은 데브옵스 팀은 애자일 방법론을 따라 피드백을 처리하고 새 버전을 배포한다. 만약 요청이 없더라도 데브옵스 팀은 앱을 업그레이드하고, 기본 구성 요소를 패치해야 한다는 점을 알고 있다. 그렇지 않으면 오늘 개발된 소프트웨어가 내일의 기술 부채가 될 것이다.    머신러닝 모델의 라이프사이클 관리는 소프트웨어보다 더 복잡하다. 와이랩스(WhyLabs)의 공동설립자 겸 엔지니어링 부문 책임자 앤디 당은 “모델 개발 라이프사이클은 하이 레벨에서 소프트웨어 개발 라이프사이클과 유사하지만 훨씬 더 복잡하다. 소프트웨어는 코드로 취급되지만 ML 모델의 기반인 데이터는 복잡하고, 고차원적이며, 동작을 예측할 수 없다”라고 전했다.  코드, 구성 요소, 인프라 외에도 모델은 알고리즘, 구성, 학습 데이터세트를 사용하여 구축된다. 이는 설계 당시에 선택 및 최적화되기 때문에, 시간이 지나면서 가정 및 데이터가 변경되면 업데이트를 해야 한다.  머신러닝 모델을 모니터링하는 이유 애플리케이션의 성능, 안정성, 오류 조건을 모니터링하는 것과 마찬가지로, 머신러닝 모델 모니터링은 데이터 과학자에게 모델 성능에 관한 가시성을 제공한다. 모니터링은 모델이 예측에 사용되거나 해당 ML이 변동성 높은 데이터 세트에서 실행될 때 특히 중요하다.  이터레이티브(Iterative)의 공동설립자 겸 CEO 드미트리 페트로프에 따르면 “ML 팀이 모델을 개선하고 모든 것이 의도한 대로 실행되길 원하기 때문에 모델 모니터링은 성능 및 문제...

3일 전

인터뷰 | ‘지식맵으로 데이터 리터러시 확산’ 美 보험회사 트래블러스 CDO

뉴욕 소재 보험회사 트래블러스는 미국에서 2번째로 큰 상업재산 보험상품과 3번째로 큰 개인보험 상품을 판매하는 대기업이다. 총직원 수는 3만 명에 달하며 2021년 한 해 350억 달러(한화 약 50조 원)의 매출을 올렸다. 트래블러스에서 SVP 겸 최고 데이터 및 애널리틱스 책임자(CDO)를 맡고 있는 마노 만누차르는 그의 일이 곧 보험 리스크의 소용돌이에서 돌파구를 찾는 것이라며 회사의 데이터 전환에 대해 간략히 소개했다.   그는 먼저 “이 회사에서 CDO 역할은 특별하다. 데이터, 기술, 그리고 애널리틱스의 교차점에 서 있기 때문이다. 일단 우리는 방대한 데이터를 보유하고 있다. 나의 역할은 머신러닝을 비롯한 첨단 애널리틱스 기술로 이 데이터에서 그 규모만큼 가치 있는 인사이트를 뽑아내 고객 경험과 사업에 모두 기여하는 것이다”라고 말했다.  만누차르에 따르면 트래블러스에는 총 1,600명이 넘는 데이터 애널리틱스 전문가들이 있으며, 3,000개가 넘는 협력 업체가 소프트웨어 엔지니어링, 인프라 구축, 사이버보안, IT 아키텍처 구축 등을 맡고 있다. 회사는 이렇듯 기술적 역량을 점점 키워가며 사업을 디지털화하고자 힘써 왔다. 트래블러스는 매년 2백만 명이 넘는 중개업체 및 대행업체 관계자를 다루며, 1백만 건에 달하는 보험료 청구를 처리한다. 만누차르는 그의 팀이 최신 클라우드 컴퓨팅 및 데이터 애널리틱스 기술을 활용해 최적의 가격을 모색하고, 보험금 지급을 위한 예비금 확보율을 설정하는 등 고객, 대행업체 및 중개업체에게 더 나은 서비스를 제공하기 위해 노력해왔다고 설명했다.  만누차르는 고객과의 모든 상호작용, 보험 청구건 하나하나가 ‘머신러닝이라는 기술의 렌즈를 통과하면 새롭게 보인다”라며 데이터에서 추출한 인사이트로 일선 현장에서 일하는 보험설계사를 도울 수 있다고 말했다.    그는 데이터의 가치를 극대화하려면 무엇을 하더라도 데이터를 먼저 생각하는 문화가 전사적으로 퍼져야 한다고 강...

데이터드리븐 데이터전환 데이터리터러시 머신러닝 비즈니스 애널리틱스 보험설계

7일 전

뉴욕 소재 보험회사 트래블러스는 미국에서 2번째로 큰 상업재산 보험상품과 3번째로 큰 개인보험 상품을 판매하는 대기업이다. 총직원 수는 3만 명에 달하며 2021년 한 해 350억 달러(한화 약 50조 원)의 매출을 올렸다. 트래블러스에서 SVP 겸 최고 데이터 및 애널리틱스 책임자(CDO)를 맡고 있는 마노 만누차르는 그의 일이 곧 보험 리스크의 소용돌이에서 돌파구를 찾는 것이라며 회사의 데이터 전환에 대해 간략히 소개했다.   그는 먼저 “이 회사에서 CDO 역할은 특별하다. 데이터, 기술, 그리고 애널리틱스의 교차점에 서 있기 때문이다. 일단 우리는 방대한 데이터를 보유하고 있다. 나의 역할은 머신러닝을 비롯한 첨단 애널리틱스 기술로 이 데이터에서 그 규모만큼 가치 있는 인사이트를 뽑아내 고객 경험과 사업에 모두 기여하는 것이다”라고 말했다.  만누차르에 따르면 트래블러스에는 총 1,600명이 넘는 데이터 애널리틱스 전문가들이 있으며, 3,000개가 넘는 협력 업체가 소프트웨어 엔지니어링, 인프라 구축, 사이버보안, IT 아키텍처 구축 등을 맡고 있다. 회사는 이렇듯 기술적 역량을 점점 키워가며 사업을 디지털화하고자 힘써 왔다. 트래블러스는 매년 2백만 명이 넘는 중개업체 및 대행업체 관계자를 다루며, 1백만 건에 달하는 보험료 청구를 처리한다. 만누차르는 그의 팀이 최신 클라우드 컴퓨팅 및 데이터 애널리틱스 기술을 활용해 최적의 가격을 모색하고, 보험금 지급을 위한 예비금 확보율을 설정하는 등 고객, 대행업체 및 중개업체에게 더 나은 서비스를 제공하기 위해 노력해왔다고 설명했다.  만누차르는 고객과의 모든 상호작용, 보험 청구건 하나하나가 ‘머신러닝이라는 기술의 렌즈를 통과하면 새롭게 보인다”라며 데이터에서 추출한 인사이트로 일선 현장에서 일하는 보험설계사를 도울 수 있다고 말했다.    그는 데이터의 가치를 극대화하려면 무엇을 하더라도 데이터를 먼저 생각하는 문화가 전사적으로 퍼져야 한다고 강...

7일 전

“매일 10시간씩 활주시간 단축” 세계 최대 항공사의 애널리틱스 실전 노하우

아메리칸 항공(American Airlines)은 클라우드 전환을 통해 AI, ML, 실시간 애널리틱스 등을 활용하면서 비즈니스 중단을 최소화하고, 운영을 간소화하며, 비행 환경을 개선하고 있다.  코로나19 팬데믹 이후 전 세계 항공사는 악천후, 항공 교통 관제사 감소, 조종사 부족 등으로 어려움을 겪고 있으며, 이로 인해 사상 유례없는 항공편 결항 건수를 기록했다. 로이터에 따르면 지난 1월부터 7월까지 미국에서 10만 건 이상의 항공편이 취소됐다. 팬데믹 이전 수준보다 11% 증가한 수치다.  세계 최대 항공사인 아메리칸 항공은 더욱더 원활한 고객 경험을 제공하기 위한 목적으로 비즈니스 중단을 최소화하고 운영을 간소화하기 위해 데이터 및 애널리틱스를 도입했다.  아메리칸 항공의 수석 부사장 겸 CIO 마야 립만은 “터치리스, 심리스, 스트레스리스(Touchless, Seamless, Stressles)라는 비전을 늘 가지고 있었지만 기존 시스템과 인프라로는 이를 달성하기가 어려웠다”라며, “현대화를 통해 이에 가까워지고 있다. 미래에는 공항이 ‘하늘 정류장(Sky-Stops)’이라고 불릴지 모른다. 일반적인 버스 정류장처럼 공항에서도 수고로움이나 스트레스 없이 시간에 맞춰 탑승하기만 하면 되기 때문이다”라고 말했다.    신임 수석 부사장 겸 CDIO 가네시 제이아람의 취임을 앞두고 9월 1일 아메리칸 항공을 사임한 립만은 이 86년 된 항공사가 데이터 기반 의사결정을 도입할 수 있도록 대대적인 혁신을 주도했다. 그는 “지난 몇 년간 이러한 혁신을 지속해왔다. 팬데믹 이전에는 새롭게 개발된 제품 분류 체계를 중심으로 팀을 재구성하여 제품 중심 사고방식을 구축했다. 이는 (IT에) 큰 변화였다. 하지만 2019년 제품 중심의 데브옵스 문화 기반을 마련해 놓은 덕분에 고객이 항공편 결항에 따른 여행 크레딧을 더 쉽게 사용할 수 있도록 하는 등 팬데믹 관련 고객 문제를 해결하는 데 있어 신속하게 업무를 바...

아메리칸 항공 항공사 클라우드 인공지능 머신러닝 애널리틱스 실시간 애널리틱스 데이터옵스 팬데믹 데이터 애널리틱스 자동화 RPA

2022.09.19

아메리칸 항공(American Airlines)은 클라우드 전환을 통해 AI, ML, 실시간 애널리틱스 등을 활용하면서 비즈니스 중단을 최소화하고, 운영을 간소화하며, 비행 환경을 개선하고 있다.  코로나19 팬데믹 이후 전 세계 항공사는 악천후, 항공 교통 관제사 감소, 조종사 부족 등으로 어려움을 겪고 있으며, 이로 인해 사상 유례없는 항공편 결항 건수를 기록했다. 로이터에 따르면 지난 1월부터 7월까지 미국에서 10만 건 이상의 항공편이 취소됐다. 팬데믹 이전 수준보다 11% 증가한 수치다.  세계 최대 항공사인 아메리칸 항공은 더욱더 원활한 고객 경험을 제공하기 위한 목적으로 비즈니스 중단을 최소화하고 운영을 간소화하기 위해 데이터 및 애널리틱스를 도입했다.  아메리칸 항공의 수석 부사장 겸 CIO 마야 립만은 “터치리스, 심리스, 스트레스리스(Touchless, Seamless, Stressles)라는 비전을 늘 가지고 있었지만 기존 시스템과 인프라로는 이를 달성하기가 어려웠다”라며, “현대화를 통해 이에 가까워지고 있다. 미래에는 공항이 ‘하늘 정류장(Sky-Stops)’이라고 불릴지 모른다. 일반적인 버스 정류장처럼 공항에서도 수고로움이나 스트레스 없이 시간에 맞춰 탑승하기만 하면 되기 때문이다”라고 말했다.    신임 수석 부사장 겸 CDIO 가네시 제이아람의 취임을 앞두고 9월 1일 아메리칸 항공을 사임한 립만은 이 86년 된 항공사가 데이터 기반 의사결정을 도입할 수 있도록 대대적인 혁신을 주도했다. 그는 “지난 몇 년간 이러한 혁신을 지속해왔다. 팬데믹 이전에는 새롭게 개발된 제품 분류 체계를 중심으로 팀을 재구성하여 제품 중심 사고방식을 구축했다. 이는 (IT에) 큰 변화였다. 하지만 2019년 제품 중심의 데브옵스 문화 기반을 마련해 놓은 덕분에 고객이 항공편 결항에 따른 여행 크레딧을 더 쉽게 사용할 수 있도록 하는 등 팬데믹 관련 고객 문제를 해결하는 데 있어 신속하게 업무를 바...

2022.09.19

“인간 중심의 AI 혁신, 알아야 할 ABC는…” 美 특허청 CIO

美 특허청(USPTO; US Patent and Trademark Office)은 데이터 애널리틱스와 AI/ML을 활용해 운영 효율성과 성과를 높이고, 시스템 및 프로세스 품질을 개선하고 있다.   AI/ML 알고리즘이 중요하긴 하지만 USPTO의 원칙은 이러한 기술을 개발 및 사용하여 이니셔티브를 개선하고 확장하는 데 있어 ‘인간 우선’ 접근법을 취하는 것이다. AI와 ML 도구는 인간 전문가에게 힘을 실어주고, 작업의 독창성을 높이는 데 도움을 주지만 현시점에서는 인간의 미묘한 뉘앙스나 추론 능력에 필적할 순 없다고 이 기관의 CIO 제이미 홀컴은 밝혔다.    그에 따르면 USPTO는 이 기술을 보완하기 위해 수동적, 능동적으로 수집되는 숙련된 인력 수천 명의 입력을 활용하여 해당 기술이 예상한 결과를 제공하도록 AI 기반 모델을 학습시키고 다듬는다. 한편 이 기관은 설립 이후 1,100만 개 이상의 특허를 부여했으며, 엔지니어, 변호자, 애널리스트, 컴퓨터 전문가 등을 포함하여 1만 2,000명 이상의 직원을 두고 있다.  일선에 있는 특허 심사관의 지속적인 피드백은 AI/ML 모델을 개선해 신제품 개발을 촉진하고, 특허 검색과 분류라는 2가지 핵심 분야를 지원하는 데 사용된다. 홀컴은 방대한 양의 데이터와 가능한 ‘선행 기술’ 출처를 고려할 때 포괄적인 특허 검색을 수행하는 일은 어려울 수 있다고 말했다. 이러한 과제를 해결하기 위해 기술팀은 심사관이 애플리케이션을 면밀히 조사할 때 가장 관련성 높은 소스를 찾을 수 있도록 새로운 특허 검색 도구에 AI 구성 요소를 추가하고 있다.  이는 USPTO가 매년 평균적으로 접수 받는 60만 건 이상의 (특허) 신청서에 약 20페이지 분량의 텍스트 및 그림 또는 이를 설명하는 약 1만 단어가 포함돼 있기 때문에 매우 중요하다. 아울러 해당 기관의 IT는 25만 개 이상의 가능한 범주에서 발명과 관련된 분류 기호를 식별하고 일치시키는 분류 도구도 개발 및 배...

AI 머신러닝 ML 데이터 애널리틱스

2022.09.13

美 특허청(USPTO; US Patent and Trademark Office)은 데이터 애널리틱스와 AI/ML을 활용해 운영 효율성과 성과를 높이고, 시스템 및 프로세스 품질을 개선하고 있다.   AI/ML 알고리즘이 중요하긴 하지만 USPTO의 원칙은 이러한 기술을 개발 및 사용하여 이니셔티브를 개선하고 확장하는 데 있어 ‘인간 우선’ 접근법을 취하는 것이다. AI와 ML 도구는 인간 전문가에게 힘을 실어주고, 작업의 독창성을 높이는 데 도움을 주지만 현시점에서는 인간의 미묘한 뉘앙스나 추론 능력에 필적할 순 없다고 이 기관의 CIO 제이미 홀컴은 밝혔다.    그에 따르면 USPTO는 이 기술을 보완하기 위해 수동적, 능동적으로 수집되는 숙련된 인력 수천 명의 입력을 활용하여 해당 기술이 예상한 결과를 제공하도록 AI 기반 모델을 학습시키고 다듬는다. 한편 이 기관은 설립 이후 1,100만 개 이상의 특허를 부여했으며, 엔지니어, 변호자, 애널리스트, 컴퓨터 전문가 등을 포함하여 1만 2,000명 이상의 직원을 두고 있다.  일선에 있는 특허 심사관의 지속적인 피드백은 AI/ML 모델을 개선해 신제품 개발을 촉진하고, 특허 검색과 분류라는 2가지 핵심 분야를 지원하는 데 사용된다. 홀컴은 방대한 양의 데이터와 가능한 ‘선행 기술’ 출처를 고려할 때 포괄적인 특허 검색을 수행하는 일은 어려울 수 있다고 말했다. 이러한 과제를 해결하기 위해 기술팀은 심사관이 애플리케이션을 면밀히 조사할 때 가장 관련성 높은 소스를 찾을 수 있도록 새로운 특허 검색 도구에 AI 구성 요소를 추가하고 있다.  이는 USPTO가 매년 평균적으로 접수 받는 60만 건 이상의 (특허) 신청서에 약 20페이지 분량의 텍스트 및 그림 또는 이를 설명하는 약 1만 단어가 포함돼 있기 때문에 매우 중요하다. 아울러 해당 기관의 IT는 25만 개 이상의 가능한 범주에서 발명과 관련된 분류 기호를 식별하고 일치시키는 분류 도구도 개발 및 배...

2022.09.13

딥러닝 프레임워크 ‘3파전’··· '텐서플로우 vs 파이토치 vs JAX' 비교

오늘날 딥러닝 연구 및 개발을 주도하는 3가지 프레임워크가 있다. 각각 (1) 사용 편의성, (2) 기능 및 성숙도, (3) 엄청난 확장성으로 유명하다. 어떤 프레임워크를 사용해야 할까?  음성에 반응하는 시리나 알렉사, 스마트폰의 실시간 번역 앱, 스마트 트랙터, 창고 로봇, 자율주행차 등에 들어가는 컴퓨터 비전 기술 등 ‘딥러닝’은 크고 작은 방식으로 삶을 매일 변화시키고 있다. 그리고 거의 모든 딥러닝 애플리케이션은 3가지 프레임워크 (1) 텐서플로우, (2) 파이토치, (3) JAM 중 하나로 작성된다. 그렇다면 이 중에서 어떤 딥러닝 프레임워크를 사용해야 할까?    ‘텐서플로우’를 사용해야 할까? 1970년대와 1980년대에는 ‘IBM 제품을 샀다고 해고된 사람은 아무도 없다(Nobody ever got fired forbuying an IBM)’라는 말이 진리로 통했다. 2010년대에는 이를 ‘딥러닝에 텐서플로우를 사용했다고 해고된 사람은 아무도 없다’라고 바꿔 말할 수 있겠다. 하지만 주지하다시피 IBM은 1990년대에 접어들면서 도태됐다. 그렇다면 텐서플로우는 2015년 처음 공개된 지 7년이 지난 지금에도 여전히 경쟁력이 있을까? 확실히 그렇다. 텐서플로우가 그동안 가만히 있지 않았다. 텐서플로우 1.x는 파이썬과 매우 다른 방식으로 정적 그래프를 작성하는 게 전부였지만 텐서플로우 2.x는 ‘즉시 실행’ 모드를 사용한 모델 빌드가 가능해지면서 좀 더 파이토치 같은 느낌이 났다. 아울러 하이 레벨(high level)에서 텐서플로우는 더 쉬운 개발을 위해 케라스(Keras)를 제공하고, 로우 레벨에서는 속도를 위해 컴파일러를 최적화하는 XLA(Accelerated Linear Algebra)를 제공한다. XLA는 GPU 성능을 향상시키며, 대규모 모델 학습에 뛰어난 성능을 제공하는 구글의 TPU(Tensor Processing Units)를 활용하는 방법이기도 하다. 그리고 텐서플로우가 수년간 잘해...

딥러닝 머신러닝 인공지능 개발 라이브러리 개발 프레임워크 소프트웨어 개발 파이썬 텐서플로우 파이토치 JAX 케라스 넘파이

2022.08.31

오늘날 딥러닝 연구 및 개발을 주도하는 3가지 프레임워크가 있다. 각각 (1) 사용 편의성, (2) 기능 및 성숙도, (3) 엄청난 확장성으로 유명하다. 어떤 프레임워크를 사용해야 할까?  음성에 반응하는 시리나 알렉사, 스마트폰의 실시간 번역 앱, 스마트 트랙터, 창고 로봇, 자율주행차 등에 들어가는 컴퓨터 비전 기술 등 ‘딥러닝’은 크고 작은 방식으로 삶을 매일 변화시키고 있다. 그리고 거의 모든 딥러닝 애플리케이션은 3가지 프레임워크 (1) 텐서플로우, (2) 파이토치, (3) JAM 중 하나로 작성된다. 그렇다면 이 중에서 어떤 딥러닝 프레임워크를 사용해야 할까?    ‘텐서플로우’를 사용해야 할까? 1970년대와 1980년대에는 ‘IBM 제품을 샀다고 해고된 사람은 아무도 없다(Nobody ever got fired forbuying an IBM)’라는 말이 진리로 통했다. 2010년대에는 이를 ‘딥러닝에 텐서플로우를 사용했다고 해고된 사람은 아무도 없다’라고 바꿔 말할 수 있겠다. 하지만 주지하다시피 IBM은 1990년대에 접어들면서 도태됐다. 그렇다면 텐서플로우는 2015년 처음 공개된 지 7년이 지난 지금에도 여전히 경쟁력이 있을까? 확실히 그렇다. 텐서플로우가 그동안 가만히 있지 않았다. 텐서플로우 1.x는 파이썬과 매우 다른 방식으로 정적 그래프를 작성하는 게 전부였지만 텐서플로우 2.x는 ‘즉시 실행’ 모드를 사용한 모델 빌드가 가능해지면서 좀 더 파이토치 같은 느낌이 났다. 아울러 하이 레벨(high level)에서 텐서플로우는 더 쉬운 개발을 위해 케라스(Keras)를 제공하고, 로우 레벨에서는 속도를 위해 컴파일러를 최적화하는 XLA(Accelerated Linear Algebra)를 제공한다. XLA는 GPU 성능을 향상시키며, 대규모 모델 학습에 뛰어난 성능을 제공하는 구글의 TPU(Tensor Processing Units)를 활용하는 방법이기도 하다. 그리고 텐서플로우가 수년간 잘해...

2022.08.31

작은 변화가 큰 혁신을... 캐리어의 ‘마이크로트랜스포메이션’ 사례

때때로 가장 큰 영향력을 미치는 것은 대규모 트랜스포메이션 이니셔티브보다 작은 변화다. 美 HVAC 기업 ‘캐리어(Carrier)’가 여기에 해당되는 사례인데, 이 회사는 2020년 유나이티드 테크놀로지스(United Technologies Corp.)에서 분사한 후 고객과 직원들을 힘들게 했던 비즈니스 프로세스를 업데이트 및 자동화하고자 ‘마이크로트랜스포메이션’적인 접근법을 취했다. 캐리어의 지능형 자동화 부문 이사 줄리 에드워즈에 따르면 해당 프로세스는 분사 전부터 시작됐으며, 이에 따라 캐리어의 IT는 신속하게 인력을 충원하는 한편 이전에는 UTC에서 중앙 집중식으로 제공하던 디지털 기능을 인수해야 했다. 그는 “힘든 시간이었다. UTC에서 분사하고 독립성을 확보하기 위해 새로운 디지털 인력을 많이 채용했다. 캐리어에 처음 온 사람들이 많았고, 캐리어 또한 자동화는 처음이었다”라고 말했다.    이러한 변화의 일환으로 캐리어는 애널리틱스와 자동화를 포함한 여러 IT 기능을 지원할 전문가 조직(CoE)을 만들었다. 에드워즈는 “이 두 분야가 잘 맞는다고 생각했기 때문에 결합했다”라며, 자신이 전문가 조직 구성 이후 첫 3개월 동안 유일한 직원이었다고 덧붙였다. 이어 그는 “빠르게 성장하는 IT팀은 해야 할 일이 가득하다. 캐리어는 4개의 사업부에서 약 130개의 서로 다른 ERP 플랫폼을 사용하고 있었다. 물론 대부분은 SAP 또는 JDE였지만 버전이 달랐고, 서로 다른 플랫폼에서 자율적으로 실행되고 있었다. 현재는 전 세계적으로 캐리어의 ERP 설치를 표준화 및 간소화하는 데 초점을 두고 있다”라고 전했다.  하지만 사업부는 전사적인 디지털 트랜스포메이션 프로세스가 완료될 때까지 계속 기다릴 수는 없었다. 마이크로트랜스포메이션(Microtransformations) 캐리어의 초기 계획은 RPA를 활용하는 것이었지만 사용 중인 ERP 시스템이 다양해 간단한 RPA 접근은 어려웠다. 에드워즈와 그의 팀은 가장 시급한 디...

캐리어 디지털 트랜스포메이션 RPA 자동화 전문가 조직 ERP 애널리틱스 머신러닝

2022.08.30

때때로 가장 큰 영향력을 미치는 것은 대규모 트랜스포메이션 이니셔티브보다 작은 변화다. 美 HVAC 기업 ‘캐리어(Carrier)’가 여기에 해당되는 사례인데, 이 회사는 2020년 유나이티드 테크놀로지스(United Technologies Corp.)에서 분사한 후 고객과 직원들을 힘들게 했던 비즈니스 프로세스를 업데이트 및 자동화하고자 ‘마이크로트랜스포메이션’적인 접근법을 취했다. 캐리어의 지능형 자동화 부문 이사 줄리 에드워즈에 따르면 해당 프로세스는 분사 전부터 시작됐으며, 이에 따라 캐리어의 IT는 신속하게 인력을 충원하는 한편 이전에는 UTC에서 중앙 집중식으로 제공하던 디지털 기능을 인수해야 했다. 그는 “힘든 시간이었다. UTC에서 분사하고 독립성을 확보하기 위해 새로운 디지털 인력을 많이 채용했다. 캐리어에 처음 온 사람들이 많았고, 캐리어 또한 자동화는 처음이었다”라고 말했다.    이러한 변화의 일환으로 캐리어는 애널리틱스와 자동화를 포함한 여러 IT 기능을 지원할 전문가 조직(CoE)을 만들었다. 에드워즈는 “이 두 분야가 잘 맞는다고 생각했기 때문에 결합했다”라며, 자신이 전문가 조직 구성 이후 첫 3개월 동안 유일한 직원이었다고 덧붙였다. 이어 그는 “빠르게 성장하는 IT팀은 해야 할 일이 가득하다. 캐리어는 4개의 사업부에서 약 130개의 서로 다른 ERP 플랫폼을 사용하고 있었다. 물론 대부분은 SAP 또는 JDE였지만 버전이 달랐고, 서로 다른 플랫폼에서 자율적으로 실행되고 있었다. 현재는 전 세계적으로 캐리어의 ERP 설치를 표준화 및 간소화하는 데 초점을 두고 있다”라고 전했다.  하지만 사업부는 전사적인 디지털 트랜스포메이션 프로세스가 완료될 때까지 계속 기다릴 수는 없었다. 마이크로트랜스포메이션(Microtransformations) 캐리어의 초기 계획은 RPA를 활용하는 것이었지만 사용 중인 ERP 시스템이 다양해 간단한 RPA 접근은 어려웠다. 에드워즈와 그의 팀은 가장 시급한 디...

2022.08.30

"유지보수 비용 25% 절감"··· 인프라 산업의 '디지털 트윈' 사용 사례

물리적 영역과 디지털 영역의 가교 구실을 하는 ‘디지털 트윈(Digital twins)’이 물리적 객체, 프로세스, 시스템의 가상 표현을 제공하기 위해 과거 및 실시간 데이터와 머신러닝 모델을 어떻게 활용하는지 소개한다. 벤틀리 시스템즈(Bentley Systems)의 소프트웨어 개발자 키스 벤틀리는 ‘디지털 트윈’을 “개인용 컴퓨터 이후 물리적 인프라 산업에 IT 가치가 기여할 수 있는 가장 큰 기회”라면서, “이는 다양한 산업에서 활용되고 있으며, 유지관리에 관한 인사이트 및 제조 공급망을 최적화하는 방법을 제공한다”라고 말했다.  마켓스앤마켓스닷컴(MarketsAndMarkets.com) 보고서에 따르면 2026년까지 전 세계 디지털 트윈 시장의 규모는 미화 482억 달러에 달할 것으로 예상되며, 건축·엔지니어링·건설(AEC) 산업이 핵심 성장 동력으로 꼽혔다. 여기서는 디지털 트윈이 인프라 산업의 현 상태를 어떻게 변혁하고 있는지 그리고 인프라 및 AEC 기업의 IT 리더가 이를 활용해야 할 이유를 살펴본다.    비즈니스 모델 재구성 AEC 업계는 수십 년 동안 ‘캐드(CAD; Computer-Aided Design)’ 그리고 (최근에는) ‘빔(BIM; Building Information Modeling)’ 소프트웨어를 사용하여 프로젝트별로 2D 및 3D 결과물을 만들었다. 이 업계는 이제 새로운 비즈니스 모델, 산업 생태계, 더욱더 협력적인 작업 방식으로 나아가는 통합 도구 및 산업 클라우드 제품으로 이동하고 있다.  아울러 디지털 트윈의 사용 증가로 AEC 기업들이 고객을 위해 인프라 디지털 트윈을 관리하고 유지보수하는 새로운 수익 창출 기회도 열리고 있다.  이러한 새 비즈니스 모델은 인프라 산업을 혁신하고, (이 업계가 새로운 작업 방식에 적응함에 따라) 기회를 재구성하고 있다. 디지털 트윈은 다양한 플랫폼 모델이 음악, 책, 소매, 긱 이코노미 서비스 등에서 한 작업을 인프라 공간에서 ...

디지털 트윈 증강현실 가상현실 데이터 머신러닝 AEC 산업 인프라 산업

2022.08.18

물리적 영역과 디지털 영역의 가교 구실을 하는 ‘디지털 트윈(Digital twins)’이 물리적 객체, 프로세스, 시스템의 가상 표현을 제공하기 위해 과거 및 실시간 데이터와 머신러닝 모델을 어떻게 활용하는지 소개한다. 벤틀리 시스템즈(Bentley Systems)의 소프트웨어 개발자 키스 벤틀리는 ‘디지털 트윈’을 “개인용 컴퓨터 이후 물리적 인프라 산업에 IT 가치가 기여할 수 있는 가장 큰 기회”라면서, “이는 다양한 산업에서 활용되고 있으며, 유지관리에 관한 인사이트 및 제조 공급망을 최적화하는 방법을 제공한다”라고 말했다.  마켓스앤마켓스닷컴(MarketsAndMarkets.com) 보고서에 따르면 2026년까지 전 세계 디지털 트윈 시장의 규모는 미화 482억 달러에 달할 것으로 예상되며, 건축·엔지니어링·건설(AEC) 산업이 핵심 성장 동력으로 꼽혔다. 여기서는 디지털 트윈이 인프라 산업의 현 상태를 어떻게 변혁하고 있는지 그리고 인프라 및 AEC 기업의 IT 리더가 이를 활용해야 할 이유를 살펴본다.    비즈니스 모델 재구성 AEC 업계는 수십 년 동안 ‘캐드(CAD; Computer-Aided Design)’ 그리고 (최근에는) ‘빔(BIM; Building Information Modeling)’ 소프트웨어를 사용하여 프로젝트별로 2D 및 3D 결과물을 만들었다. 이 업계는 이제 새로운 비즈니스 모델, 산업 생태계, 더욱더 협력적인 작업 방식으로 나아가는 통합 도구 및 산업 클라우드 제품으로 이동하고 있다.  아울러 디지털 트윈의 사용 증가로 AEC 기업들이 고객을 위해 인프라 디지털 트윈을 관리하고 유지보수하는 새로운 수익 창출 기회도 열리고 있다.  이러한 새 비즈니스 모델은 인프라 산업을 혁신하고, (이 업계가 새로운 작업 방식에 적응함에 따라) 기회를 재구성하고 있다. 디지털 트윈은 다양한 플랫폼 모델이 음악, 책, 소매, 긱 이코노미 서비스 등에서 한 작업을 인프라 공간에서 ...

2022.08.18

'머신러닝+자율기능'··· 데브옵스 시대 네트워킹의 조건

디지털 트랜스포메이션을 통해 기업은 경쟁 우위 확대, 새로운 수익사업 개발, 고객 경험 개선 등을 실현하고 있다. 그러나 이 모든 것을 위해 데브옵스 엔지니어는 할 일이 많다. 업무의 중요도와 요건에 따라 이를 지원하는 클라우드 서비스 업체의 리소스를 활용하고 쿠버네티스, 마이크로서비스, 기타 클라우드 네이티브 컴퓨팅 툴을 사용해 이른바 '애자일', 즉 더 빠른 속도로 애플리케이션을 구축, 테스트, 배포해야 하는 상황이다.   엔지니어와 애플리케이션 스택이 애자일을 지향하는 만큼 네트워크도 애자일에 적합해야 하는데, 바로 멀티클라우드 환경을 위한 풀스택 자율 네트워킹이다. 이를 통해 기업은 단기간에 투자 가치를 회수할 수 있고 데브옵스 엔지니어는 생산성과 사업 성장을 극대화할 수 있는 수단을 확보할 수 있다.   레거시 네트워킹 툴의 한계 애플리케이션과 서비스의 제공 속도를 높이면 비즈니스 측면에서 많은 장점이 있지만 동시에 감수해야 할 위험과 해결해야 할 과제도 함께 늘어난다. 사용자가 성능 문제를 겪고 결과적으로 생산성이 저하된다면 혁신적인 애플리케이션도 아무 소용이 없다. 따라서 보유한 애플리케이션이 안전한 경험을 제공하는지, 기업과 직원, 고객을 위험에 드러내는지, 모든 규정 준수 요건을 충족하는지 확인해야 한다. IDC에 따르면 클라우드로 이동하는 애플리케이션이 많아지면서 올해 말이면 사상 처음으로 클라우드 투자가 비 클라우드 IT 인프라 투자를 앞지를 전망이다. 또한, 프로시모(Prosimo)의 최신 ‘멀티클라우드 인프라 상태 보고서’에 따르면 기업 91%가 복수의 클라우드를 사용할 계획이며 62%는 2년 이내에 사용할 계획이다. 클라우드 사용 규모가 커질수록 복잡성도 커지기 마련이다. 기업은 이 새로운 역동적 IT 환경을 온프레미스 데이터센터, 엣지 컴퓨팅, 클라우드 인프라에 걸쳐 일관성 있게 오케스트레이션 및 관리하는 데 애를 먹고 있다. 많은 기업이 전통적인 레거시 네트워킹 툴을 사용해 연결성 요건과 씨름해 왔지만, 효...

데브옵스 네트워킹 머신러닝

2022.08.16

디지털 트랜스포메이션을 통해 기업은 경쟁 우위 확대, 새로운 수익사업 개발, 고객 경험 개선 등을 실현하고 있다. 그러나 이 모든 것을 위해 데브옵스 엔지니어는 할 일이 많다. 업무의 중요도와 요건에 따라 이를 지원하는 클라우드 서비스 업체의 리소스를 활용하고 쿠버네티스, 마이크로서비스, 기타 클라우드 네이티브 컴퓨팅 툴을 사용해 이른바 '애자일', 즉 더 빠른 속도로 애플리케이션을 구축, 테스트, 배포해야 하는 상황이다.   엔지니어와 애플리케이션 스택이 애자일을 지향하는 만큼 네트워크도 애자일에 적합해야 하는데, 바로 멀티클라우드 환경을 위한 풀스택 자율 네트워킹이다. 이를 통해 기업은 단기간에 투자 가치를 회수할 수 있고 데브옵스 엔지니어는 생산성과 사업 성장을 극대화할 수 있는 수단을 확보할 수 있다.   레거시 네트워킹 툴의 한계 애플리케이션과 서비스의 제공 속도를 높이면 비즈니스 측면에서 많은 장점이 있지만 동시에 감수해야 할 위험과 해결해야 할 과제도 함께 늘어난다. 사용자가 성능 문제를 겪고 결과적으로 생산성이 저하된다면 혁신적인 애플리케이션도 아무 소용이 없다. 따라서 보유한 애플리케이션이 안전한 경험을 제공하는지, 기업과 직원, 고객을 위험에 드러내는지, 모든 규정 준수 요건을 충족하는지 확인해야 한다. IDC에 따르면 클라우드로 이동하는 애플리케이션이 많아지면서 올해 말이면 사상 처음으로 클라우드 투자가 비 클라우드 IT 인프라 투자를 앞지를 전망이다. 또한, 프로시모(Prosimo)의 최신 ‘멀티클라우드 인프라 상태 보고서’에 따르면 기업 91%가 복수의 클라우드를 사용할 계획이며 62%는 2년 이내에 사용할 계획이다. 클라우드 사용 규모가 커질수록 복잡성도 커지기 마련이다. 기업은 이 새로운 역동적 IT 환경을 온프레미스 데이터센터, 엣지 컴퓨팅, 클라우드 인프라에 걸쳐 일관성 있게 오케스트레이션 및 관리하는 데 애를 먹고 있다. 많은 기업이 전통적인 레거시 네트워킹 툴을 사용해 연결성 요건과 씨름해 왔지만, 효...

2022.08.16

“쉽고 빠른 풀스택 접근법” MS 애저 애널리틱스 서비스 7선

마이크로소프트는 애저 클라우드에서 (전체 애널리틱스 스택으로 함께 작동하는) 다양한 데이터 애널리틱스 옵션을 제공한다. 여기서는 핵심 서비스와 적합한 사용 사례를 살펴본다.  비즈니스 데이터를 이해할 수 없다면 사실상 눈을 가린 채로 비행하는 것이나 마찬가지다. 데이터에 숨겨진 인사이트는 비즈니스 운영을 최적화하고, 고객 경험을 미세 조정하며, 새로운 제품 또는 새로운 비즈니스 라인(예: 예측 유지 보수 등)을 개발하는 데 필수적이다.  애널리틱스는 이러한 인사이트를 발견하기 위한 수단이고, 이를 제대로 하려면 데이터 수집 및 준비, 데이터 보강 및 태깅, 보고서 작성 및 공유, 데이터 및 인사이트 관리 및 보호를 위한 도구가 필요하다. 또한 기업들이 점점 더 많은 양의 데이터와 씨름하면서 클라우드는 애널리틱스 작업에 안성맞춤인 장소로 빠르게 변하고 있다.     많은 기업에서 ‘마이크로소프트 애저(Microsoft Azure)’는 애널리틱스를 위한 중앙 허브가 됐다. 데이터 애널리틱스를 광범위하게 해석하는 애저는 12개 이상의 서비스를 제공한다(이후 AI 기반 분석 및 새로운 데이터마트 옵션을 지원하는 ‘파워 BI(Power BI)’ 또는 마이크로소프트 퍼뷰(Microsoft Purview) 등의 거버넌스 지향 접근법도 추가됐다).  마이크로소프트 애널리틱스(Microsoft Analytics)의 CTO 아미르 네츠는 “단편적인 접근법이 아니라, 함께 작동하도록 설계된 애저에서 전체 애널리틱스 서비스 스택을 제공하는 것을 목표로 하고 있다”라고 말했다.  다양한 서비스 간에 중복되는 부분이 있긴 하지만 그는 애저의 애널리틱스 서비스가 애널리틱스 아키텍처 프레임워크 생성 시 기업이 구축하는 계층에 광범위하게 해당된다고 밝혔다. 넷츠는 “데이터 레이크 생성, 데이터 저장, 레이크에서의 데이터 처리, 데이터 엔지니어링, 데이터 웨어하우스 구축, 머신러닝 알고리즘 및 데이터 과학 실행, 비즈니스 사용자...

마이크로소프트 애저 클라우드 애널리틱스 데이터 애널리틱스 데이터 레이크 데이터 웨어하우스 머신러닝

2022.07.04

마이크로소프트는 애저 클라우드에서 (전체 애널리틱스 스택으로 함께 작동하는) 다양한 데이터 애널리틱스 옵션을 제공한다. 여기서는 핵심 서비스와 적합한 사용 사례를 살펴본다.  비즈니스 데이터를 이해할 수 없다면 사실상 눈을 가린 채로 비행하는 것이나 마찬가지다. 데이터에 숨겨진 인사이트는 비즈니스 운영을 최적화하고, 고객 경험을 미세 조정하며, 새로운 제품 또는 새로운 비즈니스 라인(예: 예측 유지 보수 등)을 개발하는 데 필수적이다.  애널리틱스는 이러한 인사이트를 발견하기 위한 수단이고, 이를 제대로 하려면 데이터 수집 및 준비, 데이터 보강 및 태깅, 보고서 작성 및 공유, 데이터 및 인사이트 관리 및 보호를 위한 도구가 필요하다. 또한 기업들이 점점 더 많은 양의 데이터와 씨름하면서 클라우드는 애널리틱스 작업에 안성맞춤인 장소로 빠르게 변하고 있다.     많은 기업에서 ‘마이크로소프트 애저(Microsoft Azure)’는 애널리틱스를 위한 중앙 허브가 됐다. 데이터 애널리틱스를 광범위하게 해석하는 애저는 12개 이상의 서비스를 제공한다(이후 AI 기반 분석 및 새로운 데이터마트 옵션을 지원하는 ‘파워 BI(Power BI)’ 또는 마이크로소프트 퍼뷰(Microsoft Purview) 등의 거버넌스 지향 접근법도 추가됐다).  마이크로소프트 애널리틱스(Microsoft Analytics)의 CTO 아미르 네츠는 “단편적인 접근법이 아니라, 함께 작동하도록 설계된 애저에서 전체 애널리틱스 서비스 스택을 제공하는 것을 목표로 하고 있다”라고 말했다.  다양한 서비스 간에 중복되는 부분이 있긴 하지만 그는 애저의 애널리틱스 서비스가 애널리틱스 아키텍처 프레임워크 생성 시 기업이 구축하는 계층에 광범위하게 해당된다고 밝혔다. 넷츠는 “데이터 레이크 생성, 데이터 저장, 레이크에서의 데이터 처리, 데이터 엔지니어링, 데이터 웨어하우스 구축, 머신러닝 알고리즘 및 데이터 과학 실행, 비즈니스 사용자...

2022.07.04

AI 및 ML 시스템을 붕괴시키는 ‘적대적 머신러닝’의 이해

AI 및 머신러닝(Machine Learning, ML) 프로젝트를 시작하는 기업이 늘면서 AI/ML의 안전을 확보하는 일이 무엇보다 중요해졌다. IBM과 모닝 컨설트(Morning Consult)가 5월 발표한 보고서에 따르면, 전 세계 7,500곳 이상의 기업 중에서 35%가 이미 AI를 사용 중이다. 전년 대비 13% 증가한 수치다. AI를 탐색하고 있는 기업은 42%였다. 20%의 기업은 데이터 보안에서 어려움을 겪고 있었고, 이로 인해 AI 도입이 늦춰지고 있다고 답했다.   가트너가 2021년 2월 실시한 설문조사에서도 보안이 AI 도입 시 가장 큰 걸림돌이었다. 보안은 AI 솔루션을 기존 인프라에 통합하는 데 따르는 복잡성과 함께 1위를 차지했다.  마이크로소프트가 같은 해 3월 발표한 논문에 따르면, 기업의 90%는 적대적 머신러닝(Adversarial Machine Learning)에서 기업 시스템을 보호할 준비가 되어 있지 않다. 논문에서 다룬 28곳의 대/소규모 기업 가운데 25곳에서 ML 시스템 보안에 필요한 툴을 배치하지 않았다.  AI/ML 시스템 보안은 상당히 어려운 작업이다. 몇몇 어려움은 AI 고유의 특성에 기인한다. 예를 들어 AI/ML 시스템은 데이터를 필요로 하는데, 민감 데이터나 독점적 정보는 공격자의 표적이 된다. AI/ML 보안의 또 다른 측면은 ‘적대적 머신러닝’처럼 낯설기만 하다. 적대적 머신러닝이란 무엇인가?  엄밀히 말해 적대적 머신러닝은 이름과는 달리 머신러닝이 아니다. ML 시스템을 공격하는 데 사용되는 일련의 기법이다. 토론토 메트로폴리탄 대학교(Toronto Metropolitan University) 교수이자 글로벌 리서치 연구소(Global Research Institute)의 상임 연구원 알렉세이 루브초이는 “적대적 머신러닝은 ML 모델의 취약점과 특수성을 이용한다”라고 말했다. 루브초이는 최근 금융 서비스 산업 내 적대적 머신러닝에 관한 논문을 발표했다...

인공지능 머신러닝 적대적머신러닝

2022.07.04

AI 및 머신러닝(Machine Learning, ML) 프로젝트를 시작하는 기업이 늘면서 AI/ML의 안전을 확보하는 일이 무엇보다 중요해졌다. IBM과 모닝 컨설트(Morning Consult)가 5월 발표한 보고서에 따르면, 전 세계 7,500곳 이상의 기업 중에서 35%가 이미 AI를 사용 중이다. 전년 대비 13% 증가한 수치다. AI를 탐색하고 있는 기업은 42%였다. 20%의 기업은 데이터 보안에서 어려움을 겪고 있었고, 이로 인해 AI 도입이 늦춰지고 있다고 답했다.   가트너가 2021년 2월 실시한 설문조사에서도 보안이 AI 도입 시 가장 큰 걸림돌이었다. 보안은 AI 솔루션을 기존 인프라에 통합하는 데 따르는 복잡성과 함께 1위를 차지했다.  마이크로소프트가 같은 해 3월 발표한 논문에 따르면, 기업의 90%는 적대적 머신러닝(Adversarial Machine Learning)에서 기업 시스템을 보호할 준비가 되어 있지 않다. 논문에서 다룬 28곳의 대/소규모 기업 가운데 25곳에서 ML 시스템 보안에 필요한 툴을 배치하지 않았다.  AI/ML 시스템 보안은 상당히 어려운 작업이다. 몇몇 어려움은 AI 고유의 특성에 기인한다. 예를 들어 AI/ML 시스템은 데이터를 필요로 하는데, 민감 데이터나 독점적 정보는 공격자의 표적이 된다. AI/ML 보안의 또 다른 측면은 ‘적대적 머신러닝’처럼 낯설기만 하다. 적대적 머신러닝이란 무엇인가?  엄밀히 말해 적대적 머신러닝은 이름과는 달리 머신러닝이 아니다. ML 시스템을 공격하는 데 사용되는 일련의 기법이다. 토론토 메트로폴리탄 대학교(Toronto Metropolitan University) 교수이자 글로벌 리서치 연구소(Global Research Institute)의 상임 연구원 알렉세이 루브초이는 “적대적 머신러닝은 ML 모델의 취약점과 특수성을 이용한다”라고 말했다. 루브초이는 최근 금융 서비스 산업 내 적대적 머신러닝에 관한 논문을 발표했다...

2022.07.04

‘해킹도 ML로 진화 중’ 머신러닝 해킹 수법 9가지

머신러닝 알고리즘은 보안 솔루션을 개선하여 애널리스트가 위협을 분류하고 취약점을 신속하게 해결할 수 있도록 지원한다. 하지만 동시에 해커들이 더 큰 규모의 복잡한 사이버 공격을 가하는 데 악용되고 있다.    머신러닝과 인공지능은 보안 위협을 검출하고 대응하는 핵심 기술이 되고 있다. 변화무쌍한 사이버 위협에 맞서 스스로 학습하고 적응할 수 있는 능력이 큰 강점이다.  한편 해커들이 머신러닝과 AI를 악용하여 사이버 공격을 확대하고, 보안 통제를 회피하며, 전례 없는 속도로 파괴적인 결과를 초래하는 새로운 취약성을 찾아내고 있다. 이 글에서는 해커가 이러한 기술을 악용하는 가장 일반적인 방법 9가지를 알아보고자 한다.  1. 스팸 필터를 속이는 스팸 메일  시장조사기관 옴디아(Omdia)의 애널리스트 페르난도 몬테네그로는 보안 관리자들이 수십 년 동안 스팸 메일을 걸러내는 데 머신러닝을 사용해 왔다고 말했다. “스팸 메일 차단이 머신러닝이 활용된 최초의 사례였다”라고 그는 설명했다. 하지만 머신러닝은 스팸 방지 필터를 속이는 데 악용될 수 있다. 스팸 필터가 특정 메일을 차단한 이유나 ‘스팸 지수’ 같은 정보를 생성한다면, 해커는 이를 사용하여 스팸 메일의 내용을 조정할 수 있다. “계속 이메일을 전송하면서 정보를 얻으면 스팸 필터 모델의 작동 기준을 재구성할 수 있다. 이를 통해 메일 내용을 미세하게 바꿔가면서 스팸 필터를 우회할 수 있게 된다”라고 그는 설명했다.   취약점은 스팸 필터에만 있지 않다. 몬테네그로는 점수나 기타 수치를 제공하는 보안업체가 잠재적으로 악용될 수 있다고 말했다. "모든 업체가 이러한 취약점을 안고 있는 것은 아니지만, 주의하지 않으면 누군가가 악용할 수 있는 정보를 의도치 않게 제공하게 될 수 있다"라고 그는 덧붙였다.  2. 더 정교해진 피싱 메일 공격자는 메시지가 스팸 필터를 통과할 수 있는지 테스트하기 위해 머신러닝 보안 도구를 사용하는 데 그치지 ...

머신러닝 사전대입공격 딥페이크 AI오염 AI퍼징

2022.06.14

머신러닝 알고리즘은 보안 솔루션을 개선하여 애널리스트가 위협을 분류하고 취약점을 신속하게 해결할 수 있도록 지원한다. 하지만 동시에 해커들이 더 큰 규모의 복잡한 사이버 공격을 가하는 데 악용되고 있다.    머신러닝과 인공지능은 보안 위협을 검출하고 대응하는 핵심 기술이 되고 있다. 변화무쌍한 사이버 위협에 맞서 스스로 학습하고 적응할 수 있는 능력이 큰 강점이다.  한편 해커들이 머신러닝과 AI를 악용하여 사이버 공격을 확대하고, 보안 통제를 회피하며, 전례 없는 속도로 파괴적인 결과를 초래하는 새로운 취약성을 찾아내고 있다. 이 글에서는 해커가 이러한 기술을 악용하는 가장 일반적인 방법 9가지를 알아보고자 한다.  1. 스팸 필터를 속이는 스팸 메일  시장조사기관 옴디아(Omdia)의 애널리스트 페르난도 몬테네그로는 보안 관리자들이 수십 년 동안 스팸 메일을 걸러내는 데 머신러닝을 사용해 왔다고 말했다. “스팸 메일 차단이 머신러닝이 활용된 최초의 사례였다”라고 그는 설명했다. 하지만 머신러닝은 스팸 방지 필터를 속이는 데 악용될 수 있다. 스팸 필터가 특정 메일을 차단한 이유나 ‘스팸 지수’ 같은 정보를 생성한다면, 해커는 이를 사용하여 스팸 메일의 내용을 조정할 수 있다. “계속 이메일을 전송하면서 정보를 얻으면 스팸 필터 모델의 작동 기준을 재구성할 수 있다. 이를 통해 메일 내용을 미세하게 바꿔가면서 스팸 필터를 우회할 수 있게 된다”라고 그는 설명했다.   취약점은 스팸 필터에만 있지 않다. 몬테네그로는 점수나 기타 수치를 제공하는 보안업체가 잠재적으로 악용될 수 있다고 말했다. "모든 업체가 이러한 취약점을 안고 있는 것은 아니지만, 주의하지 않으면 누군가가 악용할 수 있는 정보를 의도치 않게 제공하게 될 수 있다"라고 그는 덧붙였다.  2. 더 정교해진 피싱 메일 공격자는 메시지가 스팸 필터를 통과할 수 있는지 테스트하기 위해 머신러닝 보안 도구를 사용하는 데 그치지 ...

2022.06.14

AWS, 서버리스 앱에 ‘ML 기반 분석’ 추가

‘아마존 데브옵스 구루 포 서버리스(Amazon DevOps Guru for Serverless)’는 머신러닝을 사용하여 AWS 람다(AWS Lambda) 애플리케이션의 운영 가용성과 성능을 향상시킨다.    AWS가 머신러닝을 통해 AWS 람다 서버리스 애플리케이션의 운영 가용성과 성능을 개선하는 서비스 ‘아마존 데브옵스 구루 포 서버리스’를 공개했다. 지난 4월 21일(현지 시각) 발표된 이 AWS 람다 지원은 애플리케이션 동작 모니터링을 위한 아마존 데브옵스 구루 서비스의 새로운 기능이다. 아마존 데브옵스 구루는 모든 아마존 관계형 데이베이스 서비스에서도 사용할 수 있다.  회사에 따르면 아마존 데브옵스 구루는 수년간 AWS 및 아마존닷컴 운영에서 얻은 데이터를 기반으로 하는 머신러닝 모델을 사용하여 개발자가 애플리케이션 성능을 향상시킬 수 있도록 지원한다. AWS 람다를 쓰는 개발자는 이 서비스를 활용하여 기능 수준에서 비정상적인 동작을 자동으로 감지하고, ML 기반 권장사항을 통해 발견된 문제를 해결할 수 있다. 이를테면 메모리 활용도가 낮거나 프로비저닝되지 않은 동시성 등의 문제를 감지할 수 있다고 회사 측은 설명했다.  문제가 감지되면 아마존 데브옵스 구루 포 서버리스는 데브옵스 구루 콘솔에 결과를 표시하고, 아마존 이벤트브릿지(Amazon EventBridge) 또는 아마존 심플 노티피케이션 서비스(Amazon Simple Notification Service)를 통해 알림을 보낸다. 개발자는 데브옵스 구루 콘솔을 탐색하여 람다 기반 애플리케이션, 기타 지원되는 리소스 또는 전체 계정에서 해당 서비스를 활성화할 수 있다.  아마존 데브옵스 구루에서 제공하는 구체적인 운영 문제 및 사전 예방적 인사이트는 다음과 같다. • 아마존 람다 동시 실행이 계정 제한에 도달하거나 동시 실행이 연속적으로 계정 제한에 도달하면 트리거된다.  • AWS 람다에 프로비저닝된 동시성의 용량이 부족할 때...

AWS 아마존 웹 서비스 클라우드 서버리스 애플리케이션 머신러닝 AWS 람다

2022.04.22

‘아마존 데브옵스 구루 포 서버리스(Amazon DevOps Guru for Serverless)’는 머신러닝을 사용하여 AWS 람다(AWS Lambda) 애플리케이션의 운영 가용성과 성능을 향상시킨다.    AWS가 머신러닝을 통해 AWS 람다 서버리스 애플리케이션의 운영 가용성과 성능을 개선하는 서비스 ‘아마존 데브옵스 구루 포 서버리스’를 공개했다. 지난 4월 21일(현지 시각) 발표된 이 AWS 람다 지원은 애플리케이션 동작 모니터링을 위한 아마존 데브옵스 구루 서비스의 새로운 기능이다. 아마존 데브옵스 구루는 모든 아마존 관계형 데이베이스 서비스에서도 사용할 수 있다.  회사에 따르면 아마존 데브옵스 구루는 수년간 AWS 및 아마존닷컴 운영에서 얻은 데이터를 기반으로 하는 머신러닝 모델을 사용하여 개발자가 애플리케이션 성능을 향상시킬 수 있도록 지원한다. AWS 람다를 쓰는 개발자는 이 서비스를 활용하여 기능 수준에서 비정상적인 동작을 자동으로 감지하고, ML 기반 권장사항을 통해 발견된 문제를 해결할 수 있다. 이를테면 메모리 활용도가 낮거나 프로비저닝되지 않은 동시성 등의 문제를 감지할 수 있다고 회사 측은 설명했다.  문제가 감지되면 아마존 데브옵스 구루 포 서버리스는 데브옵스 구루 콘솔에 결과를 표시하고, 아마존 이벤트브릿지(Amazon EventBridge) 또는 아마존 심플 노티피케이션 서비스(Amazon Simple Notification Service)를 통해 알림을 보낸다. 개발자는 데브옵스 구루 콘솔을 탐색하여 람다 기반 애플리케이션, 기타 지원되는 리소스 또는 전체 계정에서 해당 서비스를 활성화할 수 있다.  아마존 데브옵스 구루에서 제공하는 구체적인 운영 문제 및 사전 예방적 인사이트는 다음과 같다. • 아마존 람다 동시 실행이 계정 제한에 도달하거나 동시 실행이 연속적으로 계정 제한에 도달하면 트리거된다.  • AWS 람다에 프로비저닝된 동시성의 용량이 부족할 때...

2022.04.22

“기업 절반은 AI 쓴다” 달라진 HR 풍속도

직원 이탈 문제가 점점 더 커지면서 기업들은 직원 감정 분석, 퇴사 가능성 식별, 커리어 지원 강화 등 HR 전략을 증강하고자 챗봇과 머신러닝으로 눈을 돌리고 있다.  사람들이 기록적인 수준으로 직장을 그만두고 있다. 기업들은 직원들을 유지하는 데 어려움을 겪고 있다. 게다가 직원들의 재택근무는 이 문제를 악화시키고 있다. 관리자들이 불만 있는 직원들을 식별하기가 까다로워졌기 때문이다. 또 신입사원이 교육 세션에 직접 참석할 수 없거나, 현장에서 경험이 풍부한 직원을 따라 업무를 배울 수 없게 되면서 새로운 직원을 빠르게 채용하고 교육하기가 더 어려워졌다. 이러한 모든 문제를 해결하기 위해 기업들이 인공지능으로 눈을 돌리고 있다. 물론 AI가 할 수 있는 일에는 한계가 있다.   AI를 통한 직원들의 감정 분석 ‘대퇴사(Great Resignation)’는 과장이 아니다. 팬데믹 기간 동안 전례 없는 퇴사자가 발생했다. (퇴사자 수는) 2019년 4,200만 명에서 2020년 4,800만 명으로 사상 최대를 기록했다. 지난 3월 공개된 맥킨지 설문조사 결과에 따르면 직원들이 퇴사하는 주요 원인으로는 ‘지속 불가능한 업무 성과 기대치, 커리어 개발 및 발전 가능성 부족, 의미 없는 업무’ 등이 꼽혔다. 오히려 ‘보상 부족’은 6위에 있었다. 그렇다면 사람들이 직장을 그만두는 가장 큰 이유는 무엇일까? 바로 ‘무관심한 리더’였다.  문제는 재택근무로 인해 직원들이 어려움을 겪고 있는지 알아차리기가 힘들 수 있다는 점이다. KPMG의 의사결정 과학 부문 책임자 빌 노왁키는 “구식이긴 하지만 직접 돌아다니면서 관리하는 것을 대체할 수 있는 수단이 없다고 생각한다. 이를테면 부하 직원의 딸이 지난주에 축구 경기를 했다는 걸 아는 관리자보다 더 나은 관리자는 없다”라고 말했다. 하지만 기업들은 (재택근무라는 현실에) 적응해야 했고, 일부는 재택 및 하이브리드 근무가 상당한 이점을 제공한다는 사실을 발견했다고 그는 언급했다. “재택근무는...

AI 챗봇 HR 인력 이탈 직원 이탈 퇴사 이직 직원 유지 대퇴사 채용 머신러닝 인공지능

2022.04.11

직원 이탈 문제가 점점 더 커지면서 기업들은 직원 감정 분석, 퇴사 가능성 식별, 커리어 지원 강화 등 HR 전략을 증강하고자 챗봇과 머신러닝으로 눈을 돌리고 있다.  사람들이 기록적인 수준으로 직장을 그만두고 있다. 기업들은 직원들을 유지하는 데 어려움을 겪고 있다. 게다가 직원들의 재택근무는 이 문제를 악화시키고 있다. 관리자들이 불만 있는 직원들을 식별하기가 까다로워졌기 때문이다. 또 신입사원이 교육 세션에 직접 참석할 수 없거나, 현장에서 경험이 풍부한 직원을 따라 업무를 배울 수 없게 되면서 새로운 직원을 빠르게 채용하고 교육하기가 더 어려워졌다. 이러한 모든 문제를 해결하기 위해 기업들이 인공지능으로 눈을 돌리고 있다. 물론 AI가 할 수 있는 일에는 한계가 있다.   AI를 통한 직원들의 감정 분석 ‘대퇴사(Great Resignation)’는 과장이 아니다. 팬데믹 기간 동안 전례 없는 퇴사자가 발생했다. (퇴사자 수는) 2019년 4,200만 명에서 2020년 4,800만 명으로 사상 최대를 기록했다. 지난 3월 공개된 맥킨지 설문조사 결과에 따르면 직원들이 퇴사하는 주요 원인으로는 ‘지속 불가능한 업무 성과 기대치, 커리어 개발 및 발전 가능성 부족, 의미 없는 업무’ 등이 꼽혔다. 오히려 ‘보상 부족’은 6위에 있었다. 그렇다면 사람들이 직장을 그만두는 가장 큰 이유는 무엇일까? 바로 ‘무관심한 리더’였다.  문제는 재택근무로 인해 직원들이 어려움을 겪고 있는지 알아차리기가 힘들 수 있다는 점이다. KPMG의 의사결정 과학 부문 책임자 빌 노왁키는 “구식이긴 하지만 직접 돌아다니면서 관리하는 것을 대체할 수 있는 수단이 없다고 생각한다. 이를테면 부하 직원의 딸이 지난주에 축구 경기를 했다는 걸 아는 관리자보다 더 나은 관리자는 없다”라고 말했다. 하지만 기업들은 (재택근무라는 현실에) 적응해야 했고, 일부는 재택 및 하이브리드 근무가 상당한 이점을 제공한다는 사실을 발견했다고 그는 언급했다. “재택근무는...

2022.04.11

오라클, MySQL 애플리케이션에 머신러닝 기능 추가

오라클이 오라클 MySQL 히트웨이브(Oracle MySQL HeatWave)에 데이터베이스 내 머신러닝(ML) 기능을 추가했다고 4월 5일 밝혔다.  회사에 따르면 MySQL 히트웨이브 ML은 머신러닝의 수명 주기를 완전 자동화하고 학습된 모델 모두를 MySQL 내에 저장해, 외부의 머신러닝 도구나 서비스로 데이터와 모델을 이동하지 않아도 된다. ETL(추출, 변환 및 적재) 절차가 사라지며 애플리케이션 복잡성과 비용이 감소하고 머신러닝 모델과 데이터의 보안성이 개선됐다고 업체 측은 설명했다.  히트웨이브 ML 기능은 전 세계 37개의 모든 오라클 클라우드 인프라스트럭처(OCI) 리전에서 MySQL 히트웨이브 데이터베이스 클라우드 서비스에 포함돼 제공된다. 오라클은 뉴머라이, 노마오, 은행권 마케팅 등의 데이터 세트를 비롯해 분류 및 회귀 분석 작업을 위해 일반에 공개된 다양한 머신러닝 데이터의 벤치마크 결과를 공개했다. 가장 작은 클러스터로 구성된 머신러닝 모델의 경우, 히트웨이브 ML은 아마존 레드시프트 ML 대비 평균 1%의 비용으로 25배 빠른 학습이 가능하다.  또한, 더 큰 규모의 히트웨이브 클러스터에서 학습할 경우, 레드시프트 ML 대비 성능 향상폭은 더욱 증가한다. MySQL 히트웨이브 이용자들은 기존에 많은 시간이 소요되던 훈련을 빠른 시간 안에 효율적으로 완료할 수 있기에 주기적인 모델 재학습을 통해 잦은 데이터 변경 사항도 반영할 수 있어 모델을 최신 상태로 유지할 뿐 아니라 예측의 정확성 또한 향상시킨다. 오라클 총괄 아키텍트인 에드워드 스크리븐은 “이번에 발표된 여러 가지 혁신 기능들은 히트웨이브의 성능 향상뿐만 아니라 가용성을 개선하는 동시에 비용도 절감해준다”며, “오라클이 새롭게 발표한 벤치마크 결과는 스노우플레이크, AWS, 마이크로소프트, 구글과 비교 시 MySQL 히트웨이브가 더욱 빠르고 저렴하다는 사실을 다시 한번 분명하게 보여주었다”고 말했다.  오라클은 기타 클라우드...

오라클 MySQL 머신러닝

2022.04.05

오라클이 오라클 MySQL 히트웨이브(Oracle MySQL HeatWave)에 데이터베이스 내 머신러닝(ML) 기능을 추가했다고 4월 5일 밝혔다.  회사에 따르면 MySQL 히트웨이브 ML은 머신러닝의 수명 주기를 완전 자동화하고 학습된 모델 모두를 MySQL 내에 저장해, 외부의 머신러닝 도구나 서비스로 데이터와 모델을 이동하지 않아도 된다. ETL(추출, 변환 및 적재) 절차가 사라지며 애플리케이션 복잡성과 비용이 감소하고 머신러닝 모델과 데이터의 보안성이 개선됐다고 업체 측은 설명했다.  히트웨이브 ML 기능은 전 세계 37개의 모든 오라클 클라우드 인프라스트럭처(OCI) 리전에서 MySQL 히트웨이브 데이터베이스 클라우드 서비스에 포함돼 제공된다. 오라클은 뉴머라이, 노마오, 은행권 마케팅 등의 데이터 세트를 비롯해 분류 및 회귀 분석 작업을 위해 일반에 공개된 다양한 머신러닝 데이터의 벤치마크 결과를 공개했다. 가장 작은 클러스터로 구성된 머신러닝 모델의 경우, 히트웨이브 ML은 아마존 레드시프트 ML 대비 평균 1%의 비용으로 25배 빠른 학습이 가능하다.  또한, 더 큰 규모의 히트웨이브 클러스터에서 학습할 경우, 레드시프트 ML 대비 성능 향상폭은 더욱 증가한다. MySQL 히트웨이브 이용자들은 기존에 많은 시간이 소요되던 훈련을 빠른 시간 안에 효율적으로 완료할 수 있기에 주기적인 모델 재학습을 통해 잦은 데이터 변경 사항도 반영할 수 있어 모델을 최신 상태로 유지할 뿐 아니라 예측의 정확성 또한 향상시킨다. 오라클 총괄 아키텍트인 에드워드 스크리븐은 “이번에 발표된 여러 가지 혁신 기능들은 히트웨이브의 성능 향상뿐만 아니라 가용성을 개선하는 동시에 비용도 절감해준다”며, “오라클이 새롭게 발표한 벤치마크 결과는 스노우플레이크, AWS, 마이크로소프트, 구글과 비교 시 MySQL 히트웨이브가 더욱 빠르고 저렴하다는 사실을 다시 한번 분명하게 보여주었다”고 말했다.  오라클은 기타 클라우드...

2022.04.05

칼럼 | 인공지능에 '지능'은 없다

자율주행 차량부터 슈퍼볼 광고의 춤추는 로봇까지 인공지능(Artificial Intelligence, AI)은 모든 곳에 존재한다. 하지만 모든 AI 사례의 문제점은 실제로 ‘지능적’이지 않다는 점이다. 이런 사례는 AI 기법을 사용하여 특정 문제를 해결하는 애플리케이션, 즉 ‘약인공지능(Narrow AI)’를 보여준다. 약인공지능은 인간이 보유한 지능과는 다르다.   인간은 (바라건대) 일반적인 지능을 보유하고 있다. 인간은 광범위한 문제를 해결할 수 있고 이전에 맞닥뜨리지 않았던 문제를 해결하는 방법을 배울 수 있다. 새로운 상황과 새로운 것을 배울 수 있으며, 물리적인 물체가 3차원 환경에 존재하고 시간의 흐름 같은 다양한 물리적 속성이 적용된다는 것을 이해한다. 인간 수준의 사고 능력 또는 범용인공지능(Artificial General Intelligence, AGI)을 인공적으로 복제할 수 있는 능력은 오늘날 우리가 생각하는 AI에는 존재하지 않는다.  지금까지 AI가 보여준 압도적인 성능을 무시하는 것은 아니다. 구글 검색은 대부분 사용자가 주기적으로 사용하는 AI의 좋은 예다. 구글은 많은 양의 정보를 놀라운 속도로 검색해 (일반적으로) 사용자가 원하는 결과를 목록의 상단에 제공한다. 마찬가지로 구글 보이스 서치(Google Voice Search)로 사용자는 구두로 검색을 요청할 수 있다. 애매모호한 표현을 사용하더라도 적절한 철자법, 맞춤법, 의미가 적용된 결과를 얻는다. 구글 검색이 잘 작동하는 이유는 무엇일까? 구글은 엄청난 양의 검색어와 사용자가 선택한 결과에 대한 이력 데이터를 보유하고 있다. 이런 데이터에서 검색할 가능성이 큰 검색어와 시스템을 유용하게 만들 수 있는 결과를 예측할 수 있다. 하지만 시스템이 수행 중인 작업이나 제시하는 결과를 이해할 것이라는 기대는 없다. 그래서 엄청난 양의 이력 데이터가 필요한 것이다. 사용자와의 모든 상호작용은 훈련 세트 데이터 생성에 활용할 수 있어 검색에 꽤 효과적이다...

인공지능 AI 머신러닝 ML

2022.04.01

자율주행 차량부터 슈퍼볼 광고의 춤추는 로봇까지 인공지능(Artificial Intelligence, AI)은 모든 곳에 존재한다. 하지만 모든 AI 사례의 문제점은 실제로 ‘지능적’이지 않다는 점이다. 이런 사례는 AI 기법을 사용하여 특정 문제를 해결하는 애플리케이션, 즉 ‘약인공지능(Narrow AI)’를 보여준다. 약인공지능은 인간이 보유한 지능과는 다르다.   인간은 (바라건대) 일반적인 지능을 보유하고 있다. 인간은 광범위한 문제를 해결할 수 있고 이전에 맞닥뜨리지 않았던 문제를 해결하는 방법을 배울 수 있다. 새로운 상황과 새로운 것을 배울 수 있으며, 물리적인 물체가 3차원 환경에 존재하고 시간의 흐름 같은 다양한 물리적 속성이 적용된다는 것을 이해한다. 인간 수준의 사고 능력 또는 범용인공지능(Artificial General Intelligence, AGI)을 인공적으로 복제할 수 있는 능력은 오늘날 우리가 생각하는 AI에는 존재하지 않는다.  지금까지 AI가 보여준 압도적인 성능을 무시하는 것은 아니다. 구글 검색은 대부분 사용자가 주기적으로 사용하는 AI의 좋은 예다. 구글은 많은 양의 정보를 놀라운 속도로 검색해 (일반적으로) 사용자가 원하는 결과를 목록의 상단에 제공한다. 마찬가지로 구글 보이스 서치(Google Voice Search)로 사용자는 구두로 검색을 요청할 수 있다. 애매모호한 표현을 사용하더라도 적절한 철자법, 맞춤법, 의미가 적용된 결과를 얻는다. 구글 검색이 잘 작동하는 이유는 무엇일까? 구글은 엄청난 양의 검색어와 사용자가 선택한 결과에 대한 이력 데이터를 보유하고 있다. 이런 데이터에서 검색할 가능성이 큰 검색어와 시스템을 유용하게 만들 수 있는 결과를 예측할 수 있다. 하지만 시스템이 수행 중인 작업이나 제시하는 결과를 이해할 것이라는 기대는 없다. 그래서 엄청난 양의 이력 데이터가 필요한 것이다. 사용자와의 모든 상호작용은 훈련 세트 데이터 생성에 활용할 수 있어 검색에 꽤 효과적이다...

2022.04.01

스택 오버플로우 복붙보다 나쁘다? ‘AI 생성 코드’를 믿을 수 없는 이유

깃허브 코파일럿, 탭나인 등의 AI 기반 도구는 개발자가 코드를 더 빠르게 작성하도록 돕는 자동완성 제안을 지원한다. 하지만 이렇게 생성된 코드가 안전하다고 어떻게 믿을 수 있을까?  2021년 6월, 깃허브가 코드 자동완성 도구 ‘코파일럿’을 출시했을 때 많은 개발자는 이 도구가 ‘내 마음을 읽고 코드를 더 빨리 쓸 수 있도록 도와준다’라며 놀라움을 감추지 못했다. 코파일럿은 누군가가 쓴 변수 이름과 주석을 기반으로 다음에 무엇이 올지 제안한다. 이는 코드 줄 또는 개발자가 작성 방법을 모를 수도 있는 전체 함수를 제공한다.    하지만 개발자가 확인하지 않고 이러한 제안을 사용하면 보안 취약점이 발생할 수 있다. 美 뉴욕대학교의 탠던 공대 연구진에 따르면 코파일럿을 테스트한 결과 이 도구가 생성한 코드의 40%에서 취약점이 발견됐다. 연구진은 알려진 취약점을 자동으로 찾아내는 깃허브의 코드QL(CodeQL)을 사용하여 (코파일럿이 생성한) 코드를 확인했고, ‘2021년 CWE 가장 위험한 소프트웨어 취약점 25개(2021 Top 25 Most Dangerous Software Weakness)’ 목록에 포함된 SQL 주입 취약점 또는 결함을 발견했다. 또 베리로그(Verilog) 등의 도메인 특정 언어의 경우 구문적으로 정확하고 의미 있는 코드를 생성하는 데 어려움을 겪었다고 언급했다.  이러한 문제의 대부분은 코파일럿이 구축된 방식에서 비롯된다. 첫째, 이 모델은 깃허브에 게시된 코드를 학습했는데, 이러한 코드의 상당 부분은 검증되지 않았다. 둘째, 오픈소스 리포지토리에는 충분한 경계를 구축하지 않고 입력 및 동작을 검사하는 많은 반복 코드 패턴이 포함될 수 있다. 코파일럿은 패턴이 빈번할수록 더 널리 사용되고, 따라서 안전하다는 가정하에 이러한 패턴을 제안한다. 셋째, 생성된 코드는 컴파일되지 않고, 잠재적인 보안 문제가 없는지 확인되지도 않는다. 아울러 연구진은 누군가의 리포지토리에 실수로 남겨진 일부 기밀...

깃허브 깃허브 코파일럿 AI 머신러닝 코드 자동완성 개발자 탭나인 인공지능 프로그래밍

2022.03.23

깃허브 코파일럿, 탭나인 등의 AI 기반 도구는 개발자가 코드를 더 빠르게 작성하도록 돕는 자동완성 제안을 지원한다. 하지만 이렇게 생성된 코드가 안전하다고 어떻게 믿을 수 있을까?  2021년 6월, 깃허브가 코드 자동완성 도구 ‘코파일럿’을 출시했을 때 많은 개발자는 이 도구가 ‘내 마음을 읽고 코드를 더 빨리 쓸 수 있도록 도와준다’라며 놀라움을 감추지 못했다. 코파일럿은 누군가가 쓴 변수 이름과 주석을 기반으로 다음에 무엇이 올지 제안한다. 이는 코드 줄 또는 개발자가 작성 방법을 모를 수도 있는 전체 함수를 제공한다.    하지만 개발자가 확인하지 않고 이러한 제안을 사용하면 보안 취약점이 발생할 수 있다. 美 뉴욕대학교의 탠던 공대 연구진에 따르면 코파일럿을 테스트한 결과 이 도구가 생성한 코드의 40%에서 취약점이 발견됐다. 연구진은 알려진 취약점을 자동으로 찾아내는 깃허브의 코드QL(CodeQL)을 사용하여 (코파일럿이 생성한) 코드를 확인했고, ‘2021년 CWE 가장 위험한 소프트웨어 취약점 25개(2021 Top 25 Most Dangerous Software Weakness)’ 목록에 포함된 SQL 주입 취약점 또는 결함을 발견했다. 또 베리로그(Verilog) 등의 도메인 특정 언어의 경우 구문적으로 정확하고 의미 있는 코드를 생성하는 데 어려움을 겪었다고 언급했다.  이러한 문제의 대부분은 코파일럿이 구축된 방식에서 비롯된다. 첫째, 이 모델은 깃허브에 게시된 코드를 학습했는데, 이러한 코드의 상당 부분은 검증되지 않았다. 둘째, 오픈소스 리포지토리에는 충분한 경계를 구축하지 않고 입력 및 동작을 검사하는 많은 반복 코드 패턴이 포함될 수 있다. 코파일럿은 패턴이 빈번할수록 더 널리 사용되고, 따라서 안전하다는 가정하에 이러한 패턴을 제안한다. 셋째, 생성된 코드는 컴파일되지 않고, 잠재적인 보안 문제가 없는지 확인되지도 않는다. 아울러 연구진은 누군가의 리포지토리에 실수로 남겨진 일부 기밀...

2022.03.23

‘노코드 AI’에서 미래를 보다··· 엑스페리언 데이터랩의 혁신 이야기

글로벌 신용정보평가사 ‘엑스페리언(Experian)’은 데이터를 원동력으로 하는 회사라는 사실에 자부심을 갖고 있다. 그리고 이러한 데이터 중심 활동의 선봉에는 ‘엑스페리언 데이터랩(Experian DataLabs)’이 있다. 이 사업부는 데이터로 비즈니스를 혁신할 기회를 모색하고 있다.  엑스페리언 데이터랩의 수석 부사장 겸 최고 데이터 과학자 케빈 첸은 “고객이 고수익을 얻을 기회를 포착하면 연구 자원을 투입하여 상품화 가능한 프로토타입을 개발한다”라고 말했다.  그에 따르면 데이터랩 팀은 자유롭게 실험하고 아이디어를 솔루션화하면 이를 실행할 사업부에 넘긴 다음 다시 새로운 것에 관심을 쏟는다. 첸은 “항상 새로운 아이디어를 시도해볼 수 있다. 이는 인재를 끌어들이는 하나의 매력 포인트다”라고 언급했다.    ‘노코드 AI’의 이점 엑스페리언 데이터랩은 솔루션이 비즈니스를 변혁할 수 있는 문제를 파악하는 데 중점을 두고 있으며, 첸은 이를 ‘영향력이 큰 문제(high-impact problems)’라고 부른다.  그는 소비자 신용부터 기업 신용, 온/오프라인 마케팅, 의료 정보 기술까지 여러 엑스페리언 사업부의 데이터를 연결했던 프로젝트를 예로 들었다. “과거 엑스페리언의 모든 데이터는 분산돼 있었고, 서로 연결돼 있지 않았다”라며, “그 모든 데이터를 함께 연계하는 건 간단한 일이 아니었다. 한 데이터가 데이터세트에 여러 방식으로 나타날 수 있기 때문이다. 데이터랩은 머신러닝을 활용하여 데이터세트를 학습하고 개별 데이터를 일치시켜 이 문제를 해결했다. 솔루션을 구축해보니 한 데이터세트에서 15~16개의 서로 다른 애플리케이션이 쏟아져 나왔다”라고 첸은 설명했다. 현재 ‘노코드 AI(No-code AI)’는 데이터랩의 주요 연구 분야다. 노코드 AI를 사용하면 드래그 앤드 드롭 인터페이스로 AI 및 머신러닝 모델을 구축할 수 있어 데이터 과학자 없이 일반 사용자도 AI를 활용할 수 있다. 하지만 첸은 ...

데이터 데이터 애널리틱스 노코드 AI 딥러닝 자연어 이해 자연어 처리 머신러닝 ML옵스 오토ML 비즈니스 인텔리전스 BI

2022.02.25

글로벌 신용정보평가사 ‘엑스페리언(Experian)’은 데이터를 원동력으로 하는 회사라는 사실에 자부심을 갖고 있다. 그리고 이러한 데이터 중심 활동의 선봉에는 ‘엑스페리언 데이터랩(Experian DataLabs)’이 있다. 이 사업부는 데이터로 비즈니스를 혁신할 기회를 모색하고 있다.  엑스페리언 데이터랩의 수석 부사장 겸 최고 데이터 과학자 케빈 첸은 “고객이 고수익을 얻을 기회를 포착하면 연구 자원을 투입하여 상품화 가능한 프로토타입을 개발한다”라고 말했다.  그에 따르면 데이터랩 팀은 자유롭게 실험하고 아이디어를 솔루션화하면 이를 실행할 사업부에 넘긴 다음 다시 새로운 것에 관심을 쏟는다. 첸은 “항상 새로운 아이디어를 시도해볼 수 있다. 이는 인재를 끌어들이는 하나의 매력 포인트다”라고 언급했다.    ‘노코드 AI’의 이점 엑스페리언 데이터랩은 솔루션이 비즈니스를 변혁할 수 있는 문제를 파악하는 데 중점을 두고 있으며, 첸은 이를 ‘영향력이 큰 문제(high-impact problems)’라고 부른다.  그는 소비자 신용부터 기업 신용, 온/오프라인 마케팅, 의료 정보 기술까지 여러 엑스페리언 사업부의 데이터를 연결했던 프로젝트를 예로 들었다. “과거 엑스페리언의 모든 데이터는 분산돼 있었고, 서로 연결돼 있지 않았다”라며, “그 모든 데이터를 함께 연계하는 건 간단한 일이 아니었다. 한 데이터가 데이터세트에 여러 방식으로 나타날 수 있기 때문이다. 데이터랩은 머신러닝을 활용하여 데이터세트를 학습하고 개별 데이터를 일치시켜 이 문제를 해결했다. 솔루션을 구축해보니 한 데이터세트에서 15~16개의 서로 다른 애플리케이션이 쏟아져 나왔다”라고 첸은 설명했다. 현재 ‘노코드 AI(No-code AI)’는 데이터랩의 주요 연구 분야다. 노코드 AI를 사용하면 드래그 앤드 드롭 인터페이스로 AI 및 머신러닝 모델을 구축할 수 있어 데이터 과학자 없이 일반 사용자도 AI를 활용할 수 있다. 하지만 첸은 ...

2022.02.25

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.4.0.31