Offcanvas

������������

'자연어 처리 혁신의 최첨단 이끈다' AI 스타트업 3곳

자연어 처리(Natural Language Processing, NLP)는 컴퓨터 과학자들의 오랜 꿈으로, 그 기원은 ELIZA 시절, 더 멀게는 컴퓨팅의 시초(튜링 테스트)까지 거슬러 올라간다. NLP는 지난 몇 년에 걸쳐 비약적인 혁신을 이루었으며, 이 과정에서 예전의 통계적 방법 대신 딥러닝 또는 신경망에 기초한 새로운 접근 방법이 대세로 자리 잡았다.  NLP에 딥러닝을 적용하면서 사람이 쓴 글과 전혀 구분이 불가능한 텍스트를 생성할 수 있는, GPT-3과 같은 방대하고 정교한 범용 언어 모델이 탄생했다. 예를 들어 자연어로 질의를 입력하면 백엔드가 코드를 생성하는(엑셀 구문을 기반으로 하는 파워 Fx 식) 마이크로소프트의 새로운 “노코드” 파워 앱(Power Apps) 플랫폼에 있는 여러 기능의 기반이 바로 GPT-3이다.  NLP는 기업 전반에서 방대한 잠재력을 지녔으며, 구글이나 마이크로소프트 같은 거대 기업만 참여하는 것도 아니다. 여기서는 자체 맞춤형 NLP 솔루션을 구축하기 위한 구성요소로 다양한 AI 기반 솔루션을 제공하는 스타트업 3곳을 소개한다.    익스플로전(Explosion)  NLP 분야에서 일하는 대부분의 개발자는 인기 있는 파이썬용 NLP 파이브러리인 스페이시(spaCy)를 사용하겠지만, 정작 익스플로전에 대해 들어본 사람은 그렇게 많지 않을 것이다. 익스플로전은 매튜 하니발과 아이네스 몬타니가 만든 회사로 스페이시와 상용 주석 툴인 프로디지(Prodigy)의 개발사다.  오래 전부터 주요 NLP 툴킷 중 하나인 스페이시가 비슷한 연령대의 다른 라이브러리와 뚜렷하게 구분되는 특징은 방대한 프로덕션 워크로드를 가볍게 처리할 수 있다는 점이다. 스페이시를 오랜만에 다시 접한 사람에게는 놀라울 정도로, 스페이시는 NLP의 최신 기술과 보조를 잘 맞춘다. BERT와 같은 사전 훈련된 트랜스포머(Transformer) 모델을 기반으로 한 파이프라인을 사용하고, 파이토치(PyTo...

자연어처리 NLP 익스플로전 허킹페이스 스페이시 프로디지 존스노우랩스

2021.06.10

자연어 처리(Natural Language Processing, NLP)는 컴퓨터 과학자들의 오랜 꿈으로, 그 기원은 ELIZA 시절, 더 멀게는 컴퓨팅의 시초(튜링 테스트)까지 거슬러 올라간다. NLP는 지난 몇 년에 걸쳐 비약적인 혁신을 이루었으며, 이 과정에서 예전의 통계적 방법 대신 딥러닝 또는 신경망에 기초한 새로운 접근 방법이 대세로 자리 잡았다.  NLP에 딥러닝을 적용하면서 사람이 쓴 글과 전혀 구분이 불가능한 텍스트를 생성할 수 있는, GPT-3과 같은 방대하고 정교한 범용 언어 모델이 탄생했다. 예를 들어 자연어로 질의를 입력하면 백엔드가 코드를 생성하는(엑셀 구문을 기반으로 하는 파워 Fx 식) 마이크로소프트의 새로운 “노코드” 파워 앱(Power Apps) 플랫폼에 있는 여러 기능의 기반이 바로 GPT-3이다.  NLP는 기업 전반에서 방대한 잠재력을 지녔으며, 구글이나 마이크로소프트 같은 거대 기업만 참여하는 것도 아니다. 여기서는 자체 맞춤형 NLP 솔루션을 구축하기 위한 구성요소로 다양한 AI 기반 솔루션을 제공하는 스타트업 3곳을 소개한다.    익스플로전(Explosion)  NLP 분야에서 일하는 대부분의 개발자는 인기 있는 파이썬용 NLP 파이브러리인 스페이시(spaCy)를 사용하겠지만, 정작 익스플로전에 대해 들어본 사람은 그렇게 많지 않을 것이다. 익스플로전은 매튜 하니발과 아이네스 몬타니가 만든 회사로 스페이시와 상용 주석 툴인 프로디지(Prodigy)의 개발사다.  오래 전부터 주요 NLP 툴킷 중 하나인 스페이시가 비슷한 연령대의 다른 라이브러리와 뚜렷하게 구분되는 특징은 방대한 프로덕션 워크로드를 가볍게 처리할 수 있다는 점이다. 스페이시를 오랜만에 다시 접한 사람에게는 놀라울 정도로, 스페이시는 NLP의 최신 기술과 보조를 잘 맞춘다. BERT와 같은 사전 훈련된 트랜스포머(Transformer) 모델을 기반으로 한 파이프라인을 사용하고, 파이토치(PyTo...

2021.06.10

'누구나 할 수 있는 머신러닝' 6가지 AML 프로젝트

머신러닝은 강력하지만 그만한 대가를 치러야 한다. 기술과 도구, 하드웨어, 데이터를 갖춘다 해도 머신러닝 모델을 만들고 세밀하게 조정하는 데는 복잡함이 따른다. 그러나 머신러닝의 핵심이 과거 사람이 직접 해야 했던 일을 자동화하는 데 있다면 머신러닝 자체의 단조로운 작업을 머신러닝을 사용해서 해결하는 것도 가능하지 않을까? 짧게 답한다면 조건부로 가능하다. “AML(Autimated Machine Learning, 자동화된 머신러닝)”로 통용되는 몇 가지 기술은 모델을 준비하고 정확성을 개선하기 위해 점진적으로 다듬는 데 필요한 작업을 줄여줄 수 있다. AML은 아직 초기 단계다. 현재는 여러 가지 개별적인 조각과 상호 단절된 기술들의 모음이지만 빠른 속도로 상용화되고 있으며, 머신러닝 전문가가 아닌 일반적인 비즈니스 사용자도 이용할 수 있을 만큼 발전했다. 그 길을 이끌고 있는 6가지 AML 툴을 소개한다. Auto-sklearn과 Auto-Weka 이미 보급된 AML의 두 가지 예는 일반적인 머신러닝 기능 패키지로 폭넓게 사용되는 Scikit-learn 프로젝트를 강화하는 형태의 툴이다. Scikit-learn에는 여러 가지 “추정자(estimator)” 기능, 즉 제공된 데이터로 학습하기 위한 방법론이 제공된다. 적절한 추정자를 선택하는 일은 지루한 과정이 될 수 있는데, Auto-sklearn 프로젝트는 이러한 지루함을 일부 없애는 것을 목표로 한다. Auto-sklearn은 자체 분석을 수행해 주어진 Scikit-learn 작업을 위한 최적의 알고리즘과 하이퍼 매개변수 집합을 결정하는 보편적 추정자 기능을 제공한다. Auto-sklearn에도 여전히 일부 수작업이 필요하다. 최종 사용자는 튜닝 프로세스에서 사용할 수 있는 메모리와 시간 제한을 설정해야 한다. 그러나 이 정도만 선택하고 나머지를 머신에 맡기는 편이 모델 선택과 하이퍼 매개변수를 붙잡고 씨름하는 ...

자동화 AML AutoML H2o 프로디지

2017.09.25

머신러닝은 강력하지만 그만한 대가를 치러야 한다. 기술과 도구, 하드웨어, 데이터를 갖춘다 해도 머신러닝 모델을 만들고 세밀하게 조정하는 데는 복잡함이 따른다. 그러나 머신러닝의 핵심이 과거 사람이 직접 해야 했던 일을 자동화하는 데 있다면 머신러닝 자체의 단조로운 작업을 머신러닝을 사용해서 해결하는 것도 가능하지 않을까? 짧게 답한다면 조건부로 가능하다. “AML(Autimated Machine Learning, 자동화된 머신러닝)”로 통용되는 몇 가지 기술은 모델을 준비하고 정확성을 개선하기 위해 점진적으로 다듬는 데 필요한 작업을 줄여줄 수 있다. AML은 아직 초기 단계다. 현재는 여러 가지 개별적인 조각과 상호 단절된 기술들의 모음이지만 빠른 속도로 상용화되고 있으며, 머신러닝 전문가가 아닌 일반적인 비즈니스 사용자도 이용할 수 있을 만큼 발전했다. 그 길을 이끌고 있는 6가지 AML 툴을 소개한다. Auto-sklearn과 Auto-Weka 이미 보급된 AML의 두 가지 예는 일반적인 머신러닝 기능 패키지로 폭넓게 사용되는 Scikit-learn 프로젝트를 강화하는 형태의 툴이다. Scikit-learn에는 여러 가지 “추정자(estimator)” 기능, 즉 제공된 데이터로 학습하기 위한 방법론이 제공된다. 적절한 추정자를 선택하는 일은 지루한 과정이 될 수 있는데, Auto-sklearn 프로젝트는 이러한 지루함을 일부 없애는 것을 목표로 한다. Auto-sklearn은 자체 분석을 수행해 주어진 Scikit-learn 작업을 위한 최적의 알고리즘과 하이퍼 매개변수 집합을 결정하는 보편적 추정자 기능을 제공한다. Auto-sklearn에도 여전히 일부 수작업이 필요하다. 최종 사용자는 튜닝 프로세스에서 사용할 수 있는 메모리와 시간 제한을 설정해야 한다. 그러나 이 정도만 선택하고 나머지를 머신에 맡기는 편이 모델 선택과 하이퍼 매개변수를 붙잡고 씨름하는 ...

2017.09.25

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.4.0.6