2017.10.27

열차 지연을 정시 운행으로 바꾼 지멘스 'IoT 데이터에서 해답 찾았다'

Tom Macaulay | Computerworld UK
지멘스는 1879년 최초의 승객용 전기 기관차를 포함하여 약 150년 동안 열차를 개발했다. 하지만 최근의 트랙(Track) 혁신은 데이터 분석에 의한 것이었다. 열차와 트랙에 대한 정보를 분석하기 위해 센서를 사용하여 대응적인 철도 유지 방법에서 선제적인 철도 유지 방법으로 바꾸는 데 도움이 되었다.



진단 센서 데이터를 통해 부품의 상태를 평가함으로써 해당 기업은 고장이 발생할 가능성이 높을 때 패턴을 찾기 시작할 수 있다. 그러고 나서 지멘스는 실시간에 가깝게 정보를 모니터링함으로써 서비스가 중단되기 전에 신속하게 대응할 수 있다. 비정상이 감지되는 경우 점검을 위해 부품을 송달한다.

이 접근방식의 이점으로는 지연 감지, 마일리지 증가, 노동 비용 감소, 더욱 효율적인 유지보수 일정 관리가 있다. 이를 통해 지멘스는 고객에 추가적인 성과 기반 유지보수 계약을 제공할 수 있다.

트랙에 데이터 공학 적용하기
수년 전 독일의 기관차 공장에서 지멘스는 열차 부품과 철도 인프라의 고장을 예측하는 알고리즘을 구축하기 위해 데이터 과학자 및 엔지니어로 팀을 구성했다.

지멘스의 모빌리티 데이터 서비스 책임자 제라드 크레스는 <컴퓨터월드 UK>와의 인터뷰에서 “그 이유는 산업 데이터가 내재된 데이터와 다르게 작동하며 우리가 사용하는 많은 전통적인 분석 모델이 이 환경에서 잘 작동하지 않기 때문이다”고 밝혔다. 크레스는 “이런 부품은 자주 고장 나지 않기 때문에 이전보다 훨씬 높은 예측 정확도가 필요하다”고 덧붙였다.

지난 2년 동안만 하더라도 그의 팀은 새로운 수학적 접근방식에 대한 30개의 특허를 출원했다.

2013년, 지멘스는 이런 모델을 고급 데이터 분석 역량으로 개발하기 위해 빅데이터 업체 테라데이타를 찾았다. 지멘스는 데이터 웨어하우스, AD(Aster Directory) 분석 툴, 하둡용 장비를 아우르는 자체 버전의 테라데이타 UDA(Unified Data Architecture)를 배치했다.

예측 분석이 제공하는 향상된 모니터링 역량 덕분에 러시아에서 지멘스의 고속 열차 가용성이 99.96%까지 상승했으며 태국에서 지하철 기관차가 99.98%까지 올라갔다.

또한 지멘스는 이 프레임워크를 사용하여 런던의 탬즈링크(Thameslink) 철도 시스템을 포함하여 영국에서 다양한 지역 열차를 위한 선제적인 유지보수를 제공한다.

열차의 센서 설정
크레스에 따르면 지멘스의 열차 데이터 분석 전략은 고장을 예측하기 위한 다양한 부품 상태 파악, 기후/승차감/화장실을 통한 승객 경험, 운영 비용 절감을 위한 최대 에너지 효율성 등 3가지 요소로 나뉜다.

그는 “열차의 수명 동안 에너지 소비량은 열차 구매 비용보다 많이 든다”며 “제대로 하면 10%는 손쉽게 줄일 수 있다”고 말했다.

일반적으로 기관차는 150~200개의 센서가 있으며 고속 열차는 객차당 300~350개의 센서가 있다. 각 브레이크에만 브레이크 압력과 유압 오일을 분석해 열차가 제때에 정지하도록 하는 센서가 여러 개 있다. 이것들은 부품 온도와 압력을 측정하고 이 데이터를 기록된 수천 개의 고장 및 수리 보고서와 비교한다.

크레스에 따르면, 센서 고장의 위험으로 너무 많은 센서를 설치하면 해결하는 것보다 많은 문제가 발생할 수 있다. 그는 “센서가 많으면 더 많이 고장 날 수 있기 때문에 센서 숫자를 최소화하려 한다”고 밝혔다.

모터, 기어박스, 베어링, 휠은 모두 기계적으로 연결되어 있으며 모두 자체적으로 개별적인 센서가 필요 없을 수 있다. 지멘스는 대신에 열전달 속도 등을 평가하는 알고리즘을 통해 각 부품의 오류를 계산하는 가상 센서를 사용한다.

또한 다양한 자산에 대한 데이터를 조합하여 열차와 트랙의 센서들이 서로를 모니터링함으로써 필요한 점검의 수를 줄일 수 있다.

분석의 이점은?
지멘스는 열차 운행을 지속하기 위해 사고 대응 및 일상 점검에 의존했었다. 이 과정에서 기술자는 열차를 열어 고장의 원인을 찾고 수리를 위해 돌아오기 전에 예비 부품과 공구를 가져온다.

그 결과는 수리 시간과 지연에 큰 영향을 끼쳤다. 열차에서 문이 하나 고장 나면 2개의 역 사이를 이동하기 위해 소요되는 시간에 10~15초가 추가된다. 20개의 역 후에는 열차가 이미 5분이나 늦게 돼 그 날의 노선 전체가 지연될 수 있다. 지멘스는 현재 각 열차의 문을 모니터링하고 잠재적인 고장을 찾을 수 있다.

크레스는 “탬즈링크 문에 문제가 있으면 때에 따라 1주일 반 전에 알릴 수 있다”며 “그런 다음 기술자는 해당 객차의 오른쪽 문짝인 5번 문을 보고 가서 점검하여 그리스를 적용하면 더 이상 고장 나지 않을 수 있다”고 말했다.

지멘스는 열차를 세워야 세울 정도의 고장 경보를 전송하는 센서를 사용하던 유로스타(Eurostar) 열차에도 유지보수를 제공한다. 하지만 이런 센서는 자체 고장에 취약했다.

크레스는 “몇 년 전 우리 팀이 없었을 때 이런 일이 발생했으며 트랙에서 700명이 대피해야 했다”고 당시를 회상하며 다음과 같이 이야기했다.

“우리는 1년 전에도 매우 비슷한 일을 겪었다. 우리는 우선 이것이 센서 문제라는 점을 인식했다. 열차가 고장 나기 1주일 반 전에 찾을 수 있다고 생각했다. 운영사에 그쪽의 해당 버기(Buggy)에 잇는 베어링의 센서를 교환해야 한다고 알릴 수 있었고 그들은 그렇게 했으며 운영이 중단되지 않았다.”

왜 테라데이타인가?
크레스는 "[테라데이타는] 해당 시장에서 데이터 웨어하우스 이상이라는 점을 이해한 유일한 기업이었다”며 “테라데이타를 두고 경쟁이 있었지만 우리가 그 이상이 가능한 시스템을 확보하는 데 필요한 데이터의 구조를 고려할 때 우리에게는 UDA가 중요했다”고 밝혔다.

지멘스는 아파치 스파크와 텐서플로를 포함한 프레임워크의 조합을 활용하여 각 개별 분석 작업을 위한 구체적인 머신러닝 방법을 개발한다. 이런 모델을 이용한 실험은 별도의 안전한 작업 환경에서 권장한다.

크레스는 “우리가 만들어야 하는 분석 모델은 데이터 과학자들이 데이터를 활용하고 모델의 구조를 식별할 수 있는 샌드박스(Sandbox)다”고 강조했다. 이어서 “이것이 확실해 지면 우리는 해당 모델을 운영할 수 있기를 바라며 개발, 시험, 운영의 전통적인 3층 구조를 갖게 된다”고 이야기했다.

이런 연속적인 통합 및 배치 프로세스는 동일한 기본 데이터 레이크를 사용하기 때문에 과학자들이 샌드박스 안에서도 존재하는 모든 데이터를 확인할 수 있고 필요한 통찰을 발견하기 위해 데이터 포인트를 조합하는 방법을 파악할 수 있다. 이런 창의적인 과정으로 인해 철도 모니터링 시 연속적으로 이행할 수 있는 분석 모델이 발생한다.

지멘스는 자체 레일 서비스를 위해 초당 5만 개 남짓의 데이터 포인트를 흡수하며 해당 데이터를 장기간 보관해야 한다. 지멘스 분석 작업 부하의 복잡성과 다양성으로 인해 모델을 배치할 때 테라데이타가 필수다.

크레스는 “모든 작업 부하의 균형을 잡고 시스템을 안정되게 유지할 수 있어야 한다”고 말했다. 이어서 “하둡에서 그렇게 하고 직원 중 한 명이 뛰어들어 거대한 작업 부하를 적용한다면 이후 이틀 동안 그 어떤 고객도 응답을 받지 못할 것이다. 그렇게 해서는 안 된다”고 덧붙였다. ciokr@idg.co.kr
 
2017.10.27

열차 지연을 정시 운행으로 바꾼 지멘스 'IoT 데이터에서 해답 찾았다'

Tom Macaulay | Computerworld UK
지멘스는 1879년 최초의 승객용 전기 기관차를 포함하여 약 150년 동안 열차를 개발했다. 하지만 최근의 트랙(Track) 혁신은 데이터 분석에 의한 것이었다. 열차와 트랙에 대한 정보를 분석하기 위해 센서를 사용하여 대응적인 철도 유지 방법에서 선제적인 철도 유지 방법으로 바꾸는 데 도움이 되었다.



진단 센서 데이터를 통해 부품의 상태를 평가함으로써 해당 기업은 고장이 발생할 가능성이 높을 때 패턴을 찾기 시작할 수 있다. 그러고 나서 지멘스는 실시간에 가깝게 정보를 모니터링함으로써 서비스가 중단되기 전에 신속하게 대응할 수 있다. 비정상이 감지되는 경우 점검을 위해 부품을 송달한다.

이 접근방식의 이점으로는 지연 감지, 마일리지 증가, 노동 비용 감소, 더욱 효율적인 유지보수 일정 관리가 있다. 이를 통해 지멘스는 고객에 추가적인 성과 기반 유지보수 계약을 제공할 수 있다.

트랙에 데이터 공학 적용하기
수년 전 독일의 기관차 공장에서 지멘스는 열차 부품과 철도 인프라의 고장을 예측하는 알고리즘을 구축하기 위해 데이터 과학자 및 엔지니어로 팀을 구성했다.

지멘스의 모빌리티 데이터 서비스 책임자 제라드 크레스는 <컴퓨터월드 UK>와의 인터뷰에서 “그 이유는 산업 데이터가 내재된 데이터와 다르게 작동하며 우리가 사용하는 많은 전통적인 분석 모델이 이 환경에서 잘 작동하지 않기 때문이다”고 밝혔다. 크레스는 “이런 부품은 자주 고장 나지 않기 때문에 이전보다 훨씬 높은 예측 정확도가 필요하다”고 덧붙였다.

지난 2년 동안만 하더라도 그의 팀은 새로운 수학적 접근방식에 대한 30개의 특허를 출원했다.

2013년, 지멘스는 이런 모델을 고급 데이터 분석 역량으로 개발하기 위해 빅데이터 업체 테라데이타를 찾았다. 지멘스는 데이터 웨어하우스, AD(Aster Directory) 분석 툴, 하둡용 장비를 아우르는 자체 버전의 테라데이타 UDA(Unified Data Architecture)를 배치했다.

예측 분석이 제공하는 향상된 모니터링 역량 덕분에 러시아에서 지멘스의 고속 열차 가용성이 99.96%까지 상승했으며 태국에서 지하철 기관차가 99.98%까지 올라갔다.

또한 지멘스는 이 프레임워크를 사용하여 런던의 탬즈링크(Thameslink) 철도 시스템을 포함하여 영국에서 다양한 지역 열차를 위한 선제적인 유지보수를 제공한다.

열차의 센서 설정
크레스에 따르면 지멘스의 열차 데이터 분석 전략은 고장을 예측하기 위한 다양한 부품 상태 파악, 기후/승차감/화장실을 통한 승객 경험, 운영 비용 절감을 위한 최대 에너지 효율성 등 3가지 요소로 나뉜다.

그는 “열차의 수명 동안 에너지 소비량은 열차 구매 비용보다 많이 든다”며 “제대로 하면 10%는 손쉽게 줄일 수 있다”고 말했다.

일반적으로 기관차는 150~200개의 센서가 있으며 고속 열차는 객차당 300~350개의 센서가 있다. 각 브레이크에만 브레이크 압력과 유압 오일을 분석해 열차가 제때에 정지하도록 하는 센서가 여러 개 있다. 이것들은 부품 온도와 압력을 측정하고 이 데이터를 기록된 수천 개의 고장 및 수리 보고서와 비교한다.

크레스에 따르면, 센서 고장의 위험으로 너무 많은 센서를 설치하면 해결하는 것보다 많은 문제가 발생할 수 있다. 그는 “센서가 많으면 더 많이 고장 날 수 있기 때문에 센서 숫자를 최소화하려 한다”고 밝혔다.

모터, 기어박스, 베어링, 휠은 모두 기계적으로 연결되어 있으며 모두 자체적으로 개별적인 센서가 필요 없을 수 있다. 지멘스는 대신에 열전달 속도 등을 평가하는 알고리즘을 통해 각 부품의 오류를 계산하는 가상 센서를 사용한다.

또한 다양한 자산에 대한 데이터를 조합하여 열차와 트랙의 센서들이 서로를 모니터링함으로써 필요한 점검의 수를 줄일 수 있다.

분석의 이점은?
지멘스는 열차 운행을 지속하기 위해 사고 대응 및 일상 점검에 의존했었다. 이 과정에서 기술자는 열차를 열어 고장의 원인을 찾고 수리를 위해 돌아오기 전에 예비 부품과 공구를 가져온다.

그 결과는 수리 시간과 지연에 큰 영향을 끼쳤다. 열차에서 문이 하나 고장 나면 2개의 역 사이를 이동하기 위해 소요되는 시간에 10~15초가 추가된다. 20개의 역 후에는 열차가 이미 5분이나 늦게 돼 그 날의 노선 전체가 지연될 수 있다. 지멘스는 현재 각 열차의 문을 모니터링하고 잠재적인 고장을 찾을 수 있다.

크레스는 “탬즈링크 문에 문제가 있으면 때에 따라 1주일 반 전에 알릴 수 있다”며 “그런 다음 기술자는 해당 객차의 오른쪽 문짝인 5번 문을 보고 가서 점검하여 그리스를 적용하면 더 이상 고장 나지 않을 수 있다”고 말했다.

지멘스는 열차를 세워야 세울 정도의 고장 경보를 전송하는 센서를 사용하던 유로스타(Eurostar) 열차에도 유지보수를 제공한다. 하지만 이런 센서는 자체 고장에 취약했다.

크레스는 “몇 년 전 우리 팀이 없었을 때 이런 일이 발생했으며 트랙에서 700명이 대피해야 했다”고 당시를 회상하며 다음과 같이 이야기했다.

“우리는 1년 전에도 매우 비슷한 일을 겪었다. 우리는 우선 이것이 센서 문제라는 점을 인식했다. 열차가 고장 나기 1주일 반 전에 찾을 수 있다고 생각했다. 운영사에 그쪽의 해당 버기(Buggy)에 잇는 베어링의 센서를 교환해야 한다고 알릴 수 있었고 그들은 그렇게 했으며 운영이 중단되지 않았다.”

왜 테라데이타인가?
크레스는 "[테라데이타는] 해당 시장에서 데이터 웨어하우스 이상이라는 점을 이해한 유일한 기업이었다”며 “테라데이타를 두고 경쟁이 있었지만 우리가 그 이상이 가능한 시스템을 확보하는 데 필요한 데이터의 구조를 고려할 때 우리에게는 UDA가 중요했다”고 밝혔다.

지멘스는 아파치 스파크와 텐서플로를 포함한 프레임워크의 조합을 활용하여 각 개별 분석 작업을 위한 구체적인 머신러닝 방법을 개발한다. 이런 모델을 이용한 실험은 별도의 안전한 작업 환경에서 권장한다.

크레스는 “우리가 만들어야 하는 분석 모델은 데이터 과학자들이 데이터를 활용하고 모델의 구조를 식별할 수 있는 샌드박스(Sandbox)다”고 강조했다. 이어서 “이것이 확실해 지면 우리는 해당 모델을 운영할 수 있기를 바라며 개발, 시험, 운영의 전통적인 3층 구조를 갖게 된다”고 이야기했다.

이런 연속적인 통합 및 배치 프로세스는 동일한 기본 데이터 레이크를 사용하기 때문에 과학자들이 샌드박스 안에서도 존재하는 모든 데이터를 확인할 수 있고 필요한 통찰을 발견하기 위해 데이터 포인트를 조합하는 방법을 파악할 수 있다. 이런 창의적인 과정으로 인해 철도 모니터링 시 연속적으로 이행할 수 있는 분석 모델이 발생한다.

지멘스는 자체 레일 서비스를 위해 초당 5만 개 남짓의 데이터 포인트를 흡수하며 해당 데이터를 장기간 보관해야 한다. 지멘스 분석 작업 부하의 복잡성과 다양성으로 인해 모델을 배치할 때 테라데이타가 필수다.

크레스는 “모든 작업 부하의 균형을 잡고 시스템을 안정되게 유지할 수 있어야 한다”고 말했다. 이어서 “하둡에서 그렇게 하고 직원 중 한 명이 뛰어들어 거대한 작업 부하를 적용한다면 이후 이틀 동안 그 어떤 고객도 응답을 받지 못할 것이다. 그렇게 해서는 안 된다”고 덧붙였다. ciokr@idg.co.kr
 
X