업무현장에서 데이터 활용 시 가장 중요한 것은?

 

데이터 활용, '이것' 없으면 시작조차 어려울 수 있습니다

현장 데이터를 적극적으로 활용하면 새로운 인사이트를 얻을 수 있습니다. 하지만 쓸 수 있는 데이터를 찾고 병합하는 작업이 선행되어야 합니다. 현장 데이터 활용 과정에서 가장 많이 발생하는 문제와 극복 방법을 소개합니다.

 

 

 

 

현장 데이터란 통제되지 않은 환경에서 수집한 원시 데이터를 의미합니다. 연구자들은 현장 데이터 활용 과정을 통해 시스템의 작동 원리와 외부 요인의 영향을 이해할 수 있습니다.

 

현장 데이터 수집은 사용 사례에 따라 다양한 도구와 장비를 사용하여 수행할 수 있는데요. Self-service 데이터를 적극적으로 활용하면 새로운 인사이트를 창출할 수 있다는 장점이 있습니다.

 

하지만 실제로 수집한 현장 데이터를 재무 데이터와 결합하는 과정에서 데이터 품질 저하나 손실, 누락 등의 문제가 발생하는 것이 빈번합니다. 이 글에서는 현장 데이터 활용 과정에서 발생하는 문제와 원인, 극복 방법에 대해 살펴보겠습니다.



현장 데이터 활용 과정에서 발생하는 문제

현장 데이터 수집 프로세스
현장 데이터 수집 프로세스 (출처: Field Data Collection 101: Methods, Challenges, and Best Practices)

 

현장 데이터와 재무 데이터를 적극적으로 활용하면 조직 운영에 대한 종합적인 인사이트를 얻을 수 있습니다. 이 데이터를 기반으로 기업은 운영 효율성과 재무 건전성을 모두 고려하는 균형 잡힌 의사결정을 내릴 수 있죠.

 

하지만 현장 데이터는 원시 데이터에 가깝고, 각 데이터마다 형식이 다른 탓에 통합 및 활용 과정에서 많은 시행착오를 겪어왔습니다.

과거 기업들이 현장 데이터와 재무 데이터 결합에 실패했던 이유를 분석하면 다음과 같습니다.

 

 

재무 데이터와 현장 업무 데이터 결합에 과도한 시간이 소요됨

  • 다른 시스템과 형식으로 인해 데이터 통합이 복잡하고 오래 걸림
    • 재무 데이터와 현장 데이터는 각각 고유한 형식과 구조를 가진 서로 다른 시스템에서 관리되는 경우가 많습니다. 이러한 다양성은 데이터 통합 프로세스를 복잡하게 만듭니다.
    • 이러한 서로 다른 소스의 형식을 일치시키고 데이터를 통합하는 작업은 본질적으로 시간이 많이 소요되어 효율적인 데이터 활용 작업을 방해합니다.
  • 데이터 품질 문제
    • 누락된 값, 중복된 레코드, 잘못된 입력과 같은 문제는 통합 작업을 더욱 지연시킬 수 있습니다.
    • 열악한 데이터 품질은 통합된 데이터 집합의 신뢰성과 정확성에 직접적인 영향을 미칩니다.
  • 복잡한 비즈니스 로직
    • 현장 데이터와 재무 데이터를 결합하려면 특정 조건에서 데이터를 필터링하거나 여러 소스의 정보를 종합하여 새로운 데이터 세트를 만드는 등 복잡한 비즈니스 로직을 적용해야 하는 경우가 많습니다.
    • 자동화 도구나 소프트웨어의 도움 없이 이러한 프로세스를 수동으로 처리하면 비효율적일 뿐만 아니라 오류 발생 가능성도 높아져 데이터 활용 작업을 더욱 복잡하게 만듭니다.

 

현장 데이터 활용 과정에서 발생하는 문제

 

재무 부서 간 보고서 지표 또는 기준이 상이함

  • KPI와 지표의 다양한 정의
    • 재무 부서와 현업 부서에서 '비용'과 같은 핵심 성과 지표를 정의하는 방식에 차이가 있으면 오해가 생길 수 있습니다.
    • 재무 부서에서는 직접 비용에 초점을 맞추는 반면, 현장 운영 부서에서는 간접 비용을 포함할 수 있어 데이터 활용과 성과 해석에 영향을 미칠 수 있습니다.
  • 일관성 없는 데이터 수집 방법
    • 재무 데이터는 일반적으로 엄격한 회계 원칙에 따라 회계 소프트웨어를 통해 수집됩니다.
    • 반면 현장 데이터 수집은 수기 입력, 센서 등 더 다양한 방식으로 이루어집니다.
    • 이러한 차이로 인해 분석을 위해 데이터 집합을 병합할 때 데이터 활용에 호환성 문제가 발생합니다.
  • 문화 및 우선순위 차이
    • 재무(비용 관리 및 수익성)와 현장 운영(프로젝트 완료 및 품질) 간의 뚜렷한 우선순위와 문화는 커뮤니케이션 장벽을 만들 수 있습니다.
    • 이러한 차이는 보고 불일치 및 충돌로 이어져 데이터 활용과 협업적 의사 결정에 영향을 미칠 수 있습니다.



현장 데이터 활용 실패, 어떻게 극복해야 할까?

데이터 거버넌스 프레임워크 구현

데이터 가상화 기술을 기반으로 한 디노도 솔루션 프레임워크
데이터 가상화 기술을 기반으로 한 디노도 솔루션 프레임워크 (출처: 초보자를 위한 데이터 가상화 )

 

가장 우선적이며 중요한 프로세스는 데이터 표준과 품질, 수집 방법 및 사용 정책을 정의하는 것입니다. 데이터 활용 영역 전반에서 이정표가 되어 줄 규칙을 수립하는 것이죠.

 

이 프레임워크는 모든 부서에서 수집한 데이터에 일관성을 부여하는 역할을 합니다. 또한 데이터 품질을 개선하고 다양한 데이터 유형을 더 쉽게 통합할 수 있도록 하죠.

 

일반적으로 데이터 과학자들은 데이터 활용을 위해 데이터를 준비하고 통합하는 과정을 거칩니다. 이때 만약 데이터가 여러 소스에 분산되어 있고 각각 영향을 미치는 거버넌스 및 보안 아키텍처가 다르다면, 데이터 과학자는 사전 준비 과정에서 많은 시간을 낭비할 수밖에 없습니다.

 

만약 디노도의 데이터 가상화 솔루션이었다면 필요한 데이터를 신속하게 쿼리할 수 있겠죠. 활용 중인 데이터가 표준화되었으며, 고품질이고 거버넌스 및 보안 표준을 준수한다는 확신을 가질 수 있을 것입니다.

 

또한 디노도 플랫폼을 활용하는 기업들은 기존의 레거시 툴과 프로세스를 폐기하고 데이터 패브릭 기술을 통해 전반적인 용량과 민첩성을 향상시킬 수 있습니다.

 

실제로 약 250~300개의 ETL 프로그램을 사용하던 기업은 디노도의 데이터 가상화 솔루션을 사용한 뒤, 연간 50만 달러의 비용을 절감하고 모든 데이터를 통합할 수 있었죠.

 

 

측정 항목 및 보고 표준화

효과적인 현장 데이터 활용을 위한 측정 항목 및 보고 표준화

 

현장 데이터 활용 시 측정항목과 보고 지표의 표준화도 중요한 역할을 합니다. 요컨대, 조직 전체에서 합의된 통합 측정항목 및 보고 표준 세트를 개발하는 것입니다.

 

이는 데이터 해석 및 사용 방식의 일관성을 보장하기 위함인데요. 데이터의 정의를 표준화하고, 보고 기간과 성과 지표를 동일하게 맞추는 프로세스를 의미합니다.

 

 

예측 분석 AI

최근 수집한 데이터를 기반으로 미래를 예측하는 AI가 고도화되며 다양한 비즈니스 영역에서 활용되고 있습니다.

예측 분석 AI는 수동 분석보다는 훨씬 더 명확한 인사이트를 제공한다는 점에서 눈에 띄는데요.

통합 데이터 세트를 기반으로 머신러닝은 패턴을 식별하고, 추세를 예측하여 더 깊은 인사이트를 제공합니다.

 

 

지속적인 데이터 품질 개선

데이터 품질에 대한 모니터링 및 개선 프로세스를 구현하는 것은 데이터 정확도 유지에 중요한 역할을 합니다.

아무리 체계적인 프로세스와 거버넌스를 구축했다고 하더라도, 저품질의 데이터는 의사 결정에 악영향을 미치기 때문인데요.

 

데이터의 정확성과 완전성, 적시성을 정기적으로 검토하고 식별된 문제를 해결하기 위한 시정 조치를 취할 수 있도록 가이드를 수립해야 합니다.

 

 

 


<Reference.>