데이터 처리의 어려움이란

내가 뭘 잘 모르긴 하지만... 아마도

데이터 전처리가 가장 힘이 들고 시간이 많이 투자하는 영역이 아닐까 싶다

기업들이 쓰는 데이터는 중간중간에 비어 있는 데이터도 있고

본인들만의 표기법을 쓴 곳도 많을 것이다

이걸 컴퓨터가 이해하고 학습하는데 노력이 필요한 것이다

아마 좀 더 발전하면 각 기업별로 비공개로 쓰는 학습방법들이 존재할 것이다

그런 일들은 컴퓨터 언어를 좀 더 깊게 배운 데이터 엔지니어들이 할 일이고

나는 그런 일은 하지 않을 것 같다

그들과 커뮤니케이션 가능하고 어떤 부분에서 개선이 필요하며

기업가의 눈으로 데이터를 해석하는 능력을 키우면 된다.

말은 참 쉽게 간편하지만 현실은 어려움의 연속이다.

컴퓨터는 말을 하지 못한다.

사람은 사람을 봐가면서 커뮤니케이션을 한다.

컴퓨터가 사람인 척할 수 있지만,

내가 '이해가 잘 가지 않는다.'라고 말하면 사람처럼 나한테 맞춰서 설명해 주지 않는다

아마 미래에는 가능할까? 기능적인 측면은 충분히 가능할 것이다

사람은 감정을 가졌기 때문에 불만족스러울 것이고 우리는 그 속에서 기회를 찾으면 되는 것이다

늦은 밤에 여러 생각이 들어 짧게 글을 써본다.

우선은 기초가 너무 빈약하기 때문에 기초를 쌓아올리는데 최선의 노력을 다해야 한다.

노력과 집중이 필요한 때이다.

네이버 블로그 원문 보기