데이터 처리의 어려움이란
내가 뭘 잘 모르긴 하지만... 아마도
데이터 전처리가 가장 힘이 들고 시간이 많이 투자하는 영역이 아닐까 싶다
기업들이 쓰는 데이터는 중간중간에 비어 있는 데이터도 있고
본인들만의 표기법을 쓴 곳도 많을 것이다
이걸 컴퓨터가 이해하고 학습하는데 노력이 필요한 것이다
아마 좀 더 발전하면 각 기업별로 비공개로 쓰는 학습방법들이 존재할 것이다
그런 일들은 컴퓨터 언어를 좀 더 깊게 배운 데이터 엔지니어들이 할 일이고
나는 그런 일은 하지 않을 것 같다
그들과 커뮤니케이션 가능하고 어떤 부분에서 개선이 필요하며
기업가의 눈으로 데이터를 해석하는 능력을 키우면 된다.
말은 참 쉽게 간편하지만 현실은 어려움의 연속이다.
컴퓨터는 말을 하지 못한다.
사람은 사람을 봐가면서 커뮤니케이션을 한다.
컴퓨터가 사람인 척할 수 있지만,
내가 '이해가 잘 가지 않는다.'라고 말하면 사람처럼 나한테 맞춰서 설명해 주지 않는다
아마 미래에는 가능할까? 기능적인 측면은 충분히 가능할 것이다
사람은 감정을 가졌기 때문에 불만족스러울 것이고 우리는 그 속에서 기회를 찾으면 되는 것이다
늦은 밤에 여러 생각이 들어 짧게 글을 써본다.
우선은 기초가 너무 빈약하기 때문에 기초를 쌓아올리는데 최선의 노력을 다해야 한다.
노력과 집중이 필요한 때이다.