-
오늘은 Interactive Viz 강의를 들었다.
정적인 그래프 보다 동적인 그래프가 자원은 더 많이 들지만 경우에 따라 훨씬 효과적으로 표현 할 수 있고, 공간적 낭비를 줄일 수 있다.
이론적으로는 Interactive 종류가 굉장히 많지만 아직 구현이 안된 분야도 있다고 해서 이 분야도 깊게 공부해보면 좋을 것 같다는 생각이 들었다.
matplotlib도 인터렉티브를 제공하지만 local이나 주피터 노트북에서만 사용 가능하다는 단점이 있어서 plotly를 주로 사용한다고 했다.
지리 그래프나 3d그래프를 보면서 정적 그래프로는 표현하기 힘든 부분을 쉽게 구현할 수 있는 방법이 있다는 것을 알게 되었다.
멘토링 시간에는 멘토님이 시스템 디자인 인터뷰와 인성면접에 관한 자료를 준비해서 발표해주셨다.
처음 시스템 디자인을 들었을 때는 UI를 어떻게 표현할지에 관한 디자인인가 라고 생각했는데, API 설계, 트래픽, DB설계, 데이터 흐름, 퍼포먼스, 모니터링 등등 전체적인 시스템 흐름을 설계한다는 것을 알게 되었다.
이 부분을 어떻게 준비해야 하는지, 이 부분은 공부 분야가 정말 방대하기 때문에 아는 만큼 면접 때 이야기를 할 수 있다는 것을 듣고 AI에 한정적으로 공부하지 말고 다양한 분야에 대해서 알아가는 것이 좋겠다. 라는 생각이 들었다.
또한 인성 면접 때 자주 나오는 질문을 듣고, 내가 프로젝트를 하면서 갈등이나 어려웠던 점을 적어놓고 면접 때 활용할 수 있도록 해야겠다는 생각이 들었다.
피어세션 시간에는 멘토링 때 들었던 시스템 디자인에 관한 고찰, 합동 멘토링에 관한 이야기, 책에서 공부하기로 했던 내용 중 CountVectorizer에 관한 부분이 이해가 안가서 조원끼리 이야기를 했다.
CountVectorizer 는 저번에 얘기했던 BoW(Bag of word)의 한 방법으로 문장을 넣으면 각 단어가 문장의 인덱스와 feature의 갯수로 반환된다는 것을 알게 되었다. 자세한 내용은
sklearn CountVectorizer 클래스 사용법
Sklearn CountVectorizer 클래스 사용법 CountVectorizer 는 문서를 token count matrix로 변환하는 클래스입니다. 여기서 feature는 문장의 토큰 단위로 아래 TfidfVectorizer함수의 analyzer, tokenizer, to..
kugancity.tistory.com
에서 확인하면 될 것 같다.
다음으로 협업 필터링과 콘텐츠 기반 필터링에 대한 차이점에 관해서 질문도 있었고, 구하는 방법은 비슷할 수 있지만 사용하는 데이터에 따라서 차이가 나는 것 같다라는 결론을 내렸다. 또한 실무 또는 대회에서 사용할 때 만약 여러가지 필터링된 결과값을 사용하려면 어떻게 이것을 합쳐야 하는지에 대해서 질문을 했고, 모델에서 합치는 법, 결과값을 합치는 법 등등 다양한 방법이 있어서 모델을 돌려보고 결정을 해야 할 것 같다 라는 답변을 들었다.
또한 데이터의 저작권, 데이터 셋에 대해서 많은 얘기를 하면서 외부 대회나 부스트캠프 내에서 진행하는 데이터에 대해서 이야기를 나누었다.
마지막으로 나는 지금 있는 조원이 만든 조에 합류하기로 했다.
먼저 무언가를 계속 하려는 분위기가 정말 좋았고, 짧았지만 지금까지 부캠에서의 추억을 돌이켜 보면 그 분위기가 내가 성장할 수 있는 원동력이 되었던 것 같다.
그리고 배울 점이 정말 많았다. AI에 관한 지식과 더불어 마인드와 다양한 정보 등 팀으로 함께 했을 때 좋은 요소들을 가지고 계셔서 다른 조원분들을 만나서 여러가지를 배우는 것도 물론 좋지만, 수료 전까지 조원 분들에게 배울 점들을 내 것으로 만들기만 해도 성공했다는 생각이 들 것 같아서 합류하기로 결정했다.
아쉽게도 모든 팀원분이 합류하지는 않을 것 같지만 다른 조로 가시는 분들과는 계속 연락을 하고, 새롭게 합류하시는 팀원분들과는 즐겁고 열정있는 분위기로 남은 3~4달 동안 열심히 하면 되지 않을까?라는 생각을 했다.
내일은 내가 논문을 발표하는 날인데 마지막으로 어떻게 발표를 할지 정리하고 중간에 실수하지 않도록 준비를 해야겠다.