Data.py make_db 후 나온 data의 w_uni 정체는?


#1

혹시 위의 명령을 내려서 나온 파일에서 w_uni 와 uni 피쳐가 나오는데 이게 어떤의미인지 알려주실 분 있을까요?? 하하…

uni를 어떻게 해서 w_uni가 나오는 것 같은데 감이 잘 안잡혀서…

사실 uni도 자세히 모르겠습니다… 혹시 이에대해 공부할만한 자료라도 소개해 주실 수 있을까요??..


#2

:whale2: 안녕하세요.

:whale2: 베이스라인 코드의 “parse_data” 함수를 혹시 보셨는지요?
해당 함수에서 uni 와 w_uni 가 계산되어지는 걸로 알고 있습니다.

:whale2: uni 는 product 를 구성하는 각 단어를 해쉬함수를 통해 하나의 정수(숫자)로 대응시킨 배열입니다.(단어 배열을 정수 배열로 바꾼것이라고 할 수 있을 것 같습니다).

:whale2: w_uni 는 uni 배열을 구성하는 각 단어의 빈도수(product 단어 내에서)를 나타내는 배열입니다. w_uni 를 만들 때, collection 모듈의 Counter 함수를 사용합니다. Counter 함수의 기능 중 하나가 주어진 배열(리스트)의 요소를 key로하고, 해당 요소의 빈도수를 value로 가지는 dictionary 를 되돌려줍니다.

:whale2: 저도 쓱싹 본거라, 코드 보시고 다시 한번 확인하심 좋을 것 같습니다 ㅎㅎ. 저도 제 뇌피셜이 맞았음 좋겠네요 ㅎㅎ