ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Vertica Pulse 사전
    VERTICA/11.Pulse 2017. 1. 5. 18:01



    버티카 Pulse는 문장에 대해 감성분석을 지원한다 


    아래내용은 감성분석을 정밀하게 하기위한 여러가지의 사전 및 매핑정보에 대한 정보이다.

    현재까지(8.0.1) 버전으로는 영어와 스페인어만 지원한다. 

    한국은 시장도 매우작고 쓰느데도 별로없으니 안해줄듯 ㅠㅠ


    white_list_en

    항상 특성으로 표시되는 단어. 이 목록은 기본 펄스 특성 검색 프로세스를 나열.

    white_list 사용자 사전에 항상 점수가 매겨진 단어를 추가. 

    예를 들어, 이러한 단어들은 펄스에 의해 방해 받지 않는 명사, 구절, 어구 등을 포함할 수 있다.



    stop_words_en

    특성으로 표시되지 않는 단어. stop_words 사용자 사전에 스코어링 하지 않으려는 단어를 추가.

    이 사전을 사용하여 분석 대상이 아닌 특성을 필터링. 

    이 목록은 일반적으로 도메인에 대한 감상 점수의 정확도를 높이기 위해 수정.

    stop_words 사전은 명사와 복합 명사만을 포함할 수 있다. 

    펄스가 명사를 명사로 인식하지 않는다면, 그것은 무시한다.



    pos_words_en

    단어나 구가 될 수 있는 긍정적인 단어들. 

    이 목록의 단어들은 일반적으로 긍정적인 면을 지니고 있다.

    이 목록에는 숙어와 같은 정확한 구문을 추가할 수도 있다.

    Examples: adroit, resolve, strong, hit the nail on the head



    neg_words_en

    부정적인 의미를 가진 단어나 어구가 함축되어 있는 부정적인 단어들.

    이 목록의 단어는 일반적으로 부정적인 면을 지닐 가능성이 높다.

    이 목록에는 숙어와 같은 정확한 구문을 추가할 수도 있다.

    Examples: abhorrent, butcher, racist, wrath, flash in the pan.



    neutral_words_en

    중립적인 암시를 나타내는 단어들. 

    이 목록에 있는 단어들은 0의 감정을 가지고 있으며, 긍정적이거나 부정적인 것은 아니다.



    normalization_en

    용어(동의어)를 매핑 하는 데 사용되는 단어 쌍 목록. 

    이것을 사용하여 올바른 철자를 입력하고 올바른 맞춤법으로 매핑 할 수 있다. 

    이 목록은 자주 수정되며 기본적으로 비어 있다.


    base/synonym:

    'hp'/ 'hewlettpackard'

    'hp'/ 'Hewlett-Packard'

    'Obama'/ 'President Obama'

    'Obama'/ 'Barack Obama'




    댓글

Designed by Tistory.