Yuriy Vovanych (buriy) wrote,
Yuriy Vovanych
buriy

State of the Art в области Sentiment Analysis, Paragraph similarity and classification

Хотел посмотреть изменение State of the Art за последние годы в области Sentiment Analysis, Sentences similarity and classification.

Почитал кандидатскую работу Phong Lê (Institute for Logic, Language and Computation -- Universiteit van Amsterdam )
Под названием "Phong Lê Learning Vector Representations for Sentences - The Recursive Deep Learning Approach."
( отсюда: https://www.illc.uva.nl/Research/Publications/Dissertations/, DS-2016-05 )

Можно сказать, "state of the art" в области классификации предложений.
Вот результаты:


При этом, работа Mikolov 2014 года Paragraph Vectors (уже "классика") в этой табличке обозначена "PV" и даёт всего на пару процентов меньше!
Вот разбор этой работы: https://blog.acolyer.org/2016/06/01/distributed-representations-of-sentences-and-documents/ (если не открывается, используйте google cache: distributed-representations-of-sentences-and-documents)

Сравнимый результат показывают и работы 2012-2013 года (типа RNTN от Richard Socher )

А ещё в работе по Paragraph Vectors предложена задача по определению похожести коротких текстов и рассмотрены стандартные варианты решения.


Посмотрел я на неё, и понял, что не зря я использую на одном рабочем проекте Bag-of-words в похожих условиях. Не такая уж большая разница со State-of-the-art, а вот программировать и использовать намного проще.
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments