modify:data_collection_complete
This commit is contained in:
parent
6afdec65df
commit
4babdcdb54
@ -64,7 +64,7 @@
|
||||
模型法采用前人预训练好的RoBERTa模型进行情感分析,情感评分规则同上。
|
||||
RoBERTa是由...等人在2019年提出的改进版BERT模型,适用于文本分类和情感分析,具有一定的鲁棒性(引用论文)。
|
||||
在此基础上,我们采用开源的Erlangshen-Roberta-330M模型,其已在中文领域经过调整,拥有3.3亿个参数,在京东、微博评论等数据集上表现良好(引用论文), 因此较为适合B站的弹幕情感分析。
|
||||
由于弹幕数据量大,计算量很大,我们对单个视频弹幕量超过500的作均匀抽样处理(500条),并且借助学校高性能运算中心提供的平台进行计算(虽然没什么用<划掉>),得到"弹幕情感评分RoBERTa"指标。
|
||||
由于弹幕数据量大,计算量很大,我们对单个视频弹幕量超过500的作均匀抽样处理(500条),并且借助学校高性能运算中心提供的平台进行计算~~虽然没什么用~~,得到"弹幕情感评分RoBERTa"指标。
|
||||
最终,我们采用加权平均的方法结合两种方法的结果,得到最终的弹幕情感评分(SentimentScore)。
|
||||
|
||||
### 标题文本的情感效价(PosTe)和情感唤醒度(ActTe)
|
||||
|
Loading…
x
Reference in New Issue
Block a user