modify:data_collection_complete

This commit is contained in:
Sheyiyuan 2025-04-02 19:01:51 +08:00
parent 6afdec65df
commit 4babdcdb54

View File

@ -64,7 +64,7 @@
模型法采用前人预训练好的RoBERTa模型进行情感分析情感评分规则同上。
RoBERTa是由...等人在2019年提出的改进版BERT模型适用于文本分类和情感分析具有一定的鲁棒性(引用论文)。
在此基础上我们采用开源的Erlangshen-Roberta-330M模型其已在中文领域经过调整拥有3.3亿个参数,在京东、微博评论等数据集上表现良好(引用论文) 因此较为适合B站的弹幕情感分析。
由于弹幕数据量大计算量很大我们对单个视频弹幕量超过500的作均匀抽样处理500条并且借助学校高性能运算中心提供的平台进行计算(虽然没什么用<划掉>,得到"弹幕情感评分RoBERTa"指标。
由于弹幕数据量大计算量很大我们对单个视频弹幕量超过500的作均匀抽样处理500条并且借助学校高性能运算中心提供的平台进行计算~~虽然没什么用~~,得到"弹幕情感评分RoBERTa"指标。
最终,我们采用加权平均的方法结合两种方法的结果,得到最终的弹幕情感评分(SentimentScore)。
### 标题文本的情感效价(PosTe)和情感唤醒度(ActTe)