> 文档中心 > 文本分类实战入门超详细教程

文本分类实战入门超详细教程

目录

  • 前言
  • 一、数据加载
    • 1.加载包
    • 2.读取数据
  • 二、文本处理
    • 1.去除无用字符
    • 2.文本分词
    • 3.去除停用词
    • 4.去除低频词
    • 5.划分训练集和测试集
  • 三、把文本转换成向量的形式
    • 1.把文本转换成tf-idf向量
    • 2.把文本转换成word2vec向量
    • 3.把文本转换成bert向量
  • 四、训练模型以及评估
    • 1.使用tf-idf向量训练
    • 2.使用word2vec向量训练
    • 3.使用Bert向量训练
  • 总结

前言

该实战任务是对豆瓣评分的预测。具体来说就是通过豆瓣评论预测该电影的评分。给定的输入为