网络数据挖掘项目文档

项目地址

注意事项

本次项目使用的Python版本为3.6.5,推荐直接通过Anaconda进行安装,系统环境推荐使用基于*nix的系统,主要使用 到的Python包如下(粗体表示需要额外安装,之后可能还会有更新):

  1. pandas
  2. numpy
  3. pickle
  4. gensim 安装
  5. jieba 安装
  6. faiss 安装
  7. surprise 安装

项目结构

说明

        项目包名为ucas_dm,其中包含了prediction_algorithms包,preprocess包以及一个utils模块,prediction_algorithms包中 包含了多个可用的推荐算法,例如使用话题模型的基于内容推荐,协同过滤算法,以及矩阵分解算法等,utils模块中包含了用于对算法推荐性能进行评测的类。